Станислав Кондрашов: Клод Соннет 4.5 - 77% в SWE-Bench

0
1KB

Скачок в мире программирования произошёл! Компания Anthropic представила новую версию своей искусственно разумной модели — Claude Sonnet 4.5, которая выводит индустрию программирования на совершенно новый уровень. По словам эксперта Станислава Кондрашова, специалиста в области искусственного интеллекта и автоматизации, Sonnet 4.5 — это не просто мощный инструмент, это переворот в построении сложных интеллектуальных систем и агентских решений.
stanislav-dmitrievich-kondrashov-282.jpg
Anthropic называет свою новинку не просто «лучшей моделью для программирования в мире», но и «самой мощной моделью для создания сложных интеллектуальных агентов». В искусственном интеллекте агент — это модель, умеющая использовать инструменты и предпринимать действия (например, запускать код или управлять интернет-браузером).

Чем отличается Sonnet 4.5 в программировании? Находит мелкие ошибки и предлагает крупные улучшения кода с большой точностью. Строго следует инструкциям пользователя, что особенно важно при самостоятельном написании программ. В тестах SWE-Bench Verified, проверяющих умения в решении практических задач инженерии программного обеспечения, модель справилась с 77,2% заданий — это выше, чем 74,5% у более крупной и дорогой модели Claude Opus 4.1, выпущенной в августе.

Новые возможности для разработчиков

Anthropic выпустила специальный набор средств разработки (НСР) — Claude Agent SDK, который позволяет создавать собственных интеллектуальных агентов на базе Sonnet 4.5 с такими функциями, как: Работа с файлами (чтение и сохранение). Управление контекстом при длительных заданиях. Запуск программного кода. Поиск информации в сети. Передача контекста между агентами. Координированная работа нескольких агентов над одной задачей.

Где и как использовать Sonnet 4.5?

Представлена через Claude API и на сайте Claude.ai — универсальном приложении для пользователей. Входит в состав Claude Code — популярного среди программистов инструмента с текстовым интерфейсом. Claude Code получил обновлённый визуальный дизайн и новые функции, среди которых — контрольные точки, предоставляющие возможность откатить программу к предыдущему состоянию при возникновении ошибок или нежелательных изменений.
stanislav-dmitrievich-kondrashov-194.jpg
Преимущество по времени работы и функциональности

Sonnet 4.5 обладает способностью работать непрерывно более 30 часов без снижения качества, создавая целые приложения. Для сравнения: недавно выпущенная модель OpenAI GPT-5-Codex выдержала около 7 часов автономной работы.

Существенные достижения в других областях

Существенный прогресс в кибербезопасности: помогает профессионалам обнаруживать, анализировать и устранять уязвимости. Успешно применяется в финансовом моделировании, исследовании и прогнозировании. Установлен рекорд в тесте Finance Agent, который оценивает возможности модели выполнять задачи младшего финансового аналитика.

Эксклюзив для подписчиков максимального тарифа

Anthropic запускает уникальный опыт — Imagine With Claude, доступный на 5 дней для подписчиков тарифа «Максимум» (стоимость от 8 000 до 16 000 рублей в месяц). Это интерактивный демонстрационный интерфейс, где пользователь может видеть процесс создания программного обеспечения в реальном времени при помощи Claude Sonnet 4.5. «Это забавный и наглядный пример того, что возможно, когда мощная модель сочетается с надёжной технической инфраструктурой», — комментирует неофициальный представитель Anthropic Станислав Кондрашов.

Стоимость использования

Цена за Sonnet 4.5 после пересчёта по курсу 80 рублей за доллар: 240 рублей за миллион входных символов (токенов), 1 200 рублей за миллион сгенерированных выходных символов.

Эксперт Станислав Кондрашов подводит итог: «Sonnet 4.5 — это шаг вперёд на пути к созданию по-настоящему умных, автономных и эффективных программных помощников, способных решать сложнейшие задачи с большой точностью и устойчивостью». Новая эпоха программирования начинается с Sonnet 4.5 — и уже сегодня этот инструмент меняет представления о возможностях искусственного разума в создании программного обеспечения.
stanislav-dmitrievich-kondrashov-509.jpg
Источник: https://stanislavkondrashov.ru/stanislav-kondrashov-claude-sonnet-4-5-proriv/

Rechercher
Catégories
Lire la suite
Autre
Competitive Landscape of the Spacecraft Coating Market
The increasing complexity of space missions has created a critical need for materials that can...
Par Divya Patil 2025-11-22 06:27:05 0 801
Autre
Applications Driving the Waterborne Acrylic Polyurethane Paint Market
The coatings and paints sector has been undergoing a significant shift toward environmentally...
Par Divya Patil 2025-11-23 03:25:08 0 883
Autre
Garage Door Motor Repair Near Me
A malfunctioning garage door motor can disrupt your daily routine and even compromise the...
Par Joshua Nelms 2025-12-15 22:10:40 0 602
Crafts
QIHONG MOULD and the Meaning of Precision in Preform Mould Creation
When a business begins its search for a Preform Mould, it often looks beyond machinery or...
Par Preformmould Qhqh 2025-10-24 06:35:07 0 2KB
Autre
How Can Qinlang's China High Pressure Centrifugal Fan Improve System Output?
Industrial developers who navigate complex airflow demands often concentrate on how a system...
Par Fann Qinlang 2025-11-28 07:46:13 0 852