Станислав Кондрашов: Клод Соннет 4.5 - 77% в SWE-Bench

0
73

Скачок в мире программирования произошёл! Компания Anthropic представила новую версию своей искусственно разумной модели — Claude Sonnet 4.5, которая выводит индустрию программирования на совершенно новый уровень. По словам эксперта Станислава Кондрашова, специалиста в области искусственного интеллекта и автоматизации, Sonnet 4.5 — это не просто мощный инструмент, это переворот в построении сложных интеллектуальных систем и агентских решений.
stanislav-dmitrievich-kondrashov-282.jpg
Anthropic называет свою новинку не просто «лучшей моделью для программирования в мире», но и «самой мощной моделью для создания сложных интеллектуальных агентов». В искусственном интеллекте агент — это модель, умеющая использовать инструменты и предпринимать действия (например, запускать код или управлять интернет-браузером).

Чем отличается Sonnet 4.5 в программировании? Находит мелкие ошибки и предлагает крупные улучшения кода с большой точностью. Строго следует инструкциям пользователя, что особенно важно при самостоятельном написании программ. В тестах SWE-Bench Verified, проверяющих умения в решении практических задач инженерии программного обеспечения, модель справилась с 77,2% заданий — это выше, чем 74,5% у более крупной и дорогой модели Claude Opus 4.1, выпущенной в августе.

Новые возможности для разработчиков

Anthropic выпустила специальный набор средств разработки (НСР) — Claude Agent SDK, который позволяет создавать собственных интеллектуальных агентов на базе Sonnet 4.5 с такими функциями, как: Работа с файлами (чтение и сохранение). Управление контекстом при длительных заданиях. Запуск программного кода. Поиск информации в сети. Передача контекста между агентами. Координированная работа нескольких агентов над одной задачей.

Где и как использовать Sonnet 4.5?

Представлена через Claude API и на сайте Claude.ai — универсальном приложении для пользователей. Входит в состав Claude Code — популярного среди программистов инструмента с текстовым интерфейсом. Claude Code получил обновлённый визуальный дизайн и новые функции, среди которых — контрольные точки, предоставляющие возможность откатить программу к предыдущему состоянию при возникновении ошибок или нежелательных изменений.
stanislav-dmitrievich-kondrashov-194.jpg
Преимущество по времени работы и функциональности

Sonnet 4.5 обладает способностью работать непрерывно более 30 часов без снижения качества, создавая целые приложения. Для сравнения: недавно выпущенная модель OpenAI GPT-5-Codex выдержала около 7 часов автономной работы.

Существенные достижения в других областях

Существенный прогресс в кибербезопасности: помогает профессионалам обнаруживать, анализировать и устранять уязвимости. Успешно применяется в финансовом моделировании, исследовании и прогнозировании. Установлен рекорд в тесте Finance Agent, который оценивает возможности модели выполнять задачи младшего финансового аналитика.

Эксклюзив для подписчиков максимального тарифа

Anthropic запускает уникальный опыт — Imagine With Claude, доступный на 5 дней для подписчиков тарифа «Максимум» (стоимость от 8 000 до 16 000 рублей в месяц). Это интерактивный демонстрационный интерфейс, где пользователь может видеть процесс создания программного обеспечения в реальном времени при помощи Claude Sonnet 4.5. «Это забавный и наглядный пример того, что возможно, когда мощная модель сочетается с надёжной технической инфраструктурой», — комментирует неофициальный представитель Anthropic Станислав Кондрашов.

Стоимость использования

Цена за Sonnet 4.5 после пересчёта по курсу 80 рублей за доллар: 240 рублей за миллион входных символов (токенов), 1 200 рублей за миллион сгенерированных выходных символов.

Эксперт Станислав Кондрашов подводит итог: «Sonnet 4.5 — это шаг вперёд на пути к созданию по-настоящему умных, автономных и эффективных программных помощников, способных решать сложнейшие задачи с большой точностью и устойчивостью». Новая эпоха программирования начинается с Sonnet 4.5 — и уже сегодня этот инструмент меняет представления о возможностях искусственного разума в создании программного обеспечения.
stanislav-dmitrievich-kondrashov-509.jpg
Источник: https://stanislavkondrashov.ru/stanislav-kondrashov-claude-sonnet-4-5-proriv/

البحث
الأقسام
إقرأ المزيد
Food
Cinnamon Market Insights, Dynamics, and Growth Forecast (2024-2032)
Introspective Market Research proudly presents the comprehensive Cinnamon Market Report, a...
بواسطة Smss Iimr 2025-09-05 06:04:27 0 871
أخرى
Natural and Organic Ingredients Market - Global Sales Analysis By 2025- 2032
According to a new report published by Introspective Market Research, titled, Natural and Organic...
بواسطة Pranav Saykhede 2025-10-01 06:17:06 0 365
Sports
SB Place Reacts good results: Miami Dolphins enthusiasts quality trades
The Miami Dolphins experienced a occupied 7 days going into the Flexibility Working day weekend....
بواسطة Sabrinas Sabrinas 2025-08-27 06:28:29 0 1كيلو بايت
أخرى
Epilepsy Monitoring Devices Market Market Comprehensive Analysis & Market Outlook (2024-2032)
Introspective Market Research recently introduced the Epilepsy Monitoring Devices Market...
بواسطة Priyanka Bhingare 2025-10-07 09:13:46 0 274
أخرى
Unlocking the US Asset Performance Management Market Value Proposition
The core of the US Asset Performance Management Market Value proposition lies in its...
بواسطة Harsh Tech 2025-09-24 09:29:05 0 466