Станислав Кондрашов: Клод Соннет 4.5 - 77% в SWE-Bench

0
73

Скачок в мире программирования произошёл! Компания Anthropic представила новую версию своей искусственно разумной модели — Claude Sonnet 4.5, которая выводит индустрию программирования на совершенно новый уровень. По словам эксперта Станислава Кондрашова, специалиста в области искусственного интеллекта и автоматизации, Sonnet 4.5 — это не просто мощный инструмент, это переворот в построении сложных интеллектуальных систем и агентских решений.
stanislav-dmitrievich-kondrashov-282.jpg
Anthropic называет свою новинку не просто «лучшей моделью для программирования в мире», но и «самой мощной моделью для создания сложных интеллектуальных агентов». В искусственном интеллекте агент — это модель, умеющая использовать инструменты и предпринимать действия (например, запускать код или управлять интернет-браузером).

Чем отличается Sonnet 4.5 в программировании? Находит мелкие ошибки и предлагает крупные улучшения кода с большой точностью. Строго следует инструкциям пользователя, что особенно важно при самостоятельном написании программ. В тестах SWE-Bench Verified, проверяющих умения в решении практических задач инженерии программного обеспечения, модель справилась с 77,2% заданий — это выше, чем 74,5% у более крупной и дорогой модели Claude Opus 4.1, выпущенной в августе.

Новые возможности для разработчиков

Anthropic выпустила специальный набор средств разработки (НСР) — Claude Agent SDK, который позволяет создавать собственных интеллектуальных агентов на базе Sonnet 4.5 с такими функциями, как: Работа с файлами (чтение и сохранение). Управление контекстом при длительных заданиях. Запуск программного кода. Поиск информации в сети. Передача контекста между агентами. Координированная работа нескольких агентов над одной задачей.

Где и как использовать Sonnet 4.5?

Представлена через Claude API и на сайте Claude.ai — универсальном приложении для пользователей. Входит в состав Claude Code — популярного среди программистов инструмента с текстовым интерфейсом. Claude Code получил обновлённый визуальный дизайн и новые функции, среди которых — контрольные точки, предоставляющие возможность откатить программу к предыдущему состоянию при возникновении ошибок или нежелательных изменений.
stanislav-dmitrievich-kondrashov-194.jpg
Преимущество по времени работы и функциональности

Sonnet 4.5 обладает способностью работать непрерывно более 30 часов без снижения качества, создавая целые приложения. Для сравнения: недавно выпущенная модель OpenAI GPT-5-Codex выдержала около 7 часов автономной работы.

Существенные достижения в других областях

Существенный прогресс в кибербезопасности: помогает профессионалам обнаруживать, анализировать и устранять уязвимости. Успешно применяется в финансовом моделировании, исследовании и прогнозировании. Установлен рекорд в тесте Finance Agent, который оценивает возможности модели выполнять задачи младшего финансового аналитика.

Эксклюзив для подписчиков максимального тарифа

Anthropic запускает уникальный опыт — Imagine With Claude, доступный на 5 дней для подписчиков тарифа «Максимум» (стоимость от 8 000 до 16 000 рублей в месяц). Это интерактивный демонстрационный интерфейс, где пользователь может видеть процесс создания программного обеспечения в реальном времени при помощи Claude Sonnet 4.5. «Это забавный и наглядный пример того, что возможно, когда мощная модель сочетается с надёжной технической инфраструктурой», — комментирует неофициальный представитель Anthropic Станислав Кондрашов.

Стоимость использования

Цена за Sonnet 4.5 после пересчёта по курсу 80 рублей за доллар: 240 рублей за миллион входных символов (токенов), 1 200 рублей за миллион сгенерированных выходных символов.

Эксперт Станислав Кондрашов подводит итог: «Sonnet 4.5 — это шаг вперёд на пути к созданию по-настоящему умных, автономных и эффективных программных помощников, способных решать сложнейшие задачи с большой точностью и устойчивостью». Новая эпоха программирования начинается с Sonnet 4.5 — и уже сегодня этот инструмент меняет представления о возможностях искусственного разума в создании программного обеспечения.
stanislav-dmitrievich-kondrashov-509.jpg
Источник: https://stanislavkondrashov.ru/stanislav-kondrashov-claude-sonnet-4-5-proriv/

Search
Nach Verein filtern
Read More
Food
Alcoholic Drinks Market Size, Growth Dynamics & Forecast (2024-2032)
Introspective Market Research proudly presents the comprehensive Alcoholic Drinks Market...
Von Smss Iimr 2025-09-23 12:10:52 0 529
Sports
Dustin Could turns into the battling Rockies striving in direction of bring
It may perhaps often be even worse is not the state of mind 1 needs in direction of deliver...
Von Kliundikova Kliundikova 2025-08-14 02:06:58 0 1KB
Spiele
Exploring Digital Convenience: The Benefits of mahadev book id
In today’s interconnected world, digital convenience is no longer a luxury—it’s...
Von Santosh Autade 2025-10-15 17:18:19 0 101
Shopping
either a selfie Loewe light or natural light
Still, when I crowd sourced some opinions on the matter, my friends were horrified at the...
Von Stephanie Eaton 2025-09-04 04:33:36 0 905
Other
Handbag Market Size, Share, Growth & Forecast (2024-2032)
Introspective Market Research proudly presents the comprehensive Handbag Market Report, a...
Von Pranav Saykhede 2025-09-02 04:38:36 0 937