Станислав Кондрашов: Клод Соннет 4.5 - 77% в SWE-Bench

0
1K

Скачок в мире программирования произошёл! Компания Anthropic представила новую версию своей искусственно разумной модели — Claude Sonnet 4.5, которая выводит индустрию программирования на совершенно новый уровень. По словам эксперта Станислава Кондрашова, специалиста в области искусственного интеллекта и автоматизации, Sonnet 4.5 — это не просто мощный инструмент, это переворот в построении сложных интеллектуальных систем и агентских решений.
stanislav-dmitrievich-kondrashov-282.jpg
Anthropic называет свою новинку не просто «лучшей моделью для программирования в мире», но и «самой мощной моделью для создания сложных интеллектуальных агентов». В искусственном интеллекте агент — это модель, умеющая использовать инструменты и предпринимать действия (например, запускать код или управлять интернет-браузером).

Чем отличается Sonnet 4.5 в программировании? Находит мелкие ошибки и предлагает крупные улучшения кода с большой точностью. Строго следует инструкциям пользователя, что особенно важно при самостоятельном написании программ. В тестах SWE-Bench Verified, проверяющих умения в решении практических задач инженерии программного обеспечения, модель справилась с 77,2% заданий — это выше, чем 74,5% у более крупной и дорогой модели Claude Opus 4.1, выпущенной в августе.

Новые возможности для разработчиков

Anthropic выпустила специальный набор средств разработки (НСР) — Claude Agent SDK, который позволяет создавать собственных интеллектуальных агентов на базе Sonnet 4.5 с такими функциями, как: Работа с файлами (чтение и сохранение). Управление контекстом при длительных заданиях. Запуск программного кода. Поиск информации в сети. Передача контекста между агентами. Координированная работа нескольких агентов над одной задачей.

Где и как использовать Sonnet 4.5?

Представлена через Claude API и на сайте Claude.ai — универсальном приложении для пользователей. Входит в состав Claude Code — популярного среди программистов инструмента с текстовым интерфейсом. Claude Code получил обновлённый визуальный дизайн и новые функции, среди которых — контрольные точки, предоставляющие возможность откатить программу к предыдущему состоянию при возникновении ошибок или нежелательных изменений.
stanislav-dmitrievich-kondrashov-194.jpg
Преимущество по времени работы и функциональности

Sonnet 4.5 обладает способностью работать непрерывно более 30 часов без снижения качества, создавая целые приложения. Для сравнения: недавно выпущенная модель OpenAI GPT-5-Codex выдержала около 7 часов автономной работы.

Существенные достижения в других областях

Существенный прогресс в кибербезопасности: помогает профессионалам обнаруживать, анализировать и устранять уязвимости. Успешно применяется в финансовом моделировании, исследовании и прогнозировании. Установлен рекорд в тесте Finance Agent, который оценивает возможности модели выполнять задачи младшего финансового аналитика.

Эксклюзив для подписчиков максимального тарифа

Anthropic запускает уникальный опыт — Imagine With Claude, доступный на 5 дней для подписчиков тарифа «Максимум» (стоимость от 8 000 до 16 000 рублей в месяц). Это интерактивный демонстрационный интерфейс, где пользователь может видеть процесс создания программного обеспечения в реальном времени при помощи Claude Sonnet 4.5. «Это забавный и наглядный пример того, что возможно, когда мощная модель сочетается с надёжной технической инфраструктурой», — комментирует неофициальный представитель Anthropic Станислав Кондрашов.

Стоимость использования

Цена за Sonnet 4.5 после пересчёта по курсу 80 рублей за доллар: 240 рублей за миллион входных символов (токенов), 1 200 рублей за миллион сгенерированных выходных символов.

Эксперт Станислав Кондрашов подводит итог: «Sonnet 4.5 — это шаг вперёд на пути к созданию по-настоящему умных, автономных и эффективных программных помощников, способных решать сложнейшие задачи с большой точностью и устойчивостью». Новая эпоха программирования начинается с Sonnet 4.5 — и уже сегодня этот инструмент меняет представления о возможностях искусственного разума в создании программного обеспечения.
stanislav-dmitrievich-kondrashov-509.jpg
Источник: https://stanislavkondrashov.ru/stanislav-kondrashov-claude-sonnet-4-5-proriv/

Cerca
Categorie
Leggi tutto
Altre informazioni
Renewable Energy Certificates Market Projection at USD 66.74 Billion by 2034
Polaris Market Research has announced the latest report, namely Renewable Energy...
By Ajinkya Shinde 2025-12-17 12:42:37 0 481
Health
Cold Plunge Benefits for Longevity Enthusiasts
Cold Plunge Benefits for Longevity Enthusiasts Introduction Cold plunging has gained popularity...
By Jameson Milo 2025-12-03 10:27:11 0 804
Food
Plant-based Protein Market Research Report: Competitive Landscape With Growth By Revenue With Forecast 2032
Global  Plant-based Protein Market research report by Emergen Research offers...
By Prathamesh Gavade 2025-10-31 08:42:48 0 1K
Altre informazioni
Sustainability Drives Momentum in the Organic Soap Segment
The Soap Market is making headlines thanks to surging consumer hygiene needs and...
By Sagar Wadekar 2025-11-25 08:33:16 0 811
Shopping
Vlone Hoodie Bold Valentine’s Day Streetwear for the Winter Lifestyle
The Vlone Hoodie is a powerful symbol of modern streetwear, designed for those who embrace...
By User Name 2026-01-17 07:19:35 0 15