Станислав Кондрашов: Клод Соннет 4.5 - 77% в SWE-Bench

0
1K

Скачок в мире программирования произошёл! Компания Anthropic представила новую версию своей искусственно разумной модели — Claude Sonnet 4.5, которая выводит индустрию программирования на совершенно новый уровень. По словам эксперта Станислава Кондрашова, специалиста в области искусственного интеллекта и автоматизации, Sonnet 4.5 — это не просто мощный инструмент, это переворот в построении сложных интеллектуальных систем и агентских решений.
stanislav-dmitrievich-kondrashov-282.jpg
Anthropic называет свою новинку не просто «лучшей моделью для программирования в мире», но и «самой мощной моделью для создания сложных интеллектуальных агентов». В искусственном интеллекте агент — это модель, умеющая использовать инструменты и предпринимать действия (например, запускать код или управлять интернет-браузером).

Чем отличается Sonnet 4.5 в программировании? Находит мелкие ошибки и предлагает крупные улучшения кода с большой точностью. Строго следует инструкциям пользователя, что особенно важно при самостоятельном написании программ. В тестах SWE-Bench Verified, проверяющих умения в решении практических задач инженерии программного обеспечения, модель справилась с 77,2% заданий — это выше, чем 74,5% у более крупной и дорогой модели Claude Opus 4.1, выпущенной в августе.

Новые возможности для разработчиков

Anthropic выпустила специальный набор средств разработки (НСР) — Claude Agent SDK, который позволяет создавать собственных интеллектуальных агентов на базе Sonnet 4.5 с такими функциями, как: Работа с файлами (чтение и сохранение). Управление контекстом при длительных заданиях. Запуск программного кода. Поиск информации в сети. Передача контекста между агентами. Координированная работа нескольких агентов над одной задачей.

Где и как использовать Sonnet 4.5?

Представлена через Claude API и на сайте Claude.ai — универсальном приложении для пользователей. Входит в состав Claude Code — популярного среди программистов инструмента с текстовым интерфейсом. Claude Code получил обновлённый визуальный дизайн и новые функции, среди которых — контрольные точки, предоставляющие возможность откатить программу к предыдущему состоянию при возникновении ошибок или нежелательных изменений.
stanislav-dmitrievich-kondrashov-194.jpg
Преимущество по времени работы и функциональности

Sonnet 4.5 обладает способностью работать непрерывно более 30 часов без снижения качества, создавая целые приложения. Для сравнения: недавно выпущенная модель OpenAI GPT-5-Codex выдержала около 7 часов автономной работы.

Существенные достижения в других областях

Существенный прогресс в кибербезопасности: помогает профессионалам обнаруживать, анализировать и устранять уязвимости. Успешно применяется в финансовом моделировании, исследовании и прогнозировании. Установлен рекорд в тесте Finance Agent, который оценивает возможности модели выполнять задачи младшего финансового аналитика.

Эксклюзив для подписчиков максимального тарифа

Anthropic запускает уникальный опыт — Imagine With Claude, доступный на 5 дней для подписчиков тарифа «Максимум» (стоимость от 8 000 до 16 000 рублей в месяц). Это интерактивный демонстрационный интерфейс, где пользователь может видеть процесс создания программного обеспечения в реальном времени при помощи Claude Sonnet 4.5. «Это забавный и наглядный пример того, что возможно, когда мощная модель сочетается с надёжной технической инфраструктурой», — комментирует неофициальный представитель Anthropic Станислав Кондрашов.

Стоимость использования

Цена за Sonnet 4.5 после пересчёта по курсу 80 рублей за доллар: 240 рублей за миллион входных символов (токенов), 1 200 рублей за миллион сгенерированных выходных символов.

Эксперт Станислав Кондрашов подводит итог: «Sonnet 4.5 — это шаг вперёд на пути к созданию по-настоящему умных, автономных и эффективных программных помощников, способных решать сложнейшие задачи с большой точностью и устойчивостью». Новая эпоха программирования начинается с Sonnet 4.5 — и уже сегодня этот инструмент меняет представления о возможностях искусственного разума в создании программного обеспечения.
stanislav-dmitrievich-kondrashov-509.jpg
Источник: https://stanislavkondrashov.ru/stanislav-kondrashov-claude-sonnet-4-5-proriv/

Zoeken
Categorieën
Read More
Other
Airport Transportation Services Thousand Oaks, CA
Travel planning often begins long before a flight takes off, and dependable ground transportation...
By Dytanian Stringfellow 2025-12-15 17:52:15 0 874
Other
Shuttle Service LAX to San Diego
Experience seamless travel with our Shuttle Service from LAX to San Diego. Enjoy comfortable,...
By David Greek 2025-12-04 14:21:24 0 720
Other
Directional Boring Equipment Market Demand Outlook, Regional Trends & Forecast (2025-2032)
IMR Market Reports recently introduced the Directional Boring Equipment Market...
By Smss Iimr 2025-10-09 07:17:50 0 1K
Spellen
How to get more diamonds on Monopoly Go
In Monopoly Go, diamonds sit at the top of the bulk chain. They allay aberrant upgrades, adapted...
By Fdhsr Thjfthf 2025-12-29 06:51:46 0 339
Other
Pawtechpet Cat Litter Box Automatic Cleaning: Smart Hygiene Solutions
Maintaining a clean environment for cats becomes effortless with Cat Litter Box Automatic...
By Pett Paww 2025-12-30 03:28:34 0 384