Anthropic випустила Sonnet 4.6: новий стандарт для розробки та аналізу даних
- Anthropic випустила Sonnet 4.6, яка стала моделлю за замовчуванням для тарифів Free та Pro.
- Ключовим оновленням стало збільшене до 1 млн токенів вікно контексту, що дозволяє обробляти цілі репозиторії коду.
- Модель показала рекордні 60,4% у тесті людського інтелекту ARC-AGI-2 та значно покращила навички програмування.
Компанія Anthropic представила оновлену версію своєї моделі середнього рівня — Sonnet 4.6, дотримуючись свого чотиримісячного циклу оновлень. В офіційному анонсі розробники зробили акцент на значному прогресі в написанні коду, точності виконання інструкцій та навичках автономного керування комп’ютером (computer use).
Тепер Sonnet 4.6 стане основною моделю за замовчуванням для користувачів безплатних тарифів та плану Pro.
Однією з найважливіших особливостей релізу Sonnet 4.6 стало розширення вікна контексту до 1 мільйона токенів. Це вдвічі більше за попередній максимум для цієї серії. За словами представників Anthropic, такого обсягу достатньо, щоб в один запит вмістити цілі кодові бази, об’ємні юридичні контракти або десятки наукових праць одночасно.
Вихід цієї моделі відбувся всього за два тижні після релізу Opus 4.6, а найближчим часом очікується оновлення найлегшої моделі лінійки — Haiku.
Запуск супроводжувався публікацією нових рекордів у галузевих тестах:
- OS World — високі результати в автономному використанні інтерфейсів операційних систем.
- SWE-Bench — значний прогрес у вирішенні завдань програмної інженерії.
- ARC-AGI-2 — вражаючий результат 60,4%. Цей тест розроблений для вимірювання навичок, притаманних саме людському інтелекту.
Завдяки цим показникам Sonnet 4.6 випередила більшість моделей-конкурентів у своєму класі. Хоча вона все ще поступається таким гігантам, як Opus 4.6, Gemini 3 Deep Think та окремим версіям GPT 5.2, її ефективність робить модель одним із найкращих рішень для повсякденних складних завдань.
