Anthropic выпустила Claude Opus 4.8 сегодня, 28 мая 2026 года — всего через 41 день после Opus 4.7. Новая флагманская модель приносит улучшения в программировании, агентных задачах, рассуждениях и интеллектуальной работе, и поставляется по той же цене, что и предшественница. В тот же день Anthropic объявила о привлечении $65 миллиардов в раунде финансирования серии H при оценке в $965 миллиардов, официально обойдя OpenAI и став самой дорогой AI-компанией в мире. Два исторических рубежа за один день.
Если вы прочитаете об Opus 4.8 только одно, прочитайте это: это «скромное, но ощутимое улучшение» (собственные слова Anthropic), которое значимо продвигает три вещи — агентное программирование, честность и согласованность — и представляет три новые функции, меняющие способ работы с Claude. Это не гигантский скачок, который обещает невыпущенный Claude Mythos, но он исправляет реальные проблемы Opus 4.7 и устанавливает новую планку в бенчмарках, важных для автономной работы AI.
Ключевой вывод
Claude Opus 4.8 (API ID: claude-opus-4-8) запущен 28 мая 2026 года с неизменными ценами ($5/млн входных, $25/млн выходных токенов). Он улучшает SWE-Bench Pro с 64,3% до 69,2%, лидирует в OSWorld-Verified с 83,4% и превосходит GPT-5.5 и Gemini 3.1 Pro в интеллектуальной работе (GDPval-AA 1890). Примерно в 4 раза менее склонен пропускать недостатки кода без замечаний. Вместе с ним запущены три новые функции: динамические рабочие процессы (параллельные субагенты в Claude Code), контроль усилий (claude.ai и Cowork) и системные записи в середине задачи в Messages API. Быстрый режим теперь в 3 раза дешевле.
Что нового в Claude Opus 4.8?
Главное улучшение — агентные способности: умение Claude самостоятельно работать над многошаговыми задачами с использованием инструментов. Ранние тестировщики сообщают о более остром суждении, лучшем использовании инструментов и повышенной надежности при длительных рабочих процессах. Модель задает правильные вопросы, улавливает собственные ошибки, возражает, когда план несостоятелен, и укрепляет уверенность в сложных исследованиях перед внесением серьезных изменений. Для тех, кто использует Claude как автономного агента, а не чат-бота, это самые важные улучшения.
Второе крупное улучшение — честность. Anthropic обучала все свои модели избегать заявлений, которые они не могут подтвердить, но у AI-моделей есть постоянная проблема: они спешат с выводами, уверенно заявляя о прогрессе, когда доказательств мало. Opus 4.8 с большей вероятностью отметит неопределенности в своей работе и с меньшей вероятностью сделает голословные утверждения. Оценки Anthropic показывают, что он примерно в четыре раза менее склонен, чем Opus 4.7, позволять недостаткам в написанном им коде проходить без замечаний. Это первая модель Claude, набравшая 0% по некритичному сообщению ошибочных результатов, с более чем десятикратным снижением самоуверенности.
Третье улучшение — согласованность. Команда согласования Anthropic пришла к выводу, что Opus 4.8 «достигает новых высот по нашим показателям просоциальных черт, таких как поддержка автономии пользователя и действия в наилучших интересах пользователя». Уровень несогласованного поведения — обмана или содействия злоупотреблению — существенно ниже, чем у Opus 4.7, и сравним с Claude Mythos Preview, наиболее согласованной моделью Anthropic. (Есть одна тревожная оговорка об осведомленности об оценке, которую мы рассматриваем в нашем глубоком разборе парадокса честности.)
Бенчмарки Claude Opus 4.8: Каково сравнение?
Anthropic опубликовала бенчмарки, сравнивающие Opus 4.8 с предшественником и конкурирующими моделями. Прирост постепенный, но последовательный, и Opus 4.8 лидирует в большинстве агентных и интеллектуальных тестов. Вот как выглядят цифры.
| Бенчмарк | Opus 4.8 | Opus 4.7 | Что измеряет |
|---|---|---|---|
| SWE-Bench Pro | 69,2% | 64,3% | Реальное агентное программирование |
| OSWorld-Verified | 83,4% | 82,3% | Агентное использование компьютера |
| Online-Mind2Web | 84% | ниже | Задачи браузерного агента |
| GDPval-AA | 1890 | — | Интеллектуальная работа (превосходит GPT-5.5 с 1769) |
| Рассуждение с инстр. | 57,9% | 54,7% | Междисциплинарное рассуждение |
| Terminal-Bench 2.1 | 74,6% | — | Терминальное программирование (GPT-5.5 выигрывает с 78,2%) |
Честный вывод: Opus 4.8 лидирует в большинстве агентных бенчмарков, бенчмарков использования компьютера и интеллектуальной работы, превосходя и GPT-5.5, и Gemini 3.1 Pro по GDPval-AA с большим отрывом. Но это не полная победа — GPT-5.5 все еще выигрывает Terminal-Bench 2.1 (программирование с интенсивным использованием терминала), набирая 78,2% против 74,6% у Opus 4.8. Если ваш рабочий процесс состоит из длительных терминальных сессий, GPT-5.5 остается конкурентоспособным. Для полного сравнения лицом к лицу смотрите наш трехсторонний разбор бенчмарков.
📬 Находите это полезным?
Одно практическое AI-озарение в неделю. Плюс бесплатный пакет промптов при подписке.
Подписаться бесплатно →Три новые функции, запущенные с Opus 4.8
Opus 4.8 запустился не один. Anthropic представила в тот же день три функции, которые меняют способ взаимодействия с Claude в разных продуктах.
Динамические рабочие процессы (Claude Code). Доступно в исследовательском превью для планов Max, Team и Enterprise, эта функция позволяет Claude планировать большую задачу, отправлять сотни параллельных субагентов, которые атакуют проблему с независимых сторон, развертывать состязательных агентов для опровержения выводов и итерировать, пока ответы не сойдутся — затем проверять результаты перед отчетом. Флагманский сценарий использования — миграции в масштабе кодовой базы на сотни тысяч строк кода, от старта до слияния, с использованием существующего набора тестов в качестве планки. Мы подробно разбираем это в нашем объяснении динамических рабочих процессов.
Контроль усилий (claude.ai и Cowork). Новый элемент управления рядом с выбором модели позволяет вам выбирать, сколько усилий Claude вкладывает в ответ. Более высокое усилие означает, что Claude думает чаще и глубже для лучших ответов; меньшее усилие означает более быстрые ответы, которые медленнее расходуют ваши лимиты запросов. Это доступно на всех планах. Наше руководство по контролю усилий объясняет, когда использовать каждую настройку.
Системные записи в середине задачи (Messages API). Messages API теперь принимает системные записи внутри массива сообщений, позволяя разработчикам обновлять инструкции Claude в середине задачи без нарушения кэша промптов или маршрутизации через пользовательский ход. Это важно для агентов, которым необходимо обновлять разрешения, бюджеты токенов или контекст окружения во время выполнения. Подробности в нашем разборе изменений API.
Цены и доступность
Claude Opus 4.8 доступен везде с сегодняшнего дня. Обычные цены не изменились по сравнению с Opus 4.7: $5 за миллион входных токенов и $25 за миллион выходных токенов. Быстрый режим (ускорение в 2,5 раза) стоит $10/млн входных и $50/млн выходных — но примечательно, что быстрый режим теперь в три раза дешевле, чем был для предыдущих моделей. Разработчики получают доступ к модели через Claude API, используя claude-opus-4-8, и псевдоним opus теперь автоматически направляет на нее. Она доступна на Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry и GitHub Copilot (с 15-кратным множителем премиум-запросов до запуска оплаты по факту использования 1 июня).
Чтобы получить максимум от Opus 4.8 независимо от способа доступа, хорошо структурированные промпты дают значительно лучшие результаты. Бесплатный Оптимизатор Промптов оттачивает ваши инструкции перед отправкой, а TresPrompt обеспечивает оптимизацию в один клик прямо в Claude, ChatGPT и Gemini.
📬 Хотите больше подобного?
Одно практическое AI-озарение в неделю. Плюс бесплатный пакет промптов при подписке.
Подписаться бесплатно →Что дальше: Claude Mythos
Anthropic использовала анонс Opus 4.8, чтобы намекнуть на будущее. Компания планирует выпустить новый класс моделей с еще более высоким интеллектом, чем Opus. В рамках Project Glasswing небольшое количество организаций уже используют Claude Mythos Preview для работы в сфере кибербезопасности. Модели такого уровня возможностей требуют более сильных киберзащитных мер перед общим выпуском, но Anthropic заявила, что быстро прогрессирует и ожидает предоставить модели класса Mythos всем клиентам «в ближайшие недели». Согласованность Opus 4.8 уже приближается к уровням Mythos Preview — намек на то, что грядет. Подробнее в нашем анализе временных рамок Mythos.
Часто задаваемые вопросы
Какой ID модели Claude Opus 4.8 API?
ID модели API — claude-opus-4-8. Псевдоним opus теперь автоматически направляет на нее, поэтому существующие интеграции, использующие псевдоним, обновятся. Для варианта с контекстом в 1 миллион токенов используйте claude-opus-4-8[1m]. Модель доступна в Claude API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry.
Сколько стоит Claude Opus 4.8?
Обычное использование стоит $5 за миллион входных токенов и $25 за миллион выходных токенов — без изменений по сравнению с Opus 4.7. Быстрый режим (ускорение в 2,5 раза) стоит $10/млн входных и $50/млн выходных, что в три раза дешевле, чем быстрый режим для предыдущих моделей. Цены одинаковы на всех облачных платформах.
Лучше ли Claude Opus 4.8, чем GPT-5.5?
Зависит от задачи. Opus 4.8 лидирует в агентном программировании (SWE-Bench Pro), использовании компьютера (OSWorld 83,4%), задачах браузера (Online-Mind2Web 84%) и интеллектуальной работе (GDPval-AA 1890 против 1769 у GPT-5.5). Но GPT-5.5 все еще выигрывает Terminal-Bench 2.1 (78,2% против 74,6%) для программирования с интенсивным использованием терминала. Для большинства агентных и интеллектуальных задач Opus 4.8 сильнее; для длительных терминальных сессий GPT-5.5 остается конкурентоспособным.
Стоит ли обновляться с Opus 4.7 до 4.8?
Для большинства пользователей да — та же цена с лучшими бенчмарками, значительно улучшенной честностью и исправлениями проблем Opus 4.7 с многословностью комментариев и вызовом инструментов. Обновление автоматическое, если вы используете псевдоним opus. Главная причина для колебаний: если ваши рабочие процессы сильно настроены на поведение 4.7, перепроверьте свои промпты, поскольку суждение и многословность модели изменились. Смотрите наше руководство по решению об обновлении.
Что такое динамические рабочие процессы в Claude Opus 4.8?
Динамические рабочие процессы — это функция Claude Code (исследовательское превью, Max/Team/Enterprise), которая позволяет Claude планировать большую задачу и запускать сотни параллельных субагентов в одной сессии. Субагенты атакуют проблемы с независимых сторон, состязательные агенты пытаются опровергнуть выводы, и система итерирует, пока ответы не сойдутся, прежде чем отчитаться. Основной сценарий использования — миграции в масштабе кодовой базы на сотни тысяч строк кода.
Раскрытие информации: Некоторые ссылки в этой статье являются партнерскими. Мы рекомендуем только инструменты, которые лично протестировали и используем регулярно. Смотрите нашу полную политику раскрытия информации.