Google запустила Gemini 3.5 Flash на I/O 2026 с амбициозными заявлениями: она превосходит Gemini 3.1 Pro по бенчмаркам в программировании, агентных задачах и мультимодальности, а также генерирует токены в 4 раза быстрее, чем другие передовые модели. Между тем, Claude Opus 4.7 удерживает рекорд SWE-bench по программированию на уровне 87,6 % и лидирует по мнению сообщества в качестве текста и следовании инструкциям. GPT-5.4 находится посередине — с сильными всесторонними показателями и самым широким набором функций.
С выходом Gemini 3.5 Pro в следующем месяце и ожидаемым появлением GPT-5.5 до июня, рынок моделей стал самым конкурентным за всё время. Вот как выглядит ситуация на 20 мая 2026 года — на следующий день после Google I/O.
Ключевой вывод
Gemini 3.5 Flash — лидер по скорости. Claude Opus 4.7 — лидер по качеству. GPT-5.4 — универсальный вариант. Ни одна модель не выигрывает по всем категориям. Выбор зависит от ваших основных задач — и всё чаще серьёзные пользователи подписаны на 2–3 модели и используют каждую под разные сценарии.
Полное сравнение
| Параметр | Gemini 3.5 Flash | Claude Opus 4.7 | GPT-5.4 |
|---|---|---|---|
| Скорость (токенов/сек) | Заявлено в 4 раза быстрее конкурентов | Средняя | Быстрая с режимом размышления |
| SWE-bench (программирование) | Заявлено превосходство над 3.1 Pro (ожидается проверка) | 87,6 % (рекордсмен) | 74,9 % |
| Качество текста | Хорошее (улучшено по сравнению с 3.1) | Лучшее (по мнению сообщества) | Очень хорошее |
| Следование инструкциям | Хорошее | Лучшее (буквальное соблюдение в 4.7) | Хорошее |
| Размер контекстного окна | До 2 млн токенов | 200 тыс. токенов | 128 тыс. токенов |
| Мультимодальность | Текст, изображения, аудио, видео (нативно) | Текст, изображения | Текст, изображения, аудио |
| Генерация видео | Да (Gemini Omni) | Нет | Нет (отдельная Sora) |
| Агентные возможности | Gemini Spark (круглосуточно, для пользователей) | Claude Code (программирование), MCP | Codex (асинхронные пакеты) |
| Экосистема | Gmail, Calendar, Docs, Search, YouTube | Claude.ai, Code, Projects | ChatGPT, Codex, DALL-E, веб |
| Цена (тариф $20/мес) | Plus — 3.5 Flash + Omni + Daily Brief | Pro — Opus 4.7 + Projects | Plus — GPT-5.4 + веб + изображения + код |
| Приватность | Самая требовательная к данным (требует доступа к экосистеме) | Самая консервативная | Средняя |
Что означают заявления Google о скорости на практике
Google заявляет, что Gemini 3.5 Flash генерирует токены в 4 раза быстрее, чем другие передовые модели. Если это подтвердится независимыми тестами, Flash станет очевидным выбором для приложений, чувствительных к задержкам — чат-боты, подсказки в реальном времени при программировании и любые сценарии, где ожидание 5 секунд нарушает рабочий процесс.
Но скорость и качество — это разные оси. Модель, которая отвечает за 1 секунду с качеством 80 %, ведёт себя иначе, чем модель, которая отвечает за 4 секунды с качеством 95 %. Для быстрых вопросов и простых задач выигрывает скорость. Для сложного анализа, генерации кода и качественного текста более медленная, но более способная модель даёт лучший результат даже с учётом ожидания.
Практический тест: попробуйте Gemini 3.5 Flash на своих реальных задачах уже сегодня (она доступна для платных подписчиков). Если улучшение скорости заметно сказывается на вашей работе, компромисс по качеству может быть оправдан. Если вы редактируете ответы Gemini чаще, чем Claude, скорость не компенсирует разницу.
---📬 Полезно? Мы обновляем сравнения моделей после каждого крупного запуска. Получите в почту →
---В чём каждая модель лидирует
Gemini лидирует в: скорости, размере контекстного окна (2 млн токенов), мультимодальной обработке (нативное видео), интеграции с экосистемой (Google Workspace) и доступности агентов (Spark не требует настройки).
Claude лидирует в: качестве кода (87,6 % на SWE-bench), нюансах текста, точности следования инструкциям (4.7 крайне буквально соблюдает инструкции), приватности данных и инструментах для разработчиков (Claude Code — лучший агент для программирования).
GPT лидирует в: широте функций (веб-поиск, генерация изображений, интерпретатор кода в одном интерфейсе), пропускной способности за $20 в месяц, сторонних интеграциях (самая большая экосистема плагинов) и удобстве для потребителей.
Какую модель выбрать?
Выбирайте Gemini, если: вы жив<|eos|>