Google запустила Gemini 3.1 с контекстным окном в 2 миллиона токенов. Все заголовки преподносили это как прорыв. И для определённых задач — обработки целых кодовых баз, анализа книг, поиска по часам видео — это действительно так. Но маркетинг создал опасное заблуждение: чем больше контекста, тем лучше результат.
Это не так. В большинстве реальных задач качество контекста важнее его объёма. Чётко структурированный промпт на 5 000 токенов с нужной информацией даёт лучший результат, чем свалка из 500 000 токенов, где всё лишь косвенно связано с задачей.
Главный вывод
Контекстные окна похожи на место для хранения: большой гараж не сделает вас лучшим водителем. Важно то, что вы помещаете в контекст, а не то, сколько места доступно. Инжиниринг контекста (выбор ПРАВИЛЬНОГО контекста) — это навык, который даёт лучшие результаты, а не размер контекстного окна.
Почему больше контекста не означает лучший результат?
Проблема «потерянного в середине». Исследования неизменно показывают, что LLM хуже обрабатывают информацию, которая находится в середине длинного контекста. Данные в начале и в конце воспринимаются точнее, чем информация, спрятанная на позиции 100 000. Это не баг, а фундаментальное свойство механизмов внимания в трансформерах. Загрузка 2 млн токенов контекста означает, что значительная часть этой информации фактически невидима для модели.
Соотношение сигнал/шум. Когда вы загружаете целую кодовую базу в окно на 2 млн токенов, большая часть кода не имеет отношения к вашему конкретному вопросу. Модель должна сама понять, какие файлы важны, и не всегда делает это правильно. Целенаправленная загрузка 3–5 нужных файлов даёт более точные ответы, чем полный дамп репозитория.
Стоимость токенов растёт вместе с контекстом. Обработка 2 млн токенов обходится значительно дороже, чем обработка 5 тыс. Для рутинных задач — написания писем, составления саммари, ответов на вопросы — вы платите в 400 раз больше за минимальное (или нулевое) улучшение качества.
| Подход к контексту | Качество результата | Стоимость | Скорость |
|---|---|---|---|
| 5K токенов сфокусированного контекста | Отлично — модель сосредоточена именно на нужном | Минимальная | Быстрая |
| 50K токенов релевантных документов | Очень хорошо — дополнительный контекст помогает при сложных задачах | Средняя | Хорошая |
| 500K+ токенов — полный дамп | Переменное — зависит от задачи и эффекта «потерянного в середине» | Высокая | Медленная |
| 2M токенов — максимальное заполнение | Полезно только для конкретных задач (поиск по кодовой базе, анализ книг) | Очень высокая | Очень медленная |
📬 Получаете пользу от этой статьи? Каждую неделю мы разбираем AI-маркетинг с практической точки зрения. Получайте рассылку на почту →
---Когда большие контекстные окна действительно важны?
Большие контекстные окна действительно помогают в трёх ситуациях:
1. Поиск конкретной информации в больших документах. «Найдите все упоминания „политики отмены“ в этих 50 договорах». Это задача на поиск, а не анализ, и больший контекст означает больше документов для поиска.
2. Сопоставление информации из нескольких источников. «Сравните разделы с методологией в этих 20 научных статьях». Это требует одновременной работы с несколькими документами — невозможно при малом контекстном окне.
3. Анализ целых кодовых баз. «Найдите все функции, которые вызывают payment API, и проверьте обработку ошибок». Для этого нужна видимость всего проекта. Claude Code решает эту задачу через файлы CLAUDE.md, а не через сырой контекст, но подход Gemini с загрузкой всего тоже работает.
Во всех остальных случаях — при написании текстов, черновиков, саммари, анализе отдельных документов, ответах на вопросы, создании контента — качество контекста всегда важнее его объёма.
Ключевой навык — инжиниринг контекста: умение выбрать нужные 5 000 токенов из доступной информации. Prompt Optimizer помогает в этом, перестраивая промпты так, чтобы включить наиболее релевантный контекст в наиболее эффективном формате.
---📬 Хотите больше таких материалов? Контрарный анализ ИИ, подкреплённый исследованиями. Подпишитесь бесплатно →
---Часто задаваемые вопросы
Значит, 2M контекста Gemini бесполезны?
Вовсе нет. Для перечисленных выше задач (поиск по большим документам, сопоставление информации, анализ кодовых баз) это действительно прорыв. Дело в том, что размер контекстного окна позиционируют как общее улучшение качества, хотя на деле это узкоспециализированная возможность. Большинство повседневных задач с ИИ выигрывают от сфокусированного, а не от огромного контекста.
Стоит ли выбирать модель ИИ по размеру контекстного окна?
Только если вы регулярно работаете с очень большими документами или кодовыми базами. Для большинства пользователей различия в качестве моделей (качество текста у Claude, скорость у GPT, мультимодальные возможности Gemini) важнее, чем размер контекстного окна.
Какова оптимальная длина промпта?
Для большинства задач 200–500 слов хорошо структурированного контекста (фреймворк ICCSSE) дают оптимальный результат. Дальше начинается убывающая отдача, если только вы не добавляете реальные справочные документы, которые ИИ должен проанализировать.
Раскрытие: некоторые ссылки в этой статье являются партнёрскими. Мы рекомендуем только те инструменты, которые сами протестировали и регулярно используем. Ознакомьтесь с нашей политикой раскрытия информации.