Погребённая в анонсах Google I/O 2026 была информация об изменении цен, которая может оказаться важнее любой яркой новой функции: Gemini переходит от ежедневных лимитов на промпты к модели ценообразования на основе вычислений. Вместо «вы получаете X сообщений в день» цена теперь зависит от сложности вашего промпта, используемых функций и длины разговора.
Это звучит технически, но последствия вполне практические: больше не нужно наталкиваться на «стену» посреди дня из-за исчерпанных сообщений. Больше не нужно экономить промпты. А модель ценообразования теперь лучше отражает, сколько ценности вы получаете от каждого взаимодействия.
Ключевой вывод
Ценообразование на основе вычислений выгоднее большинству пользователей. Лёгкие пользователи получают больше взаимодействий. Активные пользователи платят больше, но никогда не сталкиваются с жёсткими лимитами. Ежедневный лимит сообщений — когда вы упираетесь в потолок посреди продуктивного дня — исчезает. Google рассчитывает, что устранение трения приведёт к росту общего использования и выручки больше, чем фиксированные ограничения.
Как работает ценообразование на основе вычислений?
Вместо подсчёта сообщений система измеряет объём вычислений, потребляемых за каждое взаимодействие. Простой вопрос («который час в Токио?») требует минимальных вычислений — возможно, 1/100 от вашего бюджета. Сложная задача («проанализируйте этот 50-страничный документ, извлеките финансовые данные и создайте сравнительную таблицу») потребляет значительно больше — возможно, 1/5 от бюджета.
| Тип задачи | Потребление вычислений | По старой модели | По модели на основе вычислений |
|---|---|---|---|
| Быстрый вопрос | Очень низкое | Считается как 1 сообщение (точно так же, как сложное) | Почти не затрагивает бюджет |
| Обычный разговор | Низкое-среднее | Считается как 1 сообщение за ход | Умеренное потребление за ход |
| Анализ документа | Среднее-высокое | Считается как 1 сообщение (несправедливо) | Более высокое потребление (справедливо) |
| Задачи агента Gemini Spark | Высокое | N/A (Spark — новая функция) | Значительное потребление за задачу |
| Gemini Omni video | Очень высокое | N/A (Omni — новая функция) | Наиболее требовательное к вычислениям |
Практический эффект: вы можете отправлять сотни простых сообщений без беспокойства. Сложные задачи и операции агентов расходуют бюджет быстрее. Это соответствует реальности — быстрый вопрос не должен стоить столько же, сколько анализ на 50 страниц.
---📬 Получаете пользу от этого? Мы разбираем изменения в ценах на ИИ, которые влияют на ваш кошелёк. Получите это в свой почтовый ящик →
---Кто выигрывает и кто проигрывает?
| Тип пользователя | Влияние | Почему |
|---|---|---|
| Случайные пользователи (10–30 запросов в день) | Лучше | Простые запросы почти не затрагивают бюджет вычислений. Никогда не сталкиваются с лимитами. |
| Пользователи с высокой активностью (100+ сообщений в день) | Примерно так же | Высокий объём, но низкая сложность каждого запроса уравновешивают друг друга. |
| Активные пользователи Spark и агентов | Может быть хуже | Задачи агентов требуют много вычислений. Могут быстрее исчерпать бюджет. |
| Обработчики документов и данных | Смешанно | Анализ больших документов стоит дорого. Но больше нет ситуации «1 документ = 1 сообщение». |
| Создатели видео (Omni) | Потенциально хуже | Генерация видео крайне требовательна к вычислениям。 |
Будут ли другие провайдеры следовать этому?
Почти наверняка. Claude уже использует ценообразование за токен для API-доступа — ценообразование на основе вычислений является эквивалентом для подписки. Ограничения сообщений в ChatGPT остаются постоянной жалобой пользователей. У Anthropic и OpenAI есть данные об инфраструктуре для внедрения ценообразования на основе вычислений; Google просто первым объявил о переходе для потребительских подписок.
Ожидается, что Claude и ChatGPT перейдут на похожие модели в течение 12–18 месяцев. Направление очевидно: фиксированные лимиты сообщений — это грубый инструмент. Ценообразование на основе вычислений справедливее, гибче и лучше соответствует реальной ценности использования.
Как оптимизировать работу при ценообразовании на основе вычислений
Пишите точные промпты. Расплывчатые промпты → переписка → потеря вычислений на уточнения. Точные промпты → правильный ответ с первой попытки → эффективное потребление вычислений. Оптимизатор промптов перестраивает любой промпт для точности, что напрямую снижает потребление вычислений.
Используйте подходящую модель под задачу. Не используйте премиум-модели для простых вопросов. Когда Gemini позволит выбирать между Flash (быстрый/дешёвый) и Pro (медленный/мощный), направляйте простые запросы на Flash и экономьте вычисления Pro для сложной работы。
Избегайте лишнего контекста. Загрузка 100-страничного документа, когда вам нужны только 5 страниц, тратит вычисления. Выбирайте релевантные страницы. Принцип из нашей статьи о контекстных окнах работает вдвойне, когда размер контекста напрямую влияет на стоимость.
---📬 Хотите больше подобного? Мы помогаем вам получать максимальную ценность от каждого доллара на ИИ. Подпишитесь бесплатно →
---Часто задаваемые вопросы
Буду я платить больше при ценообразовании на основе вычислений?
Большинство пользователей заплатят столько же или меньше. Если вы сейчас тратите сообщения на простые запросы, которые ограничивают так же, как сложные, ценообразование на основе вычислений более эффективно. Если вы активно используете агенты и документы, вам может понадобиться более высокий тариф.
Могу ли я всё ещё использовать Gemini бесплатно?
Да — бесплатный тариф сохраняется. Ценообразование на основе вычислений применяется в основном к платным тарифам, где оно заменяет ежедневные лимиты сообщений. Пользователи бесплатного тарифа получают ограниченный бюджет вычислений вместо подсчёта сообщений。
Как отслеживать потребление вычислений?
Google пока не раскрыл детали интерфейса мониторинга. Ожидается панель потребления вычислений, похожая на то, как облачные сервисы показывают потребление ресурсов. Скорее всего, она будет доступна в настройках Gemini.
Это лучше или хуже текущей модели ChatGPT?
Лучше по гибкости (нет жёсткого ежедневного лимита). Потенциально хуже для активных пользователей, которые сейчас получают неограниченное количество сообщений в рамках лимита. Общий эффект зависит от вашего паттерна использования. См. наше руководство по аудиту подписок для оценки расходов на ИИ у разных провайдеров.
Как минимизировать потребление вычислений?
Три стратегии: пишите точные промпты (используйте Оптимизатор промптов), используйте самую дешёвую модель, которая справляется с задачей, и избегайте загрузки ненужных больших документов. Фреймворк ICCSSE даёт качественный результат с первой попытки, устраняя дорогостоящую переписку.
Раскрытие информации: некоторые ссылки в этой статье являются партнёрскими. Мы рекомендуем только те инструменты, которые лично протестировали и регулярно используем. См. нашу политику раскрытия информации.