Google I/O 2026 的公告中埋藏了一项定价变更,其重要性或许超过任何华丽的新功能:Gemini 正在从每日提示限制转向基于算力的定价模式。不再是“你每天可以发送 X 条消息”,而是根据提示的复杂程度、使用的功能以及对话长度来计算价格。
这听起来有些技术化,但实际影响却非常实用:你再也不会因为用完每日消息配额而在下午卡住,也不用再精打细算地使用提示。新定价模式真正反映了你从每次交互中获得的价值。
关键要点
基于算力的定价对大多数用户更有利。轻度用户可获得更多交互次数,重度用户虽然支付更多费用,但不会遇到硬性限制。每日消息上限——让你在高效工作的下午突然卡住的限制——将不复存在。Google 相信,消除摩擦将比固定限制更能增加总使用量和总收入。
基于算力的定价如何运作?
系统不再统计消息数量,而是测量每次交互消耗的算力。一个简单的问题(“东京现在几点?”)消耗的算力极少——可能只占预算的 1/100。而复杂的任务(“分析这份 50 页文档,提取财务数据并创建对比表格”)则会消耗更多算力——可能占预算的 1/5。
| 任务类型 | 算力消耗 | 旧模式 | 算力模式 |
|---|---|---|---|
| 快速提问 | 非常低 | 计为 1 条消息(与复杂任务相同) | 几乎不消耗预算 |
| 标准对话 | 低-中 | 每轮计为 1 条消息 | 每轮消耗适量算力 |
| 文档分析 | 中-高 | 计为 1 条消息(不公平) | 消耗较高算力(更公平) |
| Gemini Spark 代理任务 | 高 | N/A(Spark 是新功能) | 每个任务消耗大量算力 |
| Gemini Omni 视频 | 非常高 | N/A(Omni 是新功能) | 算力消耗最高 |
实际效果是:你可以放心发送数百条简单消息,而复杂任务和代理操作会更快消耗预算。这更符合现实——一个简单提问不应该和 50 页分析花费同样的成本。
---📬 觉得有价值? 我们解读那些影响你钱包的 AI 定价变化。订阅至你的收件箱 →
---谁是赢家,谁是输家?
| 用户类型 | 影响 | 原因 |
|---|---|---|
| 普通用户(每天 10-30 次查询) | 更好 | 简单查询几乎不消耗算力预算。不会触及限制。 |
| 高频聊天用户(每天 100+ 条消息) | 基本不变 | 高频但低复杂度查询相互抵消。 |
| 重度 Spark/代理用户 | 可能更差 | 代理任务算力消耗高。可能更快触及预算上限。 |
| 文档/数据处理用户 | 混合 | 大型文档分析成本高。但不再出现“1 份文档 = 1 条消息”的浪费。 |
| 视频创作者(Omni) | 可能更差 | 视频生成算力消耗极高。 |
其他提供商是否会跟进?
几乎可以肯定。Claude 的 API 访问已采用按令牌计费,基于算力的定价相当于订阅版的等价模式。ChatGPT 的消息限制一直是用户长期抱怨的问题。Anthropic 和 OpenAI 都拥有实施基于算力定价所需的基础设施数据,而 Google 只是率先将这一模式引入消费级订阅。
预计 Claude 和 ChatGPT 将在 12-18 个月内转向类似模式。方向已经明确:固定消息限制是一种粗暴的工具。基于算力的定价更公平、更灵活,也更符合实际使用价值。
如何在基于算力的定价下优化使用
撰写具体的提示。 模糊的提示会导致来回沟通,在澄清上浪费算力。具体的提示则能一次性得到正确答案,从而高效使用算力。提示优化器 可以重构任何提示以提高精准度,这直接降低算力消耗。
为任务选择合适的模型。 不要用高级模型处理简单问题。一旦 Gemini 允许你在 Flash(快速/低成本)和 Pro(慢速/高性能)之间选择,请将简单查询路由到 Flash,将 Pro 的算力留给复杂工作。
避免不必要的上下文。 当你只需要 5 页内容却上传 100 页文档时,会浪费算力。请选择相关页面。当上下文大小直接影响成本时,我们在上下文窗口文章中提到的原则将变得更加重要。
---📬 想要更多类似内容? 我们帮助你从每一美元的 AI 支出中获得最大价值。免费订阅 →
---常见问题
在基于算力的定价下我是否会支付更多?
大多数用户支付的费用将保持不变或减少。如果你之前把简单查询浪费在与复杂任务相同的限制上,那么算力定价会更高效。如果你属于重度代理/文档用户,可能需要升级到更高阶层。
我还能免费使用 Gemini 吗?
是的——免费阶层将继续存在。基于算力的定价主要适用于付费阶层,用以取代每日消息限制。免费用户将获得有限的算力预算,而不是消息数量限制。
如何监控我的算力使用情况?
Google 尚未公布监控界面的细节。预计会有类似云服务展示资源消耗的算力使用仪表板,该功能很可能通过 Gemini 设置页面访问。
这比 ChatGPT 的当前模型更好还是更差?
在灵活性方面更好(没有硬性每日限制)。对那些在限额内享受无限制消息的重度用户来说,可能更差。最终影响取决于你的使用模式。请参阅我们的订阅审计指南,了解如何评估各提供商的 AI 成本。
如何最小化算力消耗?
三种策略:撰写具体的提示(使用提示优化器)、为每个任务选择最经济的模型,以及避免上传不必要的大文档。ICCSSE 框架 可在首次尝试时生成高质量输出,减少昂贵的来回沟通。
免责声明:本文中的某些链接为联盟链接。我们只推荐我们亲自测试并经常使用的工具。查看我们的完整免责声明政策。