随 Claude Opus 4.8 一同推出的三大功能之一是精力控制——这是 claude.ai 和 Cowork 上的一项新设置(在 Claude Code 中对应 xhigh/max),可让你决定 Claude 在回复中投入多少精力。它紧邻模型选择器,适用于所有套餐。在较高精力设置下,Claude 会更频繁、更深入地思考,从而给出更好的回复。在较低精力设置下,Claude 回复更快,且更缓慢地消耗你的速率限制。这是一个简单的控制项,却对质量、速度和成本有着切实的影响——而大多数用户并不知道该选哪一档。

本指南将详细说明每种精力级别的适用场景、它如何影响你的 token 用量和速率限制,以及哪些任务值得投入更多精力,哪些任务使用默认设置即可。掌握这一点,你就能在难题上获得显著更好的结果,同时在简单任务上节省用量。

核心要点

Opus 4.8 默认采用"high"精力级别——这是质量与体验的最佳平衡点,消耗的 token 与 Opus 4.7 默认设置相近,但结果更好。对困难任务和长时间运行的异步工作流,使用"extra"(Claude Code 中为 xhigh)。对最棘手的问题,若你想要最高质量而不计 token 成本,则使用"max"。较低精力级别回复更快,能为简单任务节省速率限制。较高精力级别会消耗更多 token,因此 Anthropic 提高了 Claude Code 的速率限制以适应这一变化。

精力控制的实际作用

精力控制可调整 Claude 在回复之前和回复期间的"思考"量。在较高精力下,Claude 会更频繁、更深入地推理——探索更多问题空间,考虑更多角度,并更彻底地检查自身工作。这能在复杂任务上产生更好的答案,但会消耗更多 token 和时间。在较低精力下,Claude 更直接、更快地回复,非常适合那些深度推理属于过度杀伤、只会浪费 token 和速率限制的简单直接的任务。

Opus 4.8 默认采用"high"精力级别,Anthropic 认为这是质量与用户体验的最佳整体平衡点。重要的是,在编码任务上,这一默认 high 精力级别消耗的 token 数量与 Opus 4.7 的默认设置相近——但性能更佳。因此,默认设置并不比你之前使用的更昂贵;它只是更好。在默认设置之上,还有"extra"(Claude Code 中称为 xhigh)和"max",它们会逐步消耗更多 token,以在难题上获得逐步更好的结果。

各精力级别的使用时机

默认(high):大多数工作保持此设置即可。这是一个平衡的设置,能很好地处理大多数任务——一般性问题、标准编码、写作、分析和日常使用。对于常规工作,你无需触碰此控制项;默认设置在大多数情况下都是经过调优的正确选择。

Extra(Claude Code 中为 xhigh):Anthropic 特别推荐将其用于困难任务和长时间运行的异步工作流。如果你交给 Claude 一个复杂的编码问题、一个多步骤分析,或一个将无人值守运行一段时间的智能体任务,请将其调至 extra。对于那些第一个答案不太可能是最佳答案的问题,额外的思考会带来回报。这是为"这很难,我希望把它做好"而准备的设置。

Max:将此设置保留用于最棘手的问题,即质量比 token 成本更重要的情况——复杂的架构决策、错综复杂的调试、高风险的 analysis,或任何你宁愿多花 token 也不愿冒险得到次优答案的任务。Max 精力消耗的 token 最多,因此它不是用于常规工作的设置,但对于真正困难的问题,它能从模型中榨取出最大潜力。

较低精力:对于简单、大批量的任务,若速度和速率限制的节省比深度更重要——快速查询、简单重写、常规格式化,或当你在处理许多小任务并希望保留用量时,可将精力降至默认值以下。较低精力回复更快,且更缓慢地消耗你的速率限制。

📬 觉得有用吗?

每周一则可付诸实践的 AI 洞见。订阅还可免费获取提示词包。

免费订阅 →

精力级别快速参考

精力级别 最适合 Token 用量
较低简单、大批量任务;快速查询最低
High(默认)大多数日常任务——平衡之选中等
Extra(xhigh)困难任务、长时间运行的异步工作
Max最棘手的问题,质量优先于成本最高

一个实用提示:精力级别和提示词质量相辅相成。高精力设置无法完全弥补模糊的提示词,而默认精力下的优质提示词往往胜过 max 精力下的平庸提示词。免费提示词优化器能打磨你的提示词,让你在任何精力级别下都能获得最佳结果,而 TresPrompt 则将这种优化带入你的 Claude 侧边栏。如需了解此版本新增内容的完整图景,请参阅我们的 Opus 4.8 概览

📬 想获取更多类似内容?

每周一则可付诸实践的 AI 洞见。订阅还可免费获取提示词包。

免费订阅 →

精力控制 vs 提示词质量:哪个更重要?

一个常见的误解是,将精力调到 max 可以替代写出好的提示词。事实并非如此。精力控制调整的是模型思考的多少,但它无法弥补模糊、歧义或缺少关键上下文的指令。如果你在 max 精力下提出一个表述不佳的问题,你将得到一个对错误问题经过彻底推理的答案。模型会努力思考——但思考的是错误的事情。精力与提示词质量是互补的,而非可互换的:提示词质量决定模型是否理解你想要什么,而精力决定它追求的彻底程度。

在实践中,最具杠杆效应的做法通常是先改进提示词,再触碰精力控制。一个清晰、具体、结构良好的提示词在默认精力下,往往能胜过 max 精力下的模糊提示词——而且消耗的 token 少得多。只有在你打磨好提示词之后,提高精力级别才会带来回报,因为它给了模型空间去彻底解决一个已被充分理解的问题。可以将其视为一个顺序:首先确保模型确切知道你想要什么(提示词质量),然后决定它应该在这上面投入多少努力(精力级别)。

长时间运行和异步工作流中的精力控制

精力控制在长时间运行和异步工作流中变得尤为有价值,这正是 Anthropic 推荐"extra"设置的确切场景。当你交给 Claude 一个将无人值守运行的任务——一个智能体工作流、一个复杂的多步骤分析、一个漫长的编码任务——你不会坐在那里等待每个 token,因此更高精力的速度代价不会影响你的体验。同时,由于任务足够复杂,彻底的推理能显著改善结果,质量收益会被放大。异步工作是更高精力的理想场景:你获得了质量提升,却感受不到速度成本。

反之则适用于交互式实时工作。当你在快速迭代的来回对话中,较低或默认精力能保持体验的敏捷性,而且你随时可以在原本简单的会话中,为那一个难题临时提高精力。技巧在于将精力与交互模式相匹配:对无人值守的复杂工作使用高精力,对交互式工作使用默认精力,对快速的简单迭代使用较低精力。结合选择正确的模型层级,这让你能对每个任务的质量-速度-成本权衡进行精细控制。

常见问题

Claude Opus 4.8 中的精力控制是什么?

精力控制是一项新设置(位于 claude.ai 和 Cowork 的模型选择器旁边,在 Claude Code 中为 xhigh/max),可让你选择 Claude 在回复前的思考程度。更高精力意味着更深入的推理和更好的答案,但消耗更多 token 和时间。较低精力意味着更快的回复,并能节省你的速率限制。该功能适用于所有套餐。

extra 和 max 精力有什么区别?

两者都比默认设置消耗更多 token 以获得更好结果。"Extra"(Claude Code 中为 xhigh)推荐用于困难任务和长时间运行的异步工作流——在不达到最高级别的前提下,是一个强有力的提升。"Max"消耗的 token 最多,保留用于最棘手的问题,即你想要最高质量而不计成本的情况。对于大多数困难任务,extra 就足够了;max 用于真正困难的情况。

更高精力是否成本更高?

更高精力会使用更多 token,这意味着每次回复的成本更高,速率限制消耗也更快。然而,Opus 4.8 的默认 high 精力在编码任务上消耗的 token 与 Opus 4.7 默认设置相近,同时提供更好的结果,因此默认设置并不比以前更贵。Anthropic 提高了 Claude Code 的速率限制,以适应更高的精力级别。

默认应该使用哪个精力级别?

对于大多数工作,保持默认设置(high)——它经过调优,是大多数任务的最佳平衡点。仅在处理真正困难的问题或长时间运行的工作时才调高,仅在处理简单、大批量任务且需要速度和节省速率限制时才调低。

精力控制是否适用于所有套餐?

是的——Anthropic 为 claude.ai 和 Cowork 的所有套餐都提供了精力控制。在 Claude Code 中,等效设置为 xhigh 和 max。这是 Opus 4.8 发布功能中少数几个跨所有层级可用的功能之一(不同于仅限于 Max、Team 和 Enterprise 套餐的动态工作流)。

披露:本文中的部分链接为 affiliate 链接。我们仅推荐经个人测试并定期使用的工具。请参阅我们的完整披露政策