What is effort control in Claude Opus 4.8?

Effort control is a new setting (next to the model selector on claude.ai and Cowork, and as xhigh/max in Claude Code) that lets you choose how much Claude thinks before responding. Higher effort means deeper reasoning and better answers but more tokens and time. Lower effort means faster responses that conserve your rate limits. It's available on all plans.

What's the difference between extra and max effort?

Both spend more tokens than the default for better results. "Extra" (xhigh in Claude Code) is recommended for difficult tasks and long-running asynchronous workflows — a strong step up without going to the maximum. "Max" spends the most tokens and is reserved for the hardest problems where you want maximum quality regardless of cost. For most hard tasks, extra is sufficient; max is for the genuinely difficult cases.

Does higher effort cost more?

Higher effort uses more tokens, which means higher cost per response and faster rate-limit consumption. However, Opus 4.8's default high effort spends similar tokens to Opus 4.7's default on coding tasks while delivering better results, so the default isn't more expensive than before. Anthropic raised Claude Code rate limits to accommodate higher effort levels.

Which effort level should I use by default?

Leave it on the default (high) for most work — it's tuned to be the best balance for the majority of tasks. Only bump it up for genuinely difficult problems or long-running work, and only drop it down for simple, high-volume tasks where you want speed and rate-limit conservation.

Is effort control available on all plans?

Yes — Anthropic made the effort control available on all plans for claude.ai and Cowork. In Claude Code, the equivalent settings are xhigh and max. This is one of the few Opus 4.8 launch features available across all tiers (unlike dynamic workflows, which is limited to Max, Team, and Enterprise). Disclosure: Some links in this article are affiliate links. We only recommend tools we've personally tested and use regularly. See our full disclosure policy.

如何运用 Claude Opus 4.8 全新的思考强度控制（Extra 与 Max 模式详解）

一个全新的滑块让你决定 Claude 的思考深度。选错了，要么浪费 token，要么得到肤浅的答案。指南在此。

随 Claude Opus 4.8 一同推出的三大功能之一是精力控制——这是 claude.ai 和 Cowork 上的一项新设置（在 Claude Code 中对应 xhigh/max），可让你决定 Claude 在回复中投入多少精力。它紧邻模型选择器，适用于所有套餐。在较高精力设置下，Claude 会更频繁、更深入地思考，从而给出更好的回复。在较低精力设置下，Claude 回复更快，且更缓慢地消耗你的速率限制。这是一个简单的控制项，却对质量、速度和成本有着切实的影响——而大多数用户并不知道该选哪一档。

本指南将详细说明每种精力级别的适用场景、它如何影响你的 token 用量和速率限制，以及哪些任务值得投入更多精力，哪些任务使用默认设置即可。掌握这一点，你就能在难题上获得显著更好的结果，同时在简单任务上节省用量。

核心要点

Opus 4.8 默认采用"high"精力级别——这是质量与体验的最佳平衡点，消耗的 token 与 Opus 4.7 默认设置相近，但结果更好。对困难任务和长时间运行的异步工作流，使用"extra"（Claude Code 中为 xhigh）。对最棘手的问题，若你想要最高质量而不计 token 成本，则使用"max"。较低精力级别回复更快，能为简单任务节省速率限制。较高精力级别会消耗更多 token，因此 Anthropic 提高了 Claude Code 的速率限制以适应这一变化。

精力控制的实际作用

精力控制可调整 Claude 在回复之前和回复期间的"思考"量。在较高精力下，Claude 会更频繁、更深入地推理——探索更多问题空间，考虑更多角度，并更彻底地检查自身工作。这能在复杂任务上产生更好的答案，但会消耗更多 token 和时间。在较低精力下，Claude 更直接、更快地回复，非常适合那些深度推理属于过度杀伤、只会浪费 token 和速率限制的简单直接的任务。

Opus 4.8 默认采用"high"精力级别，Anthropic 认为这是质量与用户体验的最佳整体平衡点。重要的是，在编码任务上，这一默认 high 精力级别消耗的 token 数量与 Opus 4.7 的默认设置相近——但性能更佳。因此，默认设置并不比你之前使用的更昂贵；它只是更好。在默认设置之上，还有"extra"（Claude Code 中称为 xhigh）和"max"，它们会逐步消耗更多 token，以在难题上获得逐步更好的结果。

各精力级别的使用时机

默认（high）：大多数工作保持此设置即可。这是一个平衡的设置，能很好地处理大多数任务——一般性问题、标准编码、写作、分析和日常使用。对于常规工作，你无需触碰此控制项；默认设置在大多数情况下都是经过调优的正确选择。

Extra（Claude Code 中为 xhigh）：Anthropic 特别推荐将其用于困难任务和长时间运行的异步工作流。如果你交给 Claude 一个复杂的编码问题、一个多步骤分析，或一个将无人值守运行一段时间的智能体任务，请将其调至 extra。对于那些第一个答案不太可能是最佳答案的问题，额外的思考会带来回报。这是为"这很难，我希望把它做好"而准备的设置。

Max：将此设置保留用于最棘手的问题，即质量比 token 成本更重要的情况——复杂的架构决策、错综复杂的调试、高风险的 analysis，或任何你宁愿多花 token 也不愿冒险得到次优答案的任务。Max 精力消耗的 token 最多，因此它不是用于常规工作的设置，但对于真正困难的问题，它能从模型中榨取出最大潜力。

较低精力：对于简单、大批量的任务，若速度和速率限制的节省比深度更重要——快速查询、简单重写、常规格式化，或当你在处理许多小任务并希望保留用量时，可将精力降至默认值以下。较低精力回复更快，且更缓慢地消耗你的速率限制。

📬 觉得有用吗？

每周一则可付诸实践的 AI 洞见。订阅还可免费获取提示词包。

免费订阅 →

精力级别快速参考

精力级别	最适合	Token 用量
较低	简单、大批量任务；快速查询	最低
High（默认）	大多数日常任务——平衡之选	中等
Extra（xhigh）	困难任务、长时间运行的异步工作	高
Max	最棘手的问题，质量优先于成本	最高

一个实用提示：精力级别和提示词质量相辅相成。高精力设置无法完全弥补模糊的提示词，而默认精力下的优质提示词往往胜过 max 精力下的平庸提示词。免费提示词优化器能打磨你的提示词，让你在任何精力级别下都能获得最佳结果，而 TresPrompt 则将这种优化带入你的 Claude 侧边栏。如需了解此版本新增内容的完整图景，请参阅我们的 Opus 4.8 概览。

📬 想获取更多类似内容？

每周一则可付诸实践的 AI 洞见。订阅还可免费获取提示词包。

免费订阅 →

精力控制 vs 提示词质量：哪个更重要？

一个常见的误解是，将精力调到 max 可以替代写出好的提示词。事实并非如此。精力控制调整的是模型思考的多少，但它无法弥补模糊、歧义或缺少关键上下文的指令。如果你在 max 精力下提出一个表述不佳的问题，你将得到一个对错误问题经过彻底推理的答案。模型会努力思考——但思考的是错误的事情。精力与提示词质量是互补的，而非可互换的：提示词质量决定模型是否理解你想要什么，而精力决定它追求的彻底程度。

在实践中，最具杠杆效应的做法通常是先改进提示词，再触碰精力控制。一个清晰、具体、结构良好的提示词在默认精力下，往往能胜过 max 精力下的模糊提示词——而且消耗的 token 少得多。只有在你打磨好提示词之后，提高精力级别才会带来回报，因为它给了模型空间去彻底解决一个已被充分理解的问题。可以将其视为一个顺序：首先确保模型确切知道你想要什么（提示词质量），然后决定它应该在这上面投入多少努力（精力级别）。

长时间运行和异步工作流中的精力控制

精力控制在长时间运行和异步工作流中变得尤为有价值，这正是 Anthropic 推荐"extra"设置的确切场景。当你交给 Claude 一个将无人值守运行的任务——一个智能体工作流、一个复杂的多步骤分析、一个漫长的编码任务——你不会坐在那里等待每个 token，因此更高精力的速度代价不会影响你的体验。同时，由于任务足够复杂，彻底的推理能显著改善结果，质量收益会被放大。异步工作是更高精力的理想场景：你获得了质量提升，却感受不到速度成本。

反之则适用于交互式实时工作。当你在快速迭代的来回对话中，较低或默认精力能保持体验的敏捷性，而且你随时可以在原本简单的会话中，为那一个难题临时提高精力。技巧在于将精力与交互模式相匹配：对无人值守的复杂工作使用高精力，对交互式工作使用默认精力，对快速的简单迭代使用较低精力。结合选择正确的模型层级，这让你能对每个任务的质量-速度-成本权衡进行精细控制。

常见问题

Claude Opus 4.8 中的精力控制是什么？

精力控制是一项新设置（位于 claude.ai 和 Cowork 的模型选择器旁边，在 Claude Code 中为 xhigh/max），可让你选择 Claude 在回复前的思考程度。更高精力意味着更深入的推理和更好的答案，但消耗更多 token 和时间。较低精力意味着更快的回复，并能节省你的速率限制。该功能适用于所有套餐。

extra 和 max 精力有什么区别？

两者都比默认设置消耗更多 token 以获得更好结果。"Extra"（Claude Code 中为 xhigh）推荐用于困难任务和长时间运行的异步工作流——在不达到最高级别的前提下，是一个强有力的提升。"Max"消耗的 token 最多，保留用于最棘手的问题，即你想要最高质量而不计成本的情况。对于大多数困难任务，extra 就足够了；max 用于真正困难的情况。

更高精力是否成本更高？

更高精力会使用更多 token，这意味着每次回复的成本更高，速率限制消耗也更快。然而，Opus 4.8 的默认 high 精力在编码任务上消耗的 token 与 Opus 4.7 默认设置相近，同时提供更好的结果，因此默认设置并不比以前更贵。Anthropic 提高了 Claude Code 的速率限制，以适应更高的精力级别。

默认应该使用哪个精力级别？

对于大多数工作，保持默认设置（high）——它经过调优，是大多数任务的最佳平衡点。仅在处理真正困难的问题或长时间运行的工作时才调高，仅在处理简单、大批量任务且需要速度和节省速率限制时才调低。

精力控制是否适用于所有套餐？

是的——Anthropic 为 claude.ai 和 Cowork 的所有套餐都提供了精力控制。在 Claude Code 中，等效设置为 xhigh 和 max。这是 Opus 4.8 发布功能中少数几个跨所有层级可用的功能之一（不同于仅限于 Max、Team 和 Enterprise 套餐的动态工作流）。

披露：本文中的部分链接为 affiliate 链接。我们仅推荐经个人测试并定期使用的工具。请参阅我们的完整披露政策。