关于 Claude Opus 4.8 的报道大多是面向开发者的——充斥着基准测试分数、API 模型 ID,以及诸如“智能体工作流”和“SWE-Bench Pro”之类的术语。如果你只是用 Claude 来写邮件、规划项目、研究课题或思考问题,这些信息完全无法告诉你对你而言实际发生了什么变化。本指南会告诉你。没有术语,没有你不关心的基准测试——只讲有什么不同,以及如何利用这些变化。

简而言之:Claude 变得更诚实了,新增了一个你可以控制的“努力程度”设置,并且速度更快了。对于日常使用来说,诚实度的提升是你最容易注意到的——Claude 现在更擅长在不确定时告诉你,而不是自信地胡编乱造。

核心要点

对于非编程人员来说,Claude Opus 4.8 意味着三个实际的改变:(1) Claude 更诚实了——它现在会在不确定时承认,而不是自信地猜测,这使其在研究和决策方面更值得信赖。(2) 新增了一个努力程度控制滑块——处理困难任务时调高它,处理快速任务时调低它。(3) 速度更快了,尤其是在快速模式下。你无需做任何改变就能受益;这些改进会在你使用 Claude 时自动生效。

最大的亮点:Claude 学会了承认自己不知道

对于日常用户来说,最有用的改变与编程无关。Anthropic 让 Opus 4.8 在诚实度方面有了显著提升——具体来说,它更愿意说“我不确定”或“我没有足够的信息”,而不是自信地捏造答案。这解决了 AI 最令人沮丧且危险的问题之一:自信地犯错。以前的模型有时会以十足的自信陈述错误信息,让你在之后(或根本没有)发现错误。

这对你来说为什么重要?如果你用 Claude 进行研究、事实核查或决策,一个会标记自身不确定性的模型,远比一个总是听起来很确定的模型更值得信赖。当 Opus 4.8 自信地告诉你某事时,这种自信现在更有分量了——因为它学会了在理应怀疑时表达怀疑。你可以更确切地相信它的确定性,正是因为它愿意承认不确定性。这是 Claude 作为思考伙伴在可靠性方面的一次真正升级,这也是为什么我们在深入探讨此功能的文章中,称其为学会了说“我不知道”的模型。

新的努力程度滑块:何时该调高它

Opus 4.8 在 claude.ai(以及 Cowork)上引入了一个新控件,让你可以选择 Claude 在回答时投入多少“努力”。它位于模型选择器附近。可以把它想象成是让别人给你一个快速答案,还是让他们认真思考一下。更高的努力程度意味着 Claude 会进行更深入的思考,在难题上给出更好的答案,但会花费稍长一点时间。较低的努力程度意味着更快的回复,非常适合简单的问题。

对于日常使用,默认设置就能很好地处理大多数事情——你不需要去动它。但当你正在处理一些真正困难的事情时——一个复杂的决策、一篇棘手的文章、一个涉及众多变数的问题——调高努力程度可以让 Claude 有空间去妥善思考。对于快速、简单的事情——比如“X 的同义词是什么”、“改写这个句子”——你可以保持默认或调低它以获得更快的回复。我们的完整努力程度控制指南提供了更多细节,但简单的规则是:困难任务,调高它;简单任务,不用管它。

📬 觉得这些内容有用吗?

每周一个可操作的 AI 洞见。订阅还可免费获得提示词包。

免费订阅 →

“智能体改进”用大白话讲是什么意思

你会看到很多报道谈论 Opus 4.8 的“智能体”改进。以下是不带术语的解释:“智能体”指的是 Claude 自主完成多步骤任务——不仅仅是回答一个问题,而是实际执行一系列动作来达成目标。例如,通过查阅多个来源来研究一个主题,或跨多个步骤组织信息,或完成需要使用工具的任务。

Opus 4.8 在这种独立的、多步骤的工作上有了显著提升。对你来说,这意味着当你交给 Claude 更大、更复杂的任务时,它更可靠了——它更擅长保持正轨、发现自己的错误,并在不清楚时提出澄清性问题,而不是去猜测。如果你曾经给过 Claude 一个复杂的请求,却看着它半途而废,那么 Opus 4.8 能更好地处理这些情况。

如何充分利用 Opus 4.8

你无需做任何技术性的操作就能受益于 Opus 4.8——只要你使用 Claude,就是在使用这些改进。但有一件事比任何模型升级都更重要:你提问的清晰度。一个模糊的请求会得到一个模糊的答案,即使是最好的模型也不例外。一个清晰、具体的请求则会得到一个出色的答案。这对所有 AI 工具和所有模型版本都适用。

如果你想在不学习提示词工程的情况下获得更好的结果,免费的提示词优化器可以在几秒钟内将你通常输入的任何内容转化为更清晰、更有效的版本——无需注册,每天三次免费使用。如果你想将此功能直接内置到 Claude(以及 ChatGPT 和 Gemini)中,以便在输入时一键改进你的提示词,TresPrompt 可以将其添加到你的侧边栏。更好的提示词加上更好的模型,才是致胜的组合。

📬 想获取更多类似内容?

每周一个可操作的 AI 洞见。订阅还可免费获得提示词包。

免费订阅 →

真实案例:Opus 4.8 如何帮助处理日常任务

让我们用非编程人员实际使用 Claude 的任务类型来具体说明。如果你正在做研究——比如说,为一次大额消费比较选项或理解一个复杂主题——Opus 4.8 的诚实度提升意味着它更有可能在不确定某个事实时告诉你,而不是自信地陈述错误信息。这使它成为一个更值得信赖的研究伙伴,因为你可以依赖它的自信作为信号。对于研究任务,可以考虑调高努力程度;额外的思考会产生更全面、组织更完善的答案。

如果你在写作——邮件、文档、帖子、创意作品——测试者报告称 Opus 4.8 更擅长在长篇作品中保持你的语气和风格,因此长文档能保持一致性,而不会在语调上飘忽不定。如果你在规划或思考某个决策,改进后的推理能力意味着 Claude 更擅长考虑多个角度并捕捉你可能遗漏的要点,而且它会标记不确定性,而不是给你虚假的信心。如果你在整理信息——将杂乱的笔记转化为结构化的输出,总结长篇内容——更好的指令遵循能力意味着它更有可能精确地给出你要求的格式和结构。

一个比任何模型升级都更有帮助的习惯

这里有一个最有用的要点:你从 Claude 那里获得的结果质量,更多地取决于你提问的方式,而不是你使用的模型版本。这对所有人都适用,无论技术背景如何。最能改善你结果的单一习惯就是具体化。不要只说“帮我写一封邮件”,而是尝试“帮我写一封友好但专业的邮件给客户,解释他们的项目将推迟一周,道歉但不过度道歉,并提出一个新的时间表。”第二个提示词给了 Claude 所需的信息,使其能够一次性给出恰到好处的回复。

你不需要记住提示词写作规则也能做好这一点。免费的提示词优化器会自动将你粗略的请求转化为清晰、详细的版本——你用平实的语言输入你想要的内容,它会添加能获得更好结果的结构和具体细节。这是在不学习提示词工程的情况下获得专家级提示词的最简单方法。结合 Opus 4.8 的改进,清晰的提示词意味着你将从 Claude 那里获得明显更好、更可靠、更有用的回复——无论你是在研究、写作、规划,还是仅仅在思考某件事。

常见问题解答

我需要做什么才能使用 Claude Opus 4.8 吗?

不需要——如果你在 claude.ai 上使用 Claude,当你选择最新模型时,这些改进会自动应用。你无需安装任何东西、更改设置或学习任何技术知识。诚实度的提升、更快的响应速度以及更好地处理复杂任务的能力,都会自动生效。

努力程度控制滑块是做什么用的?

它可以让你选择 Claude 对你的请求进行多深入的思考。对于你想要获得最佳答案的困难任务,可以调高它(并且不介意多等几秒钟)。对于日常任务,保持默认设置即可。对于速度比深度更重要的快速、简单的问题,可以调低它。大多数时候,默认设置就很好用。

Opus 4.8 在写作和研究方面更好吗?

是的——尤其是在研究方面。诚实度的提升意味着 Claude 更有可能在不确定或没有足够信息时进行标记,而不是自信地胡编乱造。对于研究和事实核查,这使其可信度大大提高。在写作方面,测试者报告称它更擅长在长篇作品中保持你的语气和风格。

Opus 4.8 会让我花更多钱吗?

不会——如果你使用的是 Claude 套餐(如 Claude Pro),Opus 4.8 无需额外费用即可使用,与之前的模型一样。底层模型的定价没有变化,在消费者套餐中,你只需将其作为现有订阅的一部分来使用。

“智能体”是什么意思?

“智能体”描述了 Claude 自主完成多步骤任务——执行一系列动作来达成目标,而不仅仅是回答单个问题。Opus 4.8 更擅长这种独立工作:在复杂任务中保持正轨、发现自己的错误,并在不确定时提出澄清性问题,而不是去猜测。当你交给 Claude 更大、更复杂的请求时,你会最容易注意到这一点。

披露:本文中的部分链接是联盟链接。我们只推荐我们亲自测试过并经常使用的工具。请参阅我们的完整披露政策