Claude Opus 4.7 于 2026 年 4 月 16 日发布。在 48 小时内,Reddit、Hacker News 和 X 上的用户报告了同样的问题:原本在 Claude 4.6 上有效的提示突然产生更短、更简略、有时甚至更差的结果。
模型并没有变笨。它变得字面化了。Anthropic 的 Claude 4.7 提示指南直接说明:“为早期模型编写的提示有时现在会产生意外结果。之前的模型会宽松解释指令或完全跳过某些部分,而 Opus 4.7 会字面执行指令。”
Claude 4.6 会猜测你的意图。Claude 4.7 只会精确执行你所说的——不多不少。这个单一变化打破了你一直使用的所有模糊提示。如果你对结构化提示还不熟悉,先浏览我们的 prompt engineering for beginners 文章。本指南涵盖了最重要的 7 项变化,并提供基于 Anthropic 提示最佳实践和 4.7 特定发布说明的具体修复方法。
关键要点
Claude 4.7 比 4.6 更强大。但它不再补偿草率的提示——这正是为什么 Claude 4.7 在日常使用中感觉更差,尽管基准测试有所改善。如果你觉得输出变差了,问题出在你的提示上——而不是模型。
Claude 4.7 到底发生了什么变化?
Anthropic 对 4.7 进行了调优,以实现更可预测、严格遵守指令的行为。这对构建 AI 代理和 API 管道的开发者非常有价值,因为这些场景需要可预测的输出。代价是模型不太可能主动提供信息或扩展任务,除非你明确要求。
三个主要变化——同一厂商,不同默认设置(当你完全选择助手之间时,我们的 ChatGPT vs Claude 分析涵盖了跨模型的权衡):
| 行为 | Claude 4.6 (旧版) | Claude 4.7 (新版) |
|---|---|---|
| 指令遵循 | 宽松解释,填补空白 | 严格按照指令执行 |
| 响应长度 | 无论输入如何,大致保持一致 | 根据感知的任务复杂度调整输出大小 |
| 工具使用 | 频繁调用工具 | 更多推理,使用更少的工具 |
| 语气 | 温暖、注重验证、友好使用表情符号 | 直接、有主见,几乎不用表情符号 |
| 努力程度 | 不同程度之间区分度较低 | 严格遵守努力程度——低努力 = 最小输出 |
为什么模糊提示在 Claude 4.7 上会失效?
“Review this contract” 以前能让你得到全面分析。在 4.7 上,它只会给你一个审查——不是风险评估,不是严重程度评分,不是重写建议。只是一个审查。
❌ 旧提示
Review this contract.
✅ 4.7 提示
Review this contract. Flag risks per clause. Rate severity 1-5. Suggest one rewrite per risky clause. Return as a table.
解决方法: 明确指定你想要的每个输出。指定顺序。指定边界。如果你想要表格,就说“return as a table”。如果你想要项目符号,就说“use bullet points”。4.7 不会猜测你的首选格式。
为什么 Claude 4.7 对“总结这个”返回 8 段落?
Claude 4.6 无论输入大小如何,都会给出大致相同的长度。Claude 4.7 会根据它判断任务的复杂程度来校准响应长度。一份长文档加上“summarize”会产生长摘要。如果你想要 5 个 bullet points,就需要说“5 bullet points”。
❌ 旧提示
Summarize this report.
✅ 4.7 提示
用恰好 5 个 bullet points 总结这份报告。每个 bullet 少于 15 个词。每个 bullet 的首词:一个行动动词。
解决方法: 始终定义格式和上限。“少于 200 字。”“恰好 5 个 bullets。”“最多 3 段。”Anthropic 自己的指南说:如果你想要简洁输出,请添加“Provide concise, focused responses. Skip non-essential context, and keep examples minimal。”
为什么 Claude 4.7 上负面指令不起作用?
这是最反直觉的变化。“不要使用行话”在 4.7 上效果不佳,因为负面指令被过于字面执行——模型关注的是“不该做什么”,而不是“该做什么”。
❌ 旧提示
不要使用行话。不要使用流行词。不要听起来像营销人员。
✅ 4.7 提示
用 16 岁孩子能读出来的简单英语写作。使用简短、具体的词。将 “leverage” 替换为 “use”。将 “scalable” 替换为 “works at any size”。
解决方法: Anthropic 的指南直接建议告诉 Claude 该做什么,而不是不该做什么。展示期望沟通风格的正面示例比负面指令更有效。
---📬 从此获得价值? 我们每周发布一篇关于 AI 工具和工作流程的深度剖析。加入收件箱获取的读者 →
---每个 Claude 4.7 提示该如何开头?
“你能帮我写这封邮件吗?”是个问题。4.7 可能会回答“是”然后等待。使用行动动词能让 4.7 输出具体内容。
❌ 旧提示
你能帮我写这封邮件吗?
✅ 4.7 提示
写一封跟进邮件。目标:在周五前预约会议。少于 90 字。语气:自信、随意、具体。
解决方法:每个提示都以动词开头。Write。Analyze。Compare。List。Draft。Build。行动动词能消除 4.7 需要生成什么的歧义。
Claude 4.7 的努力水平有哪些?应该使用哪一个?
Claude 4.7 引入了一种新的努力水平:xhigh,位于 high 和 max 之间。Anthropic 自己的推荐是针对编码和代理式工作使用 xhigh,对于需要智能的任务至少使用 high。
为什么这很重要:低努力水平的 Claude 4.7 大致相当于中等努力水平的 Claude 4.6。如果你将努力设置留在默认值,你得到的输出相当于 4.6,而你期望的是更好的模型。这解释了大部分“4.7 变差了”的抱怨。
| 努力水平 | 最适合 | 注意事项 |
|---|---|---|
| max | 最难的推理问题 | 容易过度思考,边际收益递减 |
| xhigh (new) | 编码、代理式工作 — Anthropic 的推荐 | 令牌使用量更高 |
| high | 大多数需要智能的任务 | 高质量工作的最低推荐水平 |
| medium | 成本敏感、中等复杂度 | 可能对复杂问题思考不足 |
| low | 快速查询、简单任务 | 浅层推理风险 — 4.7 会严格执行“low” |
解决方法:如果你在聊天界面使用 Claude Pro,请确保“Adaptive thinking”已开启 — 它让 4.7 根据任务复杂度分配推理。如果你使用 API,对于编码设置努力水平为 xhigh,其他任务为 high。除非任务确实简单,否则不要使用 low。
如何从 Claude 4.7 获取创意输出?
这个短语直接来自 Anthropic 的官方文档。它能推动 4.7 在创意或开放式任务上超越字面最小要求。没有它,4.7 的字面特性意味着它只会严格按照你的要求执行——对于创意工作,这往往意味着最低限度的输出。
📋 创意任务模板
为我的 AI 咨询公司构建一个着陆页。
部分(按此顺序):Hero(标题 + 副标题 + CTA)、Logo 栏(6 个客户占位符)、3 个案例研究卡片(问题 / 我做了什么 / 结果)、服务模块、推荐语轮播(3 条引用)、关于我(180 字简介)、新闻通讯订阅、页脚。
风格:编辑风格、衬线标题、无衬线正文、宽裕的白空间。动画:滚动时微妙动画。
超越基础要求。打磨得像真实客户交付物一样。
解决方案: 对于任何创意、设计或开放式任务,在结尾添加“超越基础要求”。这是 4.7 仅做最低限度与发挥最佳水平之间的区别。
如何让 Claude 4.7 的回应听起来不那么机械?
Claude 4.7 更直接,不那么注重验证,且相比 4.6 几乎不使用表情符号。如果你的用例需要温暖感——客户支持、指导、教育内容——你需要明确要求。
💡 Pro Tip
粘贴 2-3 句你想要的语气风格的句子,并告诉 Claude 匹配其节奏。例如:“匹配这种语气:‘嘿!你的这个方法想法很棒。这里是我会调整的地方……’” 这比说“要温暖”更有效,因为 4.7 更善于遵循具体示例而非抽象指令。
Anthropic 的指南推荐:“使用温暖、协作的语气。在回答前先认可用户的表述。” 将此添加到你的 system prompt 或 Claude Projects 指令中。
Try it yourself
Paste any prompt and get a better version in seconds — works for Claude 4.7's literal style.
Open Prompt Optimizer — Free →快速备忘单:4.6 提示 → 4.7 提示
| 旧习惯 | 4.7 修复 |
|---|---|
| "Review this" | 命名每个输出 + 格式 + 约束 |
| "Summarize this" | 定义长度、格式和结构 |
| "Don't use jargon" | 正面指令:"以10年级水平写作" |
| "Can you help me?" | 行动动词:"Write / Analyze / Build" |
| 默认努力水平 | 设置为 xhigh(编码)或 high(其他所有) |
| 期待创意附加内容 | "超越基础" |
| 假设温暖语气 | 明确设置语气 + 粘贴声音示例 |
更宏观的视角:这是所有模型的发展方向
Claude 4.7 的字面行为不是怪癖——这是所有 AI 模型的前进方向。OpenAI 更新了他们的模型规范,强调“不仅考虑字面措辞,还要考虑潜在意图。” 两家公司从相反方向趋同:Anthropic 增加精确性,OpenAI 增加意图推断。相同的技能——明确表达你想要什么——正在成为双方的关键。
如果你的提示在 Claude 4.7 上效果好,到处都好用。ICCSSE framework(Identity, Context, Constraints, Steps, Specifics, Examples)正是为这种字面模型行为设计的——每个元素都迫使你明确表达想要什么。
想现在就升级你的提示?将任何提示粘贴到免费 Prompt Optimizer,看看它如何为 4.7 要求的明确字面风格重组。或者用 Prompt Grader 根据 ICCSSE framework 评分你的现有提示。
---📬 想要更多类似内容? 我们每周发布真正重要的 AI 技能和工具。免费订阅 →
---Try it yourself
Not sure if Claude 4.7 is right for your task? Take the 60-second quiz.
Open Model Picker Quiz — Free →常见问题
Claude 4.7 比 4.6 差吗?
不。它更强大——在 SWE-bench 上得分 87.6%,而 4.6 是 80.8%。但它不再补偿模糊提示。如果你的输出感觉变差了,需要更新提示,而不是模型。
我需要重写所有提示吗?
不是全部。简单、具体的提示仍然有效。失效的是模糊的——“review this”、“summarize this”、“help me with this”。任何依赖 4.6 猜测意图的提示都需要更新。
“adaptive thinking”设置是什么?
在 Claude 聊天界面,adaptive thinking 让模型根据任务复杂度决定推理量。开启它以获得最佳结果。在 API 上,这对应努力参数——编码从 xhigh 开始,其他用 high。
哪里能读 Anthropic 的完整指南?
Anthropic 的完整提示最佳实践在 platform.claude.com/docs——搜索“Prompting best practices”。它涵盖从基本提示到工具使用、思考配置和代理系统的一切。
---披露:本文中有些链接是联盟链接。我们只推荐我们亲自测试并定期使用的工具。查看我们的 完整披露政策。