Andrej Karpathy——OpenAI联合创始人和前特斯拉AI负责人——在2025年2月创造了"氛围编程"这个术语,描述了一种开发风格,即"完全沉浸在氛围中",接受AI生成的代码而不必理解每一行代码。柯林斯词典将其评为2025年度词汇。相关工具爆发式增长:Cursor、Replit、Bolt、Lovable和Claude Code吸引了数十亿风险投资。GitHub报告称,今天提交的所有新代码中有46%是AI生成的。在Y Combinator 2025年冬季训练营中,25%的初创公司的代码库有95%或更多是AI生成的。氛围绝佳。

十四个月后,宿醉来临了。Karpathy本人宣布氛围编程已过时——不是因为工具不起作用,而是因为行业转向了更好但更困难的方向:代理工程,开发者编排AI代理而不是盲目接受其输出。数据解释了为什么这种转变是必要的。

关键要点

氛围编程——描述你想要的东西并交付AI生成的任何内容——正在产生灾难性的安全和可靠性问题。数据显示:40-62%的AI生成代码包含安全漏洞。跨站脚本攻击防护86%的时间都会失败。仅2026年3月就有35个新的CVE直接由AI生成的代码引起。亚马逊一周内因AI编码部署发生了4次严重服务中断。速度提升是真实的。代价是安全性、可维护性和技术债务的隐形复合增长,直到生产环境爆炸。

没人愿意谈论的安全数据

关于AI生成代码安全性的数据是明确且令人担忧的。安全公司Tenzai使用五个流行的氛围编程工具——Claude Code、OpenAI Codex、Cursor、Replit和Devin——构建了15个相同的应用程序。结果:这些应用程序中存在69个漏洞。其中6个是严重漏洞——意味着它们可能被利用来获得未经授权的访问、窃取数据或控制系统。这不是在测试晦涩的边缘情况;这些是用标准提示构建的标准Web应用程序。

更广泛的研究证实了这一模式。根据研究和工具的不同,40%到62%的AI生成代码包含安全漏洞。AI在86%的时间里无法防护跨站脚本攻击(XSS)——这是最基本和最容易理解的Web漏洞之一。AI编写的拉取请求显示的安全漏洞率比人工编写的代码高2.74倍。仅在2026年3月,就有35个新的CVE(通用漏洞披露)直接归因于AI生成的代码——从1月的6个增加。随着更多AI生成的代码投入生产,趋势线正在加速。

亚马逊事件为企业受众明确了问题所在。据《金融时报》报道,亚马逊12月的服务中断是由AI编码机器人引起的。该公司随后在一周内经历了四次严重事故。亚马逊内部备忘录承认安全保障措施"尚未完全建立"——对于世界上最复杂的工程组织之一来说,这是一个令人瞩目的承认。亚马逊现在要求高级工程师签署批准初级和中级工程师进行的任何AI辅助代码更改。这家开创大规模云计算的公司被迫添加人工守门员,特别是因为AI代码不可信任。

代码质量指标从不同角度讲述了同样的故事。代码流失率——代码编写、提交然后重写的速率——上升了41%。代码重复增加了四倍。保持代码库长期健康的仔细重构已从2021年变更行数的25%下降到2024年的不到10%。2026年1月的一篇学术论文认为,氛围编程通过减少开发者与维护关键基础设施的维护者的参与,正在"悄悄扼杀开源"。当开发者因为AI生成代码而停止阅读代码时,他们也停止为其代码所依赖的社区项目做贡献。

为什么没有理解的速度会制造定时炸弹

氛围编程的根本问题不是AI生成坏代码——而是开发者交付他们不理解的代码。当人类编写漏洞时,人类对周围代码的理解足以在调试过程中发现和修复问题。当AI生成漏洞时,提示它的开发者通常无法识别问题,因为他们从一开始就从未理解代码的逻辑。错误变成了黑盒中的黑盒。

这创造了复合技术债务。每段开发者不完全理解的AI生成代码都为系统添加了另一个不透明层。当这些层相互作用时——它们最终总是会的——由此产生的错误极难诊断,因为团队中没有人对系统实际如何工作有心理模型。他们只知道他们告诉AI他们想要什么。意图和实现之间的差距悄无声息地增长,直到生产以没人能解释的方式失败。

积分消耗问题使这种情况更加严重。来自应用构建社区的一项分析发现,Lovable用户仅在错误修复上就消耗了400个积分——意味着他们花费大量资源修复AI错误生成的代码,使用相同的AI尝试修复,在过程中产生新问题。这个循环——生成、发现错误、提示AI修复、引入新错误、重复——是AI辅助开发的阴暗面。每轮都会消耗积分或计算时间,代码库积累了没有人类整体审查的补丁层叠补丁。

📬 觉得这篇文章有价值?

每周一个可操作的AI洞察。订阅即可获得免费提示包。

免费订阅 →

什么取代了氛围编程(以及什么真正有效)

2026年初,行业沿着一条可预测的路线分化:使用AI工具的有经验开发者看到了10-30%的真正生产力提升,而使用相同工具的无经验开发者产出更多但质量更差。区别不在于工具——而在于人类是否理解AI生成的内容。

有经验的工程师将AI编码工具用作理解良好的模式的加速器:CRUD操作、API集成、数据格式化、实用函数、样板代码。他们审查输出,理解其含义,并在提交前捕获安全问题。AI节省了实现时间;人类提供判断、架构和质量保证。这就是Karpathy现在称为"代理工程"的东西——编排AI代理而不是无批判地接受其输出。对于适当治理的AI编码,10-30%的生产力提升是真实和可持续的。

试图通过纯提示构建生产软件的非开发者——最初的氛围编程承诺——在几周内就遇到了维护墙。来自构建者社区的Reddit数据显示了"反向迁移"模式:离开无代码平台转向AI编码工具的用户在体验AI生成代码的维护负担后又回到了可视化构建器。将AI辅助与结构化可视化构建相结合的平台正在成为非开发者的务实中间地带。

对开发者来说,实用的要点很明确:AI编码工具与工程判断结合时是变革性的。当用作工程判断的替代品时,它们是灾难性的。唯一重要的AI技能在这里和其他地方同样适用:评估AI输出并判断其是否正确、安全且适合生产的能力。免费提示优化器帮助编写更具体的编码提示,产生更好的首次尝试输出,减少复合质量问题的迭代循环。要在ChatGPT、Claude和Gemini中实现一键优化,TresPrompt直接将其带到您的工作流程中。

📬 想要更多类似内容?

每周一个可操作的AI洞察。订阅即可获得免费提示包。

免费订阅 →

常见问题

氛围编程总是不好的吗?

不——它对生产系统不好。对于原型制作、探索想法和学习,描述你想要什么并看到AI生成它是真正有用的。问题在于当原型代码在没有审查、安全测试或人类理解其逻辑的情况下被部署到生产环境。氛围编程作为探索是可以的。氛围编程作为工程是危险的。

Claude Code是氛围编程问题的一部分吗?

Claude Code,像任何AI编码工具一样,可以负责任地使用,也可以不负责任地使用。Claude Code与纯氛围编程工具的区别在于其代理工作流程——它运行测试、分析错误并迭代解决方案,而不是仅仅生成一次代码。但即使是Claude Code的输出也应该由理解代码库的开发者审查。工具辅助工程;它不能替代工程。

我应该停止使用AI编码工具吗?

绝对不应该——对有经验的开发者来说,生产力提升是真实的。正确的回应是治理,而不是禁欲。在提交前审查AI生成的代码。对AI输出运行安全扫描。理解AI生成内容的逻辑,特别是对于身份验证、授权和数据处理。对遵循标准模式的80%代码使用AI,自己编写关键的20%。

如何让AI生成的代码更安全?

三个实践:(1)在提示中包含安全要求——"确保所有面向用户的字段进行输入验证,对数据库访问使用参数化查询,实施CSRF保护。"具体的安全指令产生更安全的代码。(2)在提交前对所有AI生成的代码运行自动化安全扫描器(Snyk、SonarQube、Semgrep)。(3)要求人工代码审查任何涉及身份验证、授权、支付处理或个人数据处理的AI生成代码。

氛围编程和代理工程的区别是什么?

氛围编程:描述你想要什么 → 接受AI生成的任何内容 → 发布它。代理工程:定义任务 → AI生成解决方案 → AI运行测试 → AI识别失败 → AI迭代 → 人类审查结果 → 人类批准或重定向。区别在于反馈循环和人类监督。代理工程将AI用作合作者;氛围编程将AI用作替代品。

披露:本文中的一些链接是联盟链接。我们只推荐我们亲自测试并经常使用的工具。请查看我们的完整披露政策