本文档是 Lenny 的播客(Lenny’s Podcast)的一期完整中文翻译文稿。本期嘉宾是 Anthropic 旗下现象级 AI 编程工具 Claude Code 的负责人 Boris Cherny。在对话中,Boris 深入探讨了 AI 如何以惊人的速度重塑软件工程行业,并分享了 Claude Code 是如何从一个简易的终端原型,爆发式增长为贡献了 GitHub 全球公开提交量 4% 的颠覆性工具。
两位对谈者围绕诸多深刻的行业话题展开了讨论。Boris 坦言自己目前的编程工作已 100% 由智能体(Agent)完成,并预测“传统编程”问题已被基本解决。他分享了 Anthropic 团队内部打造 AI 产品的独特哲学,如发掘用户的“潜在需求”、保持团队的“资源欠配置”以激发 AI 效能、提供无限量 Token 鼓励试错,以及 Anthropic 严谨的三层 AI 安全架构。
除了前沿的技术洞察,Boris 还展现了丰富且有趣的生活经历。他与主持人 Lenny 惊喜地发现彼此都出生于乌克兰的敖德萨;他还分享了自己在日本乡村制作味噌的时光,以及这种“长远的时间尺度”如何影响了他对通用人工智能(AGI)未来的思考。文章最后,Boris 提供了多项关于如何高效使用 Claude Code 的进阶技巧与科幻好书推荐。
Head of Claude Code: What happens after coding is solved | Boris Cherny
Boris Cherny 是 Anthropic 旗下 Claude Code 的创始人与负责人。这款仅仅一年前还只是一个简单终端原型的工具,如今已深刻改变了软件工程师的工作方式,并正在加速重塑各类专业工作的面貌。
本期话题:
- Claude Code 如何从一个快速验证的原型成长为贡献 GitHub 公开提交量 4% 的产品——日活用户上月实现翻倍
- 推动 Claude Code 成功的反直觉产品原则
- 为何 Boris 认为编程问题已被"解决"
- 塑造 Claude Code 与 Cowork 的潜在需求(latent demand)
- 充分发挥 Claude Code 与 Cowork 的实用技巧
- 为何给团队削减预算、同时提供无限 token,反而能打造出更好的 AI 产品
- Boris 为何短暂离开 Anthropic 加入 Cursor,又在两周后回归
- Boris 与每位新团队成员分享的三条原则
本期文字稿: https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens
文字记录
Boris 与 Claude Code 简介
Boris Cherny: 我 100% 的代码都由 Claude Code 编写。
Lenny Rachitsky: 哦,真的吗?你会想念亲手写代码的感觉吗?
Boris Cherny: 我从未像今天这样享受编程,因为我不再需要处理那些繁琐的细节。工程师人均生产力提升了 200%。有个问题一直被反复讨论:我应该学编程吗?再过一两年,这个问题将不再重要。编程这件事在很大程度上已经被解决了。我设想一个人人都能编程的世界——任何人随时都可以构建软件。那么,软件开发方式的下一次重大变革会是什么?Claude Code 开始自主提出想法了。它会浏览用户反馈,查看 bug 报告,分析遥测数据来修复漏洞、推进功能发布——越来越像一个同事(co-worker)的角色。收听这期节目的很多人是产品经理,他们现在可能正在冒冷汗。我认为到今年年底,每个人都会成为产品经理,同时每个人都会编程。「软件工程师」这个头衔将逐渐淡出,被「构建者(builder)」所取代,这对很多人来说将是一个痛苦的转变。
Lenny Rachitsky: 今天我的嘉宾是 Boris Churnney,Anthropic 旗下 Claude Code 的负责人。Claude Code 对世界所产生的影响难以言表。本期节目发布之际,正值 Claude Code 上线一周年。就在这短短一年内,它彻底改变了软件工程师的工作方式,如今也开始影响科技行业中许多其他岗位——这也是我们今天要探讨的话题。Claude Code 本身在过去一年里也是 Anthropic 整体增长的重要驱动力。Anthropic 刚刚完成了一轮估值超过 3500 亿美元的融资。正如 Boris 所提到的,Claude Code 自身的增长势头依然强劲——仅在过去一个月内,其日活用户数就翻了一番。Boris 本人也是一个非常有趣、善于思考、思维深邃的人。在这次对话中,我们意外发现彼此出生在乌克兰的同一座城市——太有趣了,我之前完全不知道。
Boris 短暂离职加入 Cursor 的前因后果
Lenny Rachitsky: Boris,非常感谢你来到这里,欢迎参加这期播客。
Boris Cherny: 谢谢邀请。
Lenny Rachitsky: 我想先问一个劲爆的问题。大约 6 个月前——我不知道大家是否还记得——你其实离开了 Anthropic,加入了 Cursor,然后两周后又回到了 Anthropic。这究竟是怎么回事?我想我从来没有听过这件事的完整经过。
Boris Cherny: 【笑】这是我经历过的最快的一次工作变动。我加入 Cursor 是因为我是这款产品的忠实粉丝,坦率说,见到那个团队时我真的印象深刻。我至今仍觉得他们很厉害,他们正在构建非常酷的东西,而且我认为他们比很多人更早看清了 AI 编程的发展方向。所以,打造出色产品的想法对我来说非常令人兴奋。但我想,一到那里,我就开始意识到,自己真正怀念的是在 Anthropic 的使命感。这其实也是当初驱使我加入 Anthropic 的原因——在那之前,我在大型科技公司工作,到了某个时刻,我想去一家实验室,以某种方式帮助塑造我们正在共同构建的这个疯狂事物的未来。吸引我来到 Anthropic 的,正是它的使命——一切都关乎安全。当你和 Anthropic 的人交谈时,就算在走廊里随便找一个人,问他们为什么在这里,答案永远是:安全。这种使命驱动的文化深深触动了我。我也深知,这是我获得幸福感所必需的东西。这就是我真正怀念的。我发现,无论工作内容是什么,无论多么令人兴奋,即使是打造一款非常酷的产品,都无法真正替代那种感觉。所以对我来说,很快就清晰地意识到——我缺少的是什么。
Claude Code 上线一周年
Lenny Rachitsky: 好的。那么,让我顺着你回归 Anthropic 以及在那里所做工作的这条线索聊下去。这期播客发布之际,正值 Claude Code 发布一周年。我想花一点时间回顾一下你们所产生的影响。最近有一份由 SemiAnalysis 发布的报告——我相信你已经看过——显示目前 GitHub 上所有代码提交(commit)中,有 4% 是由 Claude Code 完成的,他们预测到今年年底,这一比例将达到 GitHub 所有代码提交的五分之一。他们的说法是:就在我们眨眼之间,AI 已经吞噬了整个软件开发领域。就在我们录制这期节目的今天,Spotify 发布了一条头条新闻——他们最优秀的开发者自去年十二月起就再未手写过一行代码,全靠 AI。越来越多顶尖的高级工程师,包括你在内,都在坦言自己已经不再写代码了,全部由 AI 生成;很多人甚至连代码都不看了。我们能走到今天这一步,在很大程度上要归功于你发起的这个小项目,以及你的团队在过去一年里对它的规模化推进。我很想听你回顾一下这过去的一年,以及你的工作所产生的影响。
Boris Cherny: 这些数字真的太疯狂了,对吧?全球 4% 的代码提交——这远远超出了我的预想。就像你说的,感觉这还只是起点。而且这还只是公开的代码提交,如果算上私有仓库,我们认为这个比例会高出相当多。对我来说,最疯狂的甚至不是我们现在所处的这个数字,而是增长的速度——从任何维度来看 Claude Code 的增长率,它都在持续加速,不只是在上升,而是越来越快地上升。我最初启动 Claude Code 的时候,它不过是一个小小的实验性尝试(hack)。我们在 Anthropic 大致清楚想要推出某种编程产品。在很长一段时间里,我们构建模型的方式契合我们对"如何打造安全高能力 AI"的心智模型:模型先是在编程方面变得非常出色,然后是工具调用,再然后是计算机操作——大致就是这样的发展轨迹,我们为此已经努力了很长时间。
我最初加入的团队叫 Anthropic Labs 团队。Mike Krieger 和 Ben Mann 刚刚重新启动了这个团队,开启"第二轮"。这个团队打造了一些很酷的成果:我们构建了 Claude Code、MCP(Model Context Protocol,模型上下文协议),以及桌面应用。你可以从中看到这个构想的脉络——从编程,到工具调用,再到计算机操作。这对 Anthropic 之所以重要,是因为安全性——说到底还是回到那个话题:AI 正变得越来越强大,能力越来越强。过去一年发生的事情是:至少对工程师而言,AI 不再只是写代码,不再只是对话伙伴,而是真正地使用工具,在世界中采取行动。我认为,现在随着 Cowork 的推出,我们也开始看到这一转变延伸到非技术人群。对于许多使用对话式 AI 的人来说,这可能是他们第一次接触到真正能够"行动"的东西——它可以真正操作你的 Gmail、你的 Slack,替你完成各种各样的事情,而且做得相当好。未来只会越来越好。
所以我觉得,在 Anthropic,很长一段时间里都有一种感觉:我们想要构建些什么,但具体是什么并不明朗。加入 Anthropic 后,我花了一个月时间做各种实验性开发,搭了一堆奇奇怪怪的原型,大部分都没有发布,甚至连接近发布的状态都谈不上,只是在探索模型能力的边界。然后我又花了一个月时间做后训练(post-training),了解研究层面的情况。说实话,对我这个工程师而言,这非常重要——我发现,要做好工作,你真的需要理解你所工作的那一层之下的那一层。在传统工程工作中,如果你在做产品,你就需要了解基础设施、运行时(runtime)、虚拟机、编程语言;总之是你所构建的那个系统。但如果你在做 AI,你真的需要在某种程度上理解模型,才能做好工作。我走了这段弯路,然后回来开始原型设计,最终就成了 Claude Code。
第一个版本,那是夏天的事——我录制了一段演示视频并发布了出去,那时候它叫 Claude CLI。我只是展示了它如何使用几个工具,而让我震惊的是:我给了它一个批处理工具(batch tool),它竟然能用这个工具自己写代码,当我问"我正在听什么音乐?“时,它给出了答案。这是最让我觉得不可思议的地方——因为我并没有指示模型说"用这个工具做这个"之类的话。模型被给予了这个工具,然后它自己想出了如何使用它来回答我的问题——而我甚至不确定它能否回答。
Claude Code 的诞生故事
Boris Cherny: 我正在听什么音乐?于是我开始进一步做原型。我在内部发了一篇帖子宣布这件事,结果只收到了两个点赞——那就是当时反响的全部了。我想原因在于,人们想到编程工具时,脑子里浮现的是 IDE,是各种复杂精密的环境;没有人觉得这东西可以基于终端(terminal)。这是一种有些奇特的设计方式,其实也并非出于刻意为之——从一开始我就在终端里构建它,只是因为最初几个月只有我一个人,这是最简单的开发方式。对我来说,这实际上是一个很重要的产品经验:在早期阶段,你要刻意让资源稍微匮乏一点。
然后我们开始思考应该采用哪种产品形态(form factor),最终决定暂时坚守终端形态,最主要的原因是模型进化得太快了——我们感觉没有其他形态能跟得上它。说实话,这也是我苦苦思索的过程——过去这一年,Claude Code 就是我脑子里全部的念头。就是深夜里反复想的事情:模型在持续进化,我们该怎么办?怎么才能跟得上它?说实话,终端是我唯一想到的答案。然后发布之后很快就火了。在 Anthropic 内部大受欢迎,日活用户数直线拉升。其实早在发布之前,Ben Mann 就催我做一张日活用户(DAU)图表。我还想说,现在是不是太早了,真的有必要现在就做吗?他说:“就现在。“然后那张图表几乎立刻就垂直拉升了。二月份,我们对外正式发布了。
有一件事大家可能不太记得了:Claude Code 对外发布的时候并没有立刻大获成功。它获得了一批用户,有很多早期采用者(early adopter)立刻就理解了它,但实际上花了好几个月,大家才真正弄明白这个东西是什么。还是那句话——它实在太不一样了。回想起来,Claude Code 之所以能成功,部分原因在于潜在需求这个概念——我们把工具带到用户所在的地方,让现有工作流程更顺畅一点;但也正因为它在终端里,这让它有点出人意料,有点像个外来物种,所以你需要保持开放的心态,也需要学着去使用它。当然,现在 Claude Code 已经可以在 iOS 和 Android 的 Claude 应用中使用了。可以在桌面应用中使用,可以在网页端使用,也可以作为 IDE 扩展在 Slack 和 GitHub 中使用。
说到底,这些都是工程师们如今更加熟悉的地方——但这并不是我们的起点。所以,一开始的时候,这东西能用,其实连我们自己都有点意外。随着团队壮大、产品成熟,越来越多人开始使用它——从全球各地的小型初创公司,到最大的 FAANG 大厂——他们开始用,也开始提反馈。回想这段经历,真的让我深感谦逊,因为我们一直在从用户身上学习。最令人兴奋的一点是:其实我们谁都不知道自己在做什么。我们只是在和大家一起摸索。而最好的参照,就是来自用户的反馈——这一直是最好的信号。我已经数不清被惊到了多少次。现如今,事情变化的速度真的令人叹为观止。
AI 改变软件开发的速度
Lenny Rachitsky: 你们一年前发布了这个产品,那也不是人们第一次能用 AI 来写代码。但短短一年之内,整个软件工程行业就发生了翻天覆地的变化。曾经有那么多预测——“AI 会写掉 100% 的代码”——大家当时都说:太疯狂了,你在说什么?如今呢,大家又说:这当然在发生,完全如他们所料。事情变化得就是这么快。
Boris Cherny: 去年五月,在"Code with Claude"大会上——那是 Anthropic 举办的第一届开发者大会——我做了一个简短的分享,在提问环节,有人问我对年底有什么预测。我在 2025 年五月给出的预测是:到年底,你可能不再需要集成开发环境(IDE)来写代码了,我们会开始看到工程师不再亲自动手写代码。我记得当时整个会场都倒吸了一口冷气,那个预测听起来太疯狂了。但在 Anthropic,这正是我们思考问题的方式——指数级增长——这已经深深烙入我们的 DNA。看看我们的联合创始人,其中三位是规模化定律(scaling laws)论文的前三作者。所以我们真的就是以指数思维来看世界的。如果你把当时 Claude Code 所写代码的占比画成指数曲线,顺着那条线往前推,很明显到年底就会突破 100%——哪怕这在直觉上完全说不通。我只是沿着那条线延伸下去而已。结果,十一月份,这件事在我个人身上就发生了,从那以后一直如此。我们也开始在越来越多的客户身上看到同样的情况。
Lenny Rachitsky: 你刚才分享的这段历程,我觉得有一点很有意思——那种"随便玩玩,看看会发生什么"的心态。在 Open Claude 这个项目上也经常是这样,Peter 当时就是随便捣鼓,然后一个东西就冒出来了。这种心态,感觉是 AI 领域很多重大创新的核心要素:一群人坐在那里,不断尝试,把模型推向其他人很少触及的边界。
实验精神在 AI 创新中的重要性
Boris Cherny: 这就是创新的本质——你没办法强求它。创新没有路线图,你只能给人们留出空间。你需要给他们——也许用"安全感"这个词更合适——心理安全感(psychological safety),让他们知道失败没关系,80% 的想法是烂的也没关系。但同时也要适度问责:如果一个想法行不通,就要止损,转向下一个,而不是继续往里砸资源。Claude Code 刚起步的时候,我完全不知道这东西会不会有任何用处。因为即使是二月份发布的时候,它大概也只写了我 20% 的代码,仅此而已。到了五月份,可能也就到 30%。我大部分代码还是用 Cursor 写的。直到十一月份才突破了 100%。所以这花了不短的时间。但从最早的那一天起,我就有一种感觉——感觉自己摸到了什么。我每天晚上、每个周末都在埋头捣鼓这个东西。幸运的是,我太太非常支持。但那种感觉一直都在——感觉抓住了什么,只是还说不清楚是什么。有时候,你找到了一根线头,就只能顺着它一路拉下去。
Boris 当前的编程工作流(100% 由 AI 编写)
Lenny Rachitsky: 所以现在,你 100% 的代码都是由 Claude Code 来写的——这就是你目前的编程状态?
Boris Cherny: 是的。没错,我 100% 的代码都由 Claude Code 来写。我是个相当高产的程序员。哪怕是在 Instagram 工作的时候,我也是产出最高的几位工程师之一。而这一点,在 Anthropic 至今依然如此。
Lenny Rachitsky: 哇。即使已经是团队负责人了。
Boris Cherny: 对,还是写很多代码。每天我大概会提交十几、二十、三十个拉取请求(PR),差不多这个量级,每天都是。
Lenny Rachitsky: 每天都是。对。天哪。
Boris Cherny: 100% 由 Claude Code 编写。自从十一月份以来,我就再没有手动改过一行代码。就是这样。不过我还是会看代码。我不认为我们已经到了可以完全撒手不管的阶段,尤其是当有很多人在运行这个系统的时候。你还是得确保代码是正确的、是安全的,等等。我们也让 Claude Code 对所有内容进行自动代码审查。在 Anthropic,Claude Code 会审查 100% 的拉取请求(PR)。之后还有一层人工审查,但你还是希望保留这些检查节点——还是希望有人亲眼看一遍代码——除非是那种纯原型代码,根本不会实际运行在任何地方,就只是个原型。
下一个前沿
Lenny Rachitsky: 那下一个前沿是什么?现在你 100% 的代码都由 AI 来写,这显然是整个软件工程行业的走向。这曾经感觉像个疯狂的里程碑,如今却成了理所当然的现实。那么,在软件编写方式上,下一个重大转变是什么?是你的团队已经在探索的,还是你认为即将到来的?
Boris Cherny: 我觉得现在正在发生的一件事是:Claude Code 开始自己提出想法了。它在浏览用户反馈、查看 bug 报告、查看遥测数据(telemetry)等,然后开始提出 bug 修复建议和需要开发的功能。它正慢慢变得有点像一位同事了。第二件事是,我们开始在编程之外有所拓展。我认为,就目前而言,编程这件事基本上已经是个解决了的问题——至少对于我所做的这类编程来说,它就是一个已解决的问题,因为 Claude Code 能做到。
所以现在我们开始思考:下一步是什么?超越编程之后还有什么?有很多与编程相邻的领域,我认为这些都将相继到来。但也包括各种通用任务——我现在每天都在用 Cowork 来处理各种与编程完全无关的事情,全程自动完成。举个例子,前几天我需要缴一张停车罚单,直接让 Cowork 去处理了。团队的所有项目管理工作,也全部由 Cowork 包办——在电子表格之间同步数据、在 Slack 上联系相关人员、收发邮件,诸如此类。所以我认为,前沿方向是这样的,而不再是编程——因为编程基本上已经解决了。在未来几个月里,整个行业都会看到这一点:无论是哪种代码库、哪种技术栈,编程问题都将越来越趋近于完全解决。
Lenny Rachitsky: “帮你想清楚该做什么”——这个想法真的很有意思。听众中有很多产品经理,他们现在可能已经开始冒冷汗了。你是怎么用 Claude 做这件事的?直接对话吗?你有没有摸索出什么聪明的方式,帮助你用它来决定构建什么?
Boris Cherny: 说实话,最简单的方法就是打开 Claude Code 或 Cowork,然后把它指向一个 Slack 频道。比如我们有一个专门收集 Claude Code 内部反馈的频道,自从 2024 年内部首次发布以来,那里就一直是滚滚而来的反馈洪流,棒极了。早期,每当有人发来反馈,我就会立刻进去,尽可能快地修复每一个问题——可能一分钟、五分钟之内就搞定。这种极快的反馈循环会鼓励人们给出越来越多的反馈,这一点至关重要——因为它让他们感到被倾听。通常,当你使用一个产品并给出反馈时,那些反馈就好像石沉大海,你也就不再反馈了。所以,如果你让人们感到被倾听,他们就愿意参与进来,帮助把产品做得更好。现在我也在做同样的事,只不过 Claude Code 承担了大部分工作。我把它指向那个频道,它就说:“好,这里有几件我能做的事,我刚提了几个拉取请求(PR),要看看吗?“我说:“好啊。”
Lenny Rachitsky: 你有没有注意到它在这方面正在快速进步?因为这才是真正的"圣杯”,对吧——现在的局面是:好,编程已经解决了。代码审查成了下一个瓶颈——这么多 PR,谁来一一审查?接下来最大的问题是:人类的价值究竟在于决定构建什么、确定优先级。而你说的正是 Claude Code 开始在这方面帮助你的地方。不管是 Opus 4.6 还是其他版本,它在这方面进步了很多吗?演进轨迹是怎样的?
Boris Cherny: 是的。是的,进步了很多。部分原因在于我们专门针对编程所做的训练。显然,它是世界上最好的编程模型,而且越来越好——4.6 就已经令人叹为观止。但实际上,我们在编程之外所做的许多训练,迁移效果也相当不错。存在一种迁移效应:你教模型做 X,它在 Y 方面也随之提升。过去这一年在 Anthropic 内部,收获简直令人咋舌——自从我们推出 Claude Code 以来,工程团队规模大概扩大了约 4 倍(具体数字我不太确定),但与此同时,每位工程师的生产力提升了 200%。就拉取请求(PR)的数量而言,这个数字对于真正在这一领域、在开发者效率方向工作过的人来说简直匪夷所思。我之前在 Meta,负责之一就是整个公司的代码质量——Facebook、Instagram、WhatsApp,所有这些代码库都是我的责任。而代码质量工作在很大程度上也关乎生产力,因为代码质量越高,工程师就越高效。我们当时看到的情况是:数百名工程师花上整整一年,生产力也不过提升几个百分点。所以,如今看到生产力提升以百分之几百来计算,真的是完全超越认知的。同样令人难以置信的是,这一切已经变得如此"正常”——我们听到这些数字,都觉得"当然了,AI 不就应该这样嘛”。但软件开发、产品构建、整个科技世界正在经历的变化,其剧烈程度是前所未有的,实在太容易让人习以为常了。所以我们必须清醒地认识到:这真的非常疯狂。
快速创新的代价
Boris Cherny: 这是我需要时不时提醒自己的事情。这件事也有一些"代价”——可以聊的方面有很多,但我认为在个人层面,有一点很突出:模型迭代太快,我有时会陷入固有的旧思维。我甚至发现,团队里的新人,乃至刚加入的应届毕业生,做事的方式有时比我更加"AGI 原生”。比如,几个月前我遇到了一个内存泄漏(memory leak)问题——Claude Code 的内存占用持续上升,到某个点就会崩溃。这是工程师调过无数次的经典问题,传统的做法是:抓一个堆快照(heap snapshot),放到专用调试器里,用这些专门的工具搞清楚发生了什么。我就是这样做的,坐在那里翻看调用链,试图找出根源。而团队里那位新来的工程师,直接让 Claude Code 去搞定,说:“嘿 Claude,看起来有内存泄漏,你能查出来吗?“于是 Claude Code 做了和我一模一样的事:抓了堆快照,还给自己写了一个小工具,方便自己分析——有点像一个"即时编写的程序”(just-in-time program)。它找到了问题所在,提交了拉取请求(PR),速度比我还快。所以,对于我们这些长期使用模型的人,还是要时刻把自己拉回到当下,不要停留在旧版模型的思维定式里——它已经不是 Sonnet 3.5 了,新模型完全是另一回事。这种思维方式的转变是非常深刻的。
Lenny Rachitsky: 我听说你为团队总结了一套非常具体的原则,每当有人加入,你都会带他们过一遍。其中一条好像是:“比自己做更好的是什么?让 Claude 来做。“感觉你刚才描述的内存泄漏,正好就是忘记了这条原则——忘记了先问一句:好,让 Claude 来试试能不能解决。还有一件有意思的事:当你在各方面资源都略显不足的时候,大家反而会被迫去"Claude 化”(Claudify)——这是我们观察到的现象。比如在工作中,有时我们只给一个项目配一名工程师,他们之所以能快速交付,是因为内心有一种驱动力——一种想把事情做好的内在动力。
Claude Code 团队的工作原则
Boris Cherny: 如果你有一个好主意,自然就会想把它付诸实践,不需要任何人来推动你——那股劲儿来自你自己内心。有了 Claude,你就可以用它自动化大量工作。这也是我们反复观察到的现象。所以我觉得,其中一条原则是:在资源上刻意保持略微欠配置。另一条原则是鼓励大家更快行动——如果今天能做到,就今天去做。这是我们团队非常非常强调的一点。早期这一点尤为重要,因为当时只有我一个人,我们唯一的优势就是速度。那是我们能在这个竞争极为激烈的编程市场中立足的唯一方式。但时至今日,这依然是我们团队坚守的重要原则。如果你想跑得更快,一个很好的方法就是让 Claude 来承担更多工作——这条原则本身也在持续鼓励这种做法。
Lenny Rachitsky: 这个"欠配置"的想法真的很有意思,因为通常大家的感觉是:AI 会让你不再需要那么多员工、那么多工程师。但你说的不只是"你可以变得更高效”——你的意思是,如果主动减少配置,你实际上反而能取得更好的成果。不仅仅是 AI 能让你跑得更快,而是在一个项目上配置的人更少,你反而能从 AI 工具中发挥出更大的价值。
Boris Cherny: 对,如果你招到了优秀的工程师,他们自然会想办法把事情搞定,尤其是当你给他们充分授权的时候。这一点我其实经常和各种公司的 CTO 以及各行各业的从业者聊。我通常给出的建议是:不要一开始就去优化,不要一开始就想着降本。先从一件事做起——给工程师提供尽可能多的 token。现在你开始看到,有些公司——比如 Anthropic——每个人都可以大量使用 token。“无限 token"也开始成为一些公司的福利待遇,加入就能享有。这一点我非常提倡,因为它让大家敢于去尝试那些"想想都觉得太疯狂"的想法。一旦有个想法跑通了,你再来考虑如何规模化,那才是优化和降本的时机——比如研究能不能换成 haiku 或 sonnet,而不是 opus,等等。但在最开始,你只想把大量 token 砸进去,看看这个想法是否可行,给工程师以自由去尝试。所以这里的建议就是:在使用这些模型的成本上,放开手,别太吝啬。
为何应给工程师提供无限量的 token
Lenny Rachitsky: 听到这话,可能会有人说:当然了,他在 Anthropic 工作,自然希望我们用越多 token 越好。但你真正想说的是:最有趣、最具创新性的想法,往往来自那些把工具用到极致、去探索边界在哪里的人。
Boris Cherny: 对。而且我觉得,从实际情况来看,在小规模阶段根本不会产生什么巨额账单之类的问题。一名工程师在做实验时,token 的成本相对于他的薪资,或者公司运营的其他开销来说,其实仍然相当低。所以在项目成长阶段,这实际上并不是一笔很大的开支。比方说,他们做出了很棒的东西,token 消耗量急剧增加,成本开始变得可观——那才是你要去优化的时机。但不要做得太早。
Lenny Rachitsky: 你有没有见过那种 token 成本超过薪资总额的公司?你认为这会成为一种趋势吗?
Boris Cherny: 在 Anthropic,我们已经开始看到一些工程师每月在 token 上的花费达到数十万美元。这种情况确实已经初现端倪。一些其他公司也开始出现类似的情况。
编程技能在未来还重要吗?
Lenny Rachitsky: 说回编程——你会怀念自己亲手写代码吗?作为一名软件工程师,你会对"这件事可能已不再是你分内之事"感到有些失落吗?
Boris Cherny: 说来有意思,对我来说,当初学工程是非常务实的——我学工程是为了能够做出东西。我是自学成才,大学学的是经济学,没学过计算机,但我很早就自己摸索着学了编程,大概从初中就开始写代码了,而且从一开始就极其务实。老实说,我学编程最初的原因——是为了在数学考试上作弊。那时候我们有图形计算器,我就把答案直接编程写进了 TI-83 里。
Lenny Rachitsky: TI-83 Plus 嘛。对,就是那款。
Boris Cherny: (笑)Plus 版,没错。就是这样,我把答案全编进去了。后来下一年的数学考试太难,没办法提前把所有答案都编进去,因为根本不知道题目考什么。于是我就写了一个小解题器——一个能自动求解代数题之类的小程序。后来我发现可以弄一根小数据线,把程序传给全班同学,结果全班都拿了 A。但后来被老师发现了,叫我们别再这么干。从最一开始,编程对我来说就始终是非常务实的——它是一种构建东西的手段,而不是目的本身。不过话说回来,我个人后来也曾深陷进编程本身的美感之中。比如我写了一本关于 TypeScript 的书,还创办了当时全球规模最大的 TypeScript 线下聚会,就是因为我爱上了这门语言本身。我也深入钻研过函数式编程(functional programming)等领域。我觉得很多程序员都会为之着迷。对我来说,编程确实有一种美——尤其是函数式编程;类型系统(type system)也有一种美;当你解开一道真正复杂的数学难题时的那种感觉,和你把类型对齐、写出一段格外优雅的程序时的感觉,是相通的。但它终究不是终点。对我而言,编程始终是一种工具,是一种做事的方式。
话虽如此,不是每个人都这么想。比如我们团队里有一名工程师 Lena,她周末还是会用手写 C++,就是因为她享受这个过程。每个人都不一样。我觉得,即使这个领域发生了翻天覆地的变化,即使一切都在改变,始终会有空间去享受编程这门艺术,去用手工方式完成一些事情——只要你愿意。
Lenny Rachitsky: 你会担心自己的工程师技能日渐退化吗?还是说,你觉得这就是大势所趋,顺其自然就好?
Boris Cherny: 我觉得这就是事情发展的规律,我个人并不太担心这个。对我来说,编程是一个不断演进的连续体。回溯历史,软件其实算是相当新鲜的事物——如果你看看今天程序的编写方式,比如运行在虚拟机(virtual machine)上的软件,这种模式大概从 1960 年代就存在了,算来大约六十年了。在这之前是打孔卡(punch cards),在打孔卡之前是拨动开关,在那之前是硬件本身。在那之前,就是字面意义上的纸和笔——一屋子的人,在纸上进行数学运算。所以说,编程一直都在以这种方式演变。从某种程度上看,你仍然需要了解底层之下的底层,因为这能帮你成为更好的工程师。我认为,大概再过一年左右,情况仍然如此。但我觉得,很快这就不再重要了——就好像汇编代码(assembly code)只是在程序员所写的程序底下默默运行,诸如此类。从情感层面来说,我觉得自己一直都在不断学习新事物。而作为程序员,这其实感觉并不新鲜,因为总会有新的框架、新的语言不断涌现——这是这个领域早已习以为常的事。但话说回来,并非所有人都有这种感受。我想对某些人来说,他们会产生更强烈的失落感、怀旧感,或者技能退化的焦虑,诸如此类。
Lenny Rachitsky: 不知道你有没有看到,Elon 说过:AI 为什么不直接写二进制(binary),直接输出二进制代码?因为,那些编程抽象(programming abstraction)层,最终到底有什么意义?
Boris Cherny: 这是个好问题。我的意思是,如果你想的话,它完全可以做到。
印刷机:AI 冲击的历史类比
Lenny Rachitsky: 哇。那我理解的是——“我该不该学编程?学校里的孩子该不该学编程?“这个问题总是被反复提起。从你的说法来看,你的观点是:大概一两年之内,其实不需要了。我的看法是:对于今天正在使用 Claude Code、使用智能体来编程的人,你仍然需要理解底层逻辑;但一两年之后,这也不会重要了。
Boris Cherny: 我一直在想,历史上有什么合适的类比——因为我们需要把这件事放到历史的坐标系中,搞清楚我们曾经历过哪些类似的转变,什么样的心智模型最贴切。我觉得最接近的类比就是印刷机(printing press)。你看,如果观察 15 世纪中叶的欧洲,当时的识字率(literacy)其实非常低,不到人口的 1% 识字,能读能写的只有抄写员(scribes)——他们包揽了所有的写作和阅读工作。他们受雇于那些往往自己也不识字的领主和国王。所以说,这项工作只属于极少数人。后来,Gutenberg 和印刷机横空出世——有一个惊人的数据:印刷机发明后的五十年间,印刷品的产量超过了此前一千年的总和。印刷品的数量急剧攀升,成本则急剧下降,在随后的五十年里降低了约一百倍。再看识字率,它的提升其实花了相当长的时间,因为学习读写本来就不容易:需要完整的教育体系,需要闲暇时间,需要人们不必整日在农田里劳作,才能有时间接受教育。但在随后的两百年间,全球识字率上升到了约 70%。我认为,我们现在正在经历的,可能就是一场类似的转变。
有一份很有意思的历史文献,记录了一位 15 世纪抄写员对印刷机的看法——他其实非常兴奋。他说:我真正不喜欢做的,是在书籍之间抄写誊录;我真正喜欢的,是在书中绘制插图和装订书籍。现在我的时间被解放出来了,我真的很高兴。有趣的是,作为工程师,我对此深有同感——我现在不再需要做那些繁琐的编码工作了,而那些繁琐的细节,一直都是编程让人头疼的地方。那些琐碎的部分——折腾 git、捣鼓各种工具——从来都不是编程有趣的地方。有趣的地方在于:想清楚要构建什么、提出创意、与用户交流、思考大型系统、展望未来、与团队成员协作。而这些,正是我现在可以花更多时间去做的事情了。
Lenny Rachitsky: 而令人惊叹的是,你们正在构建的这个工具,让任何人都能做到这一切。哪怕完全没有技术背景的人,也能做到你所描述的。我最近一直在做各种零散的小项目,每次卡住了,就说"帮我解决这个”,然后问题就迎刃而解。我以前职业生涯早期做了十年工程师,记得当时在库(libraries)、依赖项(dependencies)这些问题上耗费了大量时间,一边抓狂一边去 Stack Overflow 找答案。而现在,只需要说"帮我解决这个”,然后一二三四,一步步就搞定了。
Boris Cherny: 是啊——完全是这样。今天早些时候我跟一个工程师聊天,他正在用 Go 写一个服务,已经写了大概一个月了,服务运行得相当不错。我问他:写起来感觉怎么样?他说,你知道吗,我其实还是不太懂 Go……(笑)我觉得这样的情况会越来越多。就是说,只要你知道它运行正确、运行高效,你其实不需要了解所有细节。显然,软件工程师的工作已经发生了翻天覆地的变化——过去这一两年,这简直是一份全新的职业了。
AI 将颠覆哪些岗位?
Lenny Rachitsky: 你认为,接下来哪个岗位会受 AI 冲击最大?是科技行业内部——比如产品经理、设计师——还是科技行业之外?你觉得 AI 下一步会渗透到哪里?
Boris Cherny: 我觉得会是很多与工程相邻的岗位。比如产品经理、设计师、数据科学家。这种趋势将扩展到几乎所有可以在电脑上完成的工作,因为模型只会越来越擅长处理这类任务。Cowork 这款产品算是打开这扇门的第一步,但也只是第一步。我认为它的意义在于,将智能体 AI 带到了那些此前从未接触过的人面前,让他们第一次开始对此有所感知。回想一年前的工程圈,没有人真正知道智能体(agent)是什么,也没有人真正用过它。但如今,这已经是我们日常工作的方式了。再看今天非技术类的工作,比如产品工作,或者数据科学这类半技术性的工作——你会发现,人们使用的 AI 始终都是对话式 AI(conversational AI),就是聊天机器人之类的东西,从来没有人真正用过智能体。“智能体"这个词被反复滥用,已经快失去意义了——但"智能体"其实有非常明确的技术含义:它是一种能够使用工具的 AI,是一种能够调用工具的语言模型(LM)。它不只是会说话,它实际上能够行动,能够与你的系统交互——这意味着它可以使用你的 Google Docs,可以发邮件,可以在你的电脑上运行命令,做各种各样的事情。所以我认为,凡是需要以这种方式使用计算机工具的工作,都将是下一波被波及的领域。这是我们作为社会整体、作为一个行业,需要共同思考和解决的问题。对我来说,这也是为什么在 Anthropic 做这项工作感觉如此重要、如此紧迫的原因之一——因为我们对此非常非常认真。所以现在,我们有了经济学家,有了政策方面的人员,有了社会影响方面的人员,这是我们希望大量讨论的议题,这样作为社会,我们才能共同想出应对之道——因为这不该只由我们来决定。
Lenny Rachitsky: 所以你所暗示的核心问题,是就业和工作流失之类的问题。这里有个概念叫杰文斯悖论(Jevons Paradox)——当我们能做的事情越来越多,我们就会雇用越来越多的人,所以实际上没有看起来那么可怕。你目前在工程领域亲身经历了什么?AI 已经成为工程工作的重要组成部分,你们是否比没有 AI 时雇用了更多的人?对就业问题有什么看法?
Boris Cherny: 嗯,就我们团队而言,我们确实在招人。Claude Code 团队正在招聘,如果你感兴趣,去 Anthropic 的招聘页面看看吧。就我个人而言,这一切只是让我更享受自己的工作了。我从来没有像今天这样享受写代码这件事,因为我不必再应付那些繁琐的细节。所以对我个人来说,这一切都令人非常兴奋。我们也从很多用户那里听到了同样的感受——他们喜欢这个工具,他们喜爱 Claude Code,因为它让写代码重新变得令人愉快。这对他们来说真的太有趣了。但这件事将走向何方,实在难以预料。我还是忍不住要借助历史类比来思考。我觉得印刷机(printing press)是一个非常贴切的例子——它所带来的,是一项原本只掌握在少数人手中的技术——比如读写能力(literacy)——向所有人敞开。它本质上是一股民主化的力量,每个人都开始能够做到这件事。如果不是这样,文艺复兴根本就不可能发生,因为文艺复兴在很大程度上,正是关于知识的传播,关于人们用来沟通交流的书面记录——毕竟那个年代没有电话之类的东西。那个时代也没有互联网。所以关键在于:这会开启什么样的可能?对我来说,这就是非常乐观的那一面,也是我真正感到兴奋的部分。那是难以想象的——就像我们今天能够坐在这里对话,如果没有印刷机的发明就不可能实现;我们的麦克风也不会存在。我们周围的一切都不会存在。如果没有那项技术,就根本不可能协调如此庞大的人群。所以我设想一个几年后的世界,人人都能编程——那会解锁什么?任何人都可以随时构建软件。我完全不知道会发生什么。就像 1400 年代没有人能预测此后的一切一样,我想现在也是如此。但我确实认为,在此期间会有很大的冲击,对很多人来说将是一段痛苦的过渡。同样,作为一个社会,这是我们必须进行的对话,是我们必须共同解决的问题。
AI 时代的成功之道
Lenny Rachitsky: 那么,对于听到这里、想在我们即将进入的这个动荡时代中立于不败之地的人,有什么建议?是应该多玩 AI 工具、真正精通最新的东西吗?还是有什么其他建议,能帮助人们保持领先?
Boris Cherny: 嗯,我觉得基本上就是这样——多尝试工具,去了解它们,不要害怕它们,直接投入进去,走在最前沿,走在边界之上。也许第二条建议是:比以往更努力地成为一个通才(generalist)。比如在学校里,很多学计算机的人学会了编程,但除此之外几乎什么都没学,也许学了一点系统架构之类的东西。但我每天共事的最有效率的工程师,以及最有效率的产品经理等等,都是跨学科的人。就在 Claude Code 团队,每个人都写代码——产品经理写代码,工程经理写代码,设计师写代码,财务人员写代码,数据科学家写代码。团队里每个人都写代码。而如果我看具体的工程师,很多人都横跨不同领域。最优秀的工程师往往是产品与基础设施兼修的复合型工程师,或者是具有出色设计感、同样能胜任设计工作的产品工程师;或者是对业务有深刻理解、能够以此判断下一步方向的工程师;又或者是热爱与用户交流、能够真正感知用户需求、从而找到前进方向的工程师。所以我认为,在未来几年里获得最多回报的人,不仅仅是 AI 原生用户、不仅仅是非常擅长使用这些工具的人——他们同时也是充满好奇心的通才,能够横跨多个领域,能够从更宏观的视角思考他们正在解决的问题,而不只是局限于工程层面。
Lenny Rachitsky: 你是否认为这三个独立的职能——工程、设计、产品管理——作为思考团队的框架,依然有其价值?尽管这些人现在都在写代码、都在参与思考应该构建什么,但你认为这三种角色从长远来看还会持续存在吗,至少在目前阶段?
Boris Cherny: 我认为短期内会继续存在,但我们已经开始看到一个现象:这些角色之间大概有 50% 的重叠——很多人实际上在做着相同的事情,只是各有各的专长。比如我写的代码多一点,而我们的 RPM Cat 也许更多地负责协调、规划或预测之类的事情。
Lenny Rachitsky: 利益相关方的协调对齐(Stakeholder alignment)。
Boris Cherny: 利益相关方的协调对齐,正是如此。我确实认为存在这样一个未来——我想到今年年底,我们就会开始看到这些边界越来越模糊:在某些地方,“软件工程师"这个头衔将开始消失,取而代之的也许是"构建者”(builder),或者也许所有人都将是产品经理,同时所有人都写代码——诸如此类。
Lenny Rachitsky: 谁说招聘必须公平?如今我接触的每一位创始人和招聘经理都感受着同样的压力:要尽快招到最优秀的人才。但招聘耗时耗力,协调对齐(alignment)难度极大,顶尖人才的竞争也愈演愈烈。正因如此,11 Labs、Brex、Replit、Deal 等 5,000 多家企业选择了 MetaView——这家 AI 公司正在为高绩效团队提供招聘领域真正的"不公平优势”。MetaView 为你提供一套像招聘同事一样运转的 AI 智能体:根据你的精确标准寻找候选人、自动记录面试笔记、从整个招聘流程中提炼洞察,并帮你锁定候选人池中的最佳人选。AI 接管繁琐的招聘事务,给你提供一个真实可信的信息来源。这意味着每次招聘节省数小时,让团队聚焦于最重要的事——赢得合适的候选人。别让竞争对手在招聘上超越你。MetaView 的客户关闭职位的速度快 30%。立即免费试用 MetaView,前往 metaview.ai/lenny 还可获得额外一个月的人才挖掘服务。那说的就是我了。
调查:哪些岗位因 AI 而更享受工作
Boris Cherny: Lenny,你说过你现在更享受写代码了。我其实在 Twitter 上做了一个小型非正式调查,不知道你有没有看到——我发起了三个不同的投票。我问工程师们:自从使用 AI 工具以来,你是更享受工作了,还是不如以前?然后分别对产品经理和设计师做了同样的调查。结果是,工程师和产品经理中都有 70% 的人说更享受工作了,约 10% 的人说没以前享受了。而设计师的情况颇为有趣:只有 55% 的人说更享受工作了,20% 的人说没以前享受了。我觉得这真的很耐人寻味。
Lenny Rachitsky: 这非常有意思。我很想和这些人聊聊——无论是那些"更享受"的,还是那些"没以前享受"的——去真正了解一下原因。你有没有机会跟进他们?
Boris Cherny: 有几个人回复了,我们其实正在做一个深度跟进的调查,会放在节目注释里,进一步探讨让工作变得更有趣或更无趣的因素。但对于说工作变得没以前有趣的设计师,他们留下的回复其实不多——那些被具体问到"为什么你不再享受工作"的人,几乎没有多少给出回应。
Lenny Rachitsky: 所以我也很好奇背后究竟发生了什么。
Boris Cherny: 是的,这也是我在 Anthropic 观察到的一点。我认为 Anthropic 的每个人技术背景都相当扎实——这是我们招聘时的筛选标准之一。即便是非技术岗位,员工在入职时也要经历大量技术面试。我们的设计师大多数都会写代码。所以从我的观察来看,他们对 AI 工具是相当享受的——因为现在他们不用再去麻烦工程师,直接自己就能下场写代码了。甚至一些之前不会写代码的设计师,现在也开始动手了,对他们来说太棒了,因为可以自行解除阻碍、推进工作。不过我真的很想听到更多人的亲身经历,因为我相信这绝对不是整齐划一的。
Lenny Rachitsky: 是啊。所以如果你正在收听这期节目,不妨在评论区留言——如果你觉得工作变得没以前有趣了,说说原因吧。因为从你说的、以及我听到的大多数反馈来看,70% 的产品经理和工程师都更享受工作了。如果你不在这个阵营里,那肯定是有什么原因在里面。
产品开发中的潜在需求原则
Boris Cherny: 对。是的。我们也确实看到大家在使用不同的工具。比如,我们的设计师更多地通过 Claude 桌面应用来写代码——你只需下载桌面 App,里面有一个代码标签页,就在 Cowork 旁边,本质上运行的是完全相同的 Claude Code、同一个智能体,功能一模一样。这个功能已经上线很多个月了。你可以用它来写代码,而不必打开一堆终端(terminal),同时又保留了 Claude Code 的全部能力。最大的亮点是,你可以同时并行运行任意数量的 Claude 会话——我们把这叫做"多开 Claude”(multi-Clauding)。对于非工程师背景的用户来说,这种方式更加自然顺手。而这背后的逻辑,归根结底还是:把产品带到用户所在的地方。你不该强迫用户改变工作流程,也不该让他们费力去学一套全新的东西。只要能让用户正在做的事情变得稍微轻松一点,产品体验就会大幅提升。这正是潜在需求(latent demand)原则的精髓——我认为这是产品领域最重要的单一原则。
Lenny Rachitsky: 你能展开讲讲吗?因为我也正想聊到这个话题。能解释一下这个原则是什么,以及真正释放潜在需求之后会发生什么吗?
Boris Cherny: 潜在需求的概念是这样的:如果你构建的产品,可以被人们以一种并非设计初衷的方式来"破解"或"滥用”,用来完成某种他们真正想做的事,那么这恰恰能帮助你作为产品构建者判断下一步该把产品带向何处。一个典型的例子是 Facebook Marketplace。那个团队的负责人 Fiona,她是 Marketplace 团队的创始负责人,她经常谈到这件事。Facebook Marketplace 的诞生,源于大约 2016 年前后的一个观察:Facebook 群组中有 40% 的帖子都是买卖商品的内容。这简直太疯狂了——人们在"滥用"Facebook 群组功能来进行买卖交易。这里的"滥用"并不是安全层面的滥用——而是指没有任何人把这个产品设计成用来买卖的,但用户自己摸索出了这种用法,因为它实在太好用了。所以很显然,如果你专门做一个更好用的买卖产品,用户一定会喜欢。Marketplace 的成功几乎是板上钉钉的事。于是第一步是推出"买卖群组"——专为买卖行为定制的特殊群组;第二个产品才是 Marketplace 本身。Facebook 交友(Facebook Dating)我认为起点也大同小异。当时的观察是:如果查看用户的主页浏览记录,会发现 60% 的主页浏览发生在互相不是好友、但性别相反的用户之间。这就是一种传统意义上"相亲配对"的雏形,只不过用户是在悄悄查看彼此的主页。所以想着,如果能专门为这种行为做一个产品,或许会奏效。这种潜在需求的思路,我认为是极为强大的。
Cowork 的诞生也是同样的逻辑。过去六个月左右,我们观察到大量使用 Claude Code 的人,用它做的根本不是写代码的事情:有人在 Twitter 上用它种西红柿,有人用它分析自己的基因组,有人用它从损坏的硬盘里恢复照片——是婚礼照片——还有人用它分析核磁共振(MRI)图像。各种完全不涉及技术的使用场景,层出不穷。信号太明显了:人们正在费尽周折地使用一个终端(terminal)来做这些事情——或许我们该直接为他们做一款专门的产品。其实我们很早就注意到了这个信号,大概是去年五月的事。我记得走进办公室,看到我们的数据科学家 Brendan 正在电脑上用 Claude Code——他打开了一个终端(terminal)。我当时惊呆了,就问他:“Brendan,你在干什么?你居然知道怎么打开终端——这可是面向工程师的产品啊。”
Lenny Rachitsky: 就连很多工程师都不愿意用终端。终端就是最底层的操作方式,真的是要钻进计算机最深处。
Boris Cherny: 结果他不仅学会了用终端,还下载了 Node.js、下载了 Claude Code,然后在终端里跑 SQL 分析——太疯了。下一周,所有数据科学家都开始照做。所以,当你看到有人这样"滥用"一款产品——用一种它根本没有预设的方式,来完成对自己有用的事——这就是一个极强的信号:你应该直接为此构建一款产品,人们一定会喜欢这个专门为此而生的东西。
我认为,潜在需求还有另一个有趣的维度。传统视角是:观察人们在做什么,把它变得更简单,赋予他们更大的能力。而我过去六个月看到的现代视角稍有不同:观察模型在尝试做什么,然后把它变得更简单。我们最初构建 Claude Code 的时候,很多人设计语言模型产品的思路是把模型装进一个"盒子"里——“这是我想构建的应用,这是我想做的事,模型,你只负责其中这一个组件,按照这种方式与这些工具和 API 交互。“而对于 Claude Code,我们把这个逻辑翻转了。我们说:产品就是模型本身。我们要把它充分暴露出来,在它周围搭建最少的脚手架,给它最精简的工具集。这样它就能自己做决定:运行哪些工具、以什么顺序运行,等等。我认为,这在很大程度上源于对模型"潜在需求"的洞察。在研究领域,我们把这叫做"在分布内”(on distribution)——观察模型本身想做什么。在产品领域,“潜在需求"不过是同一个概念,只是把它应用到了模型身上。
Cowork 诞生记:10 天极速构建
Lenny Rachitsky: 你提到了 Cowork——我记得你在发布时谈到,你们团队仅用 10 天就把它做出来了。太疯狂了。而且上线之后很快就有数百万用户——这样一款产品居然是 10 天做出来的。能多聊聊吗?还是说一切就归结于"我们用 Claude Code 来构建它"这么简单?
Boris Cherny: 对,说来有趣。Claude Code 就像我之前说的,发布之初并没有立刻火起来,而是随着时间推移才逐渐成为爆款。其间经历了几个关键拐点:Opus 4 发布时有一次明显跃升,11 月又有一次,之后就一直在拐——增长曲线每天都在变得更陡。但在最初的几个月,它并不算爆款:人们在用,但很多人搞不清楚怎么用、用来做什么,模型本身也还没那么出色。Cowork 发布的时候完全不同——立刻就火了,比 Claude Code 早期的势头猛得多。说实话,功劳主要得归于 Felix、Sam、Jenny 和整个团队,这真的是一支极其出色的队伍。而 Cowork 的诞生,同样源于潜在需求。我们看到人们用 Claude Code 做各种非技术性的事情,就开始思考:我们该怎么办?团队花了几个月探索,尝试了各种各样的方向。最终有人提出:“要不这样——直接把 Claude Code 放进桌面应用里?“结果,这个方案奏效了。于是团队在 10 天内全程用 Claude Code 来构建它。值得一提的是,Cowork 内置了一套相当复杂的安全系统和防护机制,确保模型不会"脱轨”。比如,我们随产品内置了一整个虚拟机(virtual machine),而这些代码全部由 Claude Code 编写完成。我们只需要思考:怎么让它对非工程师用户来说更安全、更自主?整个实现完全依靠 Claude Code,历时 10 天。我们选择提前发布——产品当时还比较粗糙,现在也还有不少毛边。但这正是我们学习的方式——无论是产品层面还是安全层面——我们必须比自己预想的更早发布,这样才能收到反馈,才能和用户对话,才能理解人们真正想要什么,进而塑造产品未来的走向。
Anthropic 的 AI 安全三层架构
Lenny Rachitsky: 这个观点非常有意思,也非常独特。“提早发布、向用户学习、获取反馈、持续迭代”——这个理念一直都有。但对于 AI 来说,还有一个独特的理由促使你更早发布:你很难预判 AI 究竟能做什么、人们会如何使用它。这正如你所描述的——提早发布能帮你探索"这个东西里到底藏着什么潜在需求”,把它放出去,看看人们会做什么。
Boris Cherny: 对。而对于 Anthropic 这样一个以安全为核心的实验室来说,提早发布还有另一个维度——安全。在模型安全领域,有几种不同的研究方式。最底层是对齐(alignment)与机制可解释性(mechanistic interpretability):这发生在训练模型的阶段,我们要确保模型是安全的。目前我们已经拥有相当成熟的技术,能够理解神经元内部发生了什么,并对其进行追踪。比如,如果某个神经元与"欺骗"相关,我们就能对它进行监控,并在它被激活时感知到。这就是对齐,这就是机制可解释性——这是最底层。第二层是实验室环境:把模型放进"培养皿"里,用合成场景来研究它——“模型,这种情况下你会怎么做?你做的是正确的事吗?是否对齐?是否安全?“第三层则是观察模型在真实世界中的行为表现。随着模型越来越复杂,这一层变得愈发重要——因为模型在前两层表现良好,并不代表在第三层也没问题。我们之所以很早就发布 Claude Code,正是为了研究安全——在对外发布之前,我们在 Anthropic 内部使用了大约四五个月,因为我们当时并不确定……毕竟这是当时业界发布的第一个重量级 AI 智能体(agent)。它绝对是第一个被广泛使用的编程智能体(coding agent)。我们当时确实不确定它是否安全,所以在内部实际研究了相当长一段时间,直到觉得可以放心发布为止。即便在此之后,我们在对齐和安全方面也学到了很多,并不断将这些成果反哺回模型和产品中。Cowork 的情况非常相似——模型处于全新的使用场景中,承担的是非工程类任务,是一个代表你行动的智能体(agent)。从对齐角度看,表现良好;从评估(eval)角度看,也没问题;内部试用,良好;与几个客户试用,同样良好。现在,我们需要确保它在真实世界中是安全的。这也是我们略微提前发布的原因,也是我们将其称为"研究预览版"的原因。但这确实在持续改进。这也是唯一能确保模型长期对齐、长期做正确事情的方式。
Lenny Rachitsky: 你们所处的领域真的太疯狂了——既有激烈的竞争和飞快的节奏,与此同时又存在一种恐惧:AI 一旦失控,就可能造成破坏——在这之间寻找平衡,一定极具挑战性。我所听到的是,你们似乎构建了三个层次——我知道这个话题可以单独撑起一整期播客——就是你们如何看待安全问题。大致来说:一是观察模型的思维与运作过程;二是通过测试和评估来判断模型是否在做有害的事情;三是提前发布。关于第一层,我其实听到的不多,但那太酷了——你们有一个可观测性工具,能让你们"窥视"模型的大脑,看看它在思考什么、将要走向哪里?
Boris Cherny: 对,你应该找机会请 Chris Ola 来上播客,因为他是这个领域公认的行业专家。他发明了我们所说的机制可解释性(mechanistic interpretability)这个领域。其核心思想是:你的大脑到底是什么?它是由一堆相互连接的神经元组成的。就像研究人类大脑或动物大脑一样,你可以从机制层面去研究它,理解神经元在做什么。令人惊讶的是,这套方法在很大程度上也适用于模型。模型的神经元与动物的神经元并不相同,但在很多方面行为相似。因此,我们学到了大量关于这些神经元工作方式的知识——比如某一层或某个神经元对应某个概念,特定概念是如何被编码的,模型是如何进行规划的,如何"向前思考"的。很久以前,我们还不确定模型究竟只是在预测下一个 token,还是在做更深层次的事情。现在,我认为有相当有力的证据表明,它确实在做更深层次的事情。而随着模型越来越大,实现这一点的结构也越来越精密——并非单一神经元对应单一概念,一个神经元可能对应十几个概念,而当它与其他神经元共同被激活时,这种现象就叫做叠加(superposition)。多个神经元叠加在一起,共同表征更为复杂的概念。这是我们始终在持续探索的领域。对于 Anthropic 来说,以安全、对世界有益的方式推动这一领域发展,正是我们存在的根本原因,也是每一位 Anthropic 人选择来到这里的原因。在这里工作的每一个人,都是因为这个原因而来的。因此,我们实际上将大量这类研究成果开源,频繁发表论文,非常公开地进行分享——希望借此激励其他从事类似工作的实验室,以安全的方式推进研究。这正是我们在 Claude Code 上一直践行的理念,我们在内部将其称为"争先竞优”(race to the top)。比如,针对 Claude Code,我们发布了一个开源沙箱(sandbox),可以在其中运行智能体,确保其在特定边界内操作,防止它随意访问你系统上的所有内容。我们将这个沙箱开源,而且它可以与任何智能体配合使用,不仅限于 Claude Code——因为我们希望让其他人也能轻松做到同样的事情。这正是"争先竞优"原则的体现。我们希望确保这件事朝着好的方向发展,而这就是我们手中的杠杆。
智能体"卡壳"时的焦虑感
Lenny Rachitsky: 太棒了。好,我确实想在这个话题上多花些时间,我会跟进这个建议的。另外,我在这个领域——以及在工程师、产品经理和其他与智能体协作的人群中——注意到一个现象:当智能体无法正常工作时,人们会产生一种焦虑感。那种感觉就像:“哦天哪,Nza 提了个问题,我得去回答,否则它就卡住了。“或者是:“它卡在某个地方了,我在损失大量生产力,我得赶紧起来让它重新运转。“你有这种感觉吗?你的团队有这种感觉吗?你认为这是一个需要关注和思考的问题吗?
Boris Cherny: 我现在一直有一堆智能体在跑。比如此刻,我大概有五个智能体在同时运行。每次醒来,第一件事就是去查看之前挂起的那些智能体。今天早上一醒来,我第一个念头就是:“我真的很想看看那个东西。“于是我打开手机上的 Claude iOS 应用 Code 标签页,查看智能体的执行情况——因为昨天写了一些代码,心里一直在琢磨:这样做对吗?我有点自我怀疑,结果发现是对的。现在做这些真的太方便了。所以说,这种焦虑感确实有一点,只是我个人可能感受不那么强烈,因为我的智能体一直都在跑。而且我现在也不再局限于终端(terminal)了。大概三分之一的代码工作在终端里完成,三分之一在桌面端应用,还有三分之一在 iOS 应用上——这让我非常惊讶,因为我完全没想到在 2026 年竟然会以这种方式编程。
Lenny Rachitsky: 我喜欢你仍然把这称为"编程”(coding),它本质上就是跟 Claude Code 描述你想要什么,然后让它替你写代码。有趣的是,这现在就是编程的定义——编程,是描述你想要什么,而不是亲手写代码。
Boris Cherny: 我有时候会想,那些曾经用打孔卡编程的人,如果让他们看看今天的软件,会说些什么。这不是很疯狂吗?我记得读到过一些东西——大概是早期 ACM 杂志之类的出版物——有人在上面说:“这不一样,这根本算不上编程。“你知道,他们那时候叫它 programming,coding 其实是个相对较新的说法。不过我常常会想到一件事——我家人来自苏联,我出生在乌克兰,我的祖父实际上是苏联最早的一批程序员之一,他用打孔卡编程。他告诉我妈妈——或者说,我妈妈在我成长过程中讲起这些故事——说他会把那些打孔卡带回家,一大摞一大摞的。对我妈妈来说,她小时候会拿蜡笔在上面乱涂乱画,那是她童年的记忆;但对他来说,那就是编程本身的体验。他其实从未亲眼见证软件时代的到来,但在某个时间节点,这场转变确实发生了。我想,那一代的老程序员里,大概有人就是没把软件当回事,会说:“这不算真正的编程。“但我觉得,这个领域一直就是这样不断变化的。
Boris 的乌克兰情缘
Lenny Rachitsky: 你可能不知道,我也出生在乌克兰。
Boris Cherny: 哦,真的吗?哪里?
Lenny Rachitsky: 我来自敖德萨(Odessa)。
Boris Cherny: 哦,我也是。
Lenny Rachitsky: 〔笑声〕什么?
Boris Cherny: 是真的,太巧了。
Lenny Rachitsky: 哇,太不可思议了。真是难忘的时刻。说不定我们还有那么一点渊源呢。你们是哪年离开的?
Boris Cherny: 我们是 95 年来的。
Lenny Rachitsky: 好的,我们是 88 年走的,早了一些。
Boris Cherny: 哦,是啊。
Lenny Rachitsky: 如果当初没有离开,生活会截然不同,对吧?
Boris Cherny: 是的。我每天都感到无比幸运,能够在这里长大。
Lenny Rachitsky: 是啊。
Boris Cherny: 我家人每次喝酒或者吃顿饭,都会举杯说"敬美国”——我就说,好了好了,够了。但你懂的,一旦你真的开始想象,另一种人生可能会是什么样子……
Lenny Rachitsky: 是的,完全理解。我们也举同样的祝酒词,不过还是用伏特加。
Boris Cherny: 还是伏特加,当然。〔笑声〕
Lenny Rachitsky: 好,我还想再问你几件事。你分享了很多关于如何充分利用 AI、如何基于 AI 打造优秀产品的实用建议。其中一点是:给团队充足的 token,放手让他们去实验。你还分享了一个整体原则:朝着模型将要去的方向构建,而不是针对今天的模型。还有哪些建议,想分享给正在尝试打造 AI 产品的人?
构建 AI 产品的建议
Boris Cherny: 我大概还有几点想补充。第一点是:不要试图把模型框死。我发现很多人在基于模型构建系统时,本能反应是让它严格遵循某种固定方式——“这只是更大系统中的一个模块。“典型的例子,是在模型上叠加非常严格的工作流程:规定它必须先执行步骤一,再执行步骤二,再执行步骤三,然后用一个复杂的编排器来控制整个流程。但实际上,几乎在所有情况下,只要给模型提供工具、赋予它一个目标,让它自己想办法,效果往往会更好。一年前,你可能确实需要大量脚手架(scaffolding)来辅助;但现在基本上不需要了。我不知道该怎么给这个原则起名,也许可以套用一句话——别问模型能为你做什么,想想你能给模型提供什么工具。核心就是:不要过度干预,不要把它塞进条条框框,不要一开始就塞给它一堆上下文;给它一个工具,让它自己去获取所需的上下文——你只会得到更好的结果。
第二点,也许是一个更具普遍性的原则——就是《苦涩的教训》(The Bitter Lesson)。对 Claude Code 团队来说,我们把这篇文章视为重要参考——希望各位听众都读过——Rich Sutton 大约十年前写了一篇博客,叫做《苦涩的教训》,核心思想其实非常简单。他的观点是:越通用的模型,永远会胜过越专用的模型。他当时谈的是自动驾驶和其他一些领域,但实际上,《苦涩的教训》有着极多的推论。对我来说,其中最重要的一条就是:始终押注于更通用的模型。从长远来看,不要尝试用小模型来处理问题,不要尝试做微调(fine-tune)。不要去做这些。当然,某些特定的应用场景可能有其理由,但几乎在所有情况下,如果你有这个灵活性,都应该尽量押注更通用的模型。那些复杂的工作流程,本质上是在把模型"专用化”——是在给它套脚手架。我们通常观察到的是,脚手架也许能带来 10%、20% 的性能提升,但这些收益往往会被下一个模型直接抹平。所以,有时候还不如直接等下一个模型发布。
最后一个原则——也是我认为 Claude Code 事后回头看做对了的事——从一开始,我们就押注于为六个月后的模型构建产品,而不是为今天的模型。产品非常早期的时候,它帮我写的代码其实很少,因为我不信任它——那时候用的是 Sonnet 3.5,后来是所谓的 3.6 或者 3.5 new,不管叫什么名字。那些模型在写代码方面还不够好,正在进步,但仍处于相当早期的阶段。所以那时候,它只是帮我管理 git、自动化了一些事情,并没有真正承担大量的编码工作。Claude Code 的赌注在于:终有一天,模型会好到足以独立完成大部分代码编写。这件事我们第一次真正看到,是在 Opus 4 和 Sonnet 4 的时候——Opus 4 是我们去年五月发布的第一个 ASL-3 级别的模型,那时候我们看到了明显的拐点:大家第一次真正开始大规模使用 Claude Code,增长正式进入指数级阶段,而且正如我之前说的,这种势头一直延续至今。所以,这是我常常给很多人的建议,尤其是在创业的人:头六个月会很难熬,因为产品市场契合度不会很好,但如果你是为六个月后的模型构建产品,等那个模型发布的时候,你就能立刻冲出起跑线,产品会一下子顺畅起来,真正跑起来。
Lenny Rachitsky: 那么,所谓"为六个月后的模型构建产品”,你认为人们可以对未来做出哪些假设?是说模型总体上会越来越强?还是说,如果某件事已经"差不多够用了”,就意味着它大概率还会继续改进?在这方面有什么建议吗?
Boris Cherny: 我觉得这是个不错的判断方式。当然,在 AI 实验室内部,我们能看到模型具体的改进方向。[笑声] 这确实有点不公平,但我们也尽量公开谈论这些内容。比如,模型会越来越擅长使用工具和操作计算机。这是我愿意押注的方向。另一个方向是:模型能够持续运行的时间会越来越长。这方面有很多研究可以印证,但如果你只看发展轨迹——或者就拿我自己的亲身经历来说,一年前用 Sonnet 3.5 的时候,它大概只能运行 15 到 30 秒就开始跑偏,处理任何复杂任务都得全程手把手。但现在用 Opus 4.6,平均能无人值守地运行大约 10 到 30 分钟,我可以直接开一个新的 Claude Code 会话去做别的事。就像我说的,我通常同时跑很多个会话,它们甚至能持续运行几个小时乃至几天,有些案例据说连续运行了好几周。我认为随着时间推移,“模型长时间自主运行、无需人工值守"这种状态会越来越普遍。
高效使用 Claude Code 的进阶技巧
Lenny Rachitsky: 我们刚才聊了构建 AI 产品的技巧。那使用 Claude Code 本身有没有什么建议?无论是第一次上手的新用户,还是已经在用、想进一步提升的人,能分享几个进阶技巧吗?
Boris Cherny: 先说一个前提:使用 Claude Code 没有所谓唯一正确的方式。我可以分享一些技巧,但说实话,这是一款开发者工具,而开发者各有不同——偏好不同、环境不同,使用方式因人而异,没有标准答案。你需要摸索出适合自己的路径。好在你可以直接问 Claude Code,它能给出建议,能修改你的设置,对自身也相当了解。所以 Claude Code 本身也能帮你入门。以下是我觉得普遍适用的几个技巧。第一条:使用能力最强的模型。目前是 Opus 4.6,我始终开启最高算力模式。有时候人们会想用 Sonnet 这类成本更低的模型,但正因为智能程度相对较低,完成同一任务反而消耗更多 token。所以用更便宜的模型是否真的更省钱,其实并不显而易见。很多时候,使用能力最强的模型反而更省钱、消耗的 token 也更少——因为它能更快、更直接地完成任务,不需要反复纠错和手把手引导。所以第一条建议就是:用最好的模型。
第二条是使用计划模式(plan mode)。我几乎所有任务都从计划模式开始,大约占 80%。计划模式其实非常简单,本质上只是在模型的提示词(prompt)中注入一句话:“请先不要写任何代码。“就这一句——没有什么花哨的机制,就是最简单的处理方式。在终端里,只需按两次 Shift+Tab 就能进入计划模式;桌面应用里有一个按钮,网页端也有;移动端即将上线,SWAC 集成也刚刚支持了这个功能。计划模式就是第二条建议。模型会和你来回沟通,等计划确定之后,再让它执行。我在那之后会开启自动接受编辑,因为计划一旦确定,模型往往能一次性完成——用 Opus 4.6 几乎每次都能一次搞定。
第三条建议是多尝试不同的使用界面。很多人一提到 Claude Code,脑子里就是终端。当然,我们支持各种终端——Mac、Windows,不管你用什么终端都能完美运行。但我们其实也支持很多其他产品形态,比如 iOS 和 Android 应用。还有桌面应用、Slack 集成,以及各种其他支持的形式。我建议都去尝试一下。每位工程师都不一样,每位构建者都有自己的风格,找到最适合你的方式去用就好。你不一定非要用终端,因为底层运行的是同一个 Claude 智能体。
对 Codex 的看法
Lenny Rachitsky: 太棒了。好,再聊最后几个问题。你怎么看 Codex?对这款产品有什么感受?它的发展方向如何?毕竟这是个竞争极为激烈的编程智能体赛道——说实话,我其实没怎么用过它,不过大概在它刚发布的时候试用过一次。在我看来它和 Claude Code 挺像的,说实话挺让我受宠若惊的。我认为有更多竞争其实是好事,因为用户应该有选择权,竞争也能督促大家都做得更好。
Boris Cherny: 但说到底,我们团队专注的还是解决用户遇到的问题。我们不会花太多时间研究竞品,也不怎么去试用其他产品。你当然需要知道它们的存在,但对我来说,我更享受与用户交流,享受不断改进产品,享受把用户反馈真正落地的过程。归根结底就是把产品做好。
Boris 的后通用人工智能时代规划
Lenny Rachitsky: 最后一个问题。我和 Anthropic 联合创始人 Ben Mann 聊过,请他推荐了一些问题,已经穿插在我们整个对话中了。他特别想问你:通用人工智能(AGI)实现之后,你有什么打算?不管"AGI"具体意味着什么,到那个时候,你觉得自己会过着怎样的生活?
Boris Cherny: 加入 Anthropic 之前,我其实住在日本农村,那是一种截然不同的生活方式。我是那个小镇上唯一的工程师,也是唯一的英语母语者,整个氛围与现在完全不同。每周我会骑几次自行车去农贸市场,沿途经过稻田,那个节奏与旧金山截然相反,是两个完全不同的世界。让我特别喜欢的一点是我们与邻居建立感情的方式——通过互赠腌菜。在我们住的那个小镇,几乎家家户户都自己做味噌、腌菜。我也因此练得有模有样,做了好几批,到现在还在坚持。味噌是一件很有意思的东西,它教会你用一种非常长远的时间尺度去思考。这和工程思维很不一样。一批白味噌至少要发酵三个月,红味噌则需要两三四年。你必须非常有耐心——把原料混好,然后静静等待,要有极大的耐心。我热爱它的原因,正是这种用漫长时间尺度思考的方式。嗯,是的。我想,如果到了 AGI 之后的时代,或者假如我不在 Anthropic,我大概会去做味噌吧。〔笑声〕
Lenny Rachitsky: 我太喜欢这个答案了。Ben 让我问你"你和味噌到底是什么关系”,所以很高兴你解答了这个问题。好,那么未来的方向也许就是一头扎进味噌世界,把味噌做到极致,对吗?太棒了。Boris,这次对话真的精彩绝伦。我感觉我们现在就像来自乌克兰的兄弟了。在进入令人期待的闪电问答之前,还有什么你想补充分享的吗?有没有什么想留给听众的话?有什么想再次强调的观点?
Boris Cherny: 有的。我只想再强调一点:对 Anthropic 来说,从创立之初,“先从编程入手,再扩展到工具调用,进而到计算机操控”——这一直是我们思考问题的框架。这是我们认为模型将要演进的轨迹,也是我们构建模型的方式。同时,这也是我们学习安全、研究安全、持续改进安全的最有效路径。所以你看,现在发生的一切——Claude Code 成长为一个数十亿美元量级的庞大业务,我所有的朋友都在用 Claude Code,每天都发消息来聊它——某种程度上完全出乎意料,因为我们起初根本不知道它会演变成这个产品形态,不知道它会在终端起步,诸如此类。但从另一个角度看,这又完全在情理之中,因为这一直是我们作为一家公司长期坚守的信念。与此同时,我仍然感觉这一切还处于非常非常早期的阶段——世界上大多数人仍然没有使用 Claude Code,大多数人仍然没有使用 AI。所以感觉这件事才完成了 1%,前方还有太多路要走。
Lenny Rachitsky: 确实。老兄,联想到最近披露出来的那些数字,真的难以置信。你们刚刚完成了一笔巨额融资。我记得 Claude Code 单独就在创造 20 亿美元的营收,而 Anthropic 整体——你们公布的数字,好像是 150 亿美元营收。仔细想想,这一切还处于如此早期的阶段,但我们看到的数字已经是这个规模,真的令人咋舌。
Boris Cherny: 是啊。是的,确实疯狂。而且,Claude Code 能持续保持这样的增长势头,说实话,完全归功于用户。有太多太多人在使用它,他们对产品充满热情,深深爱上了它,然后告诉我们哪里不好用、他们想要什么功能。产品能持续改进,唯一的原因就是所有人都在使用它、谈论它、持续给我们反馈——这是最最重要的事。对我而言,每天与用户交流、让产品越来越好——这就是我热爱的工作方式。这让我……哦对,味噌嘛,倒不太需要操心,只需要等待,静静等待就好。
闪电问答与结语
Lenny Rachitsky: 好了,Boris,说到这里,我们正式进入令人期待的闪电问答环节!我有五个问题,准备好了吗?
Boris Cherny: 来吧!
Lenny Rachitsky: 第一个问题:你最常向别人推荐的两三本书是什么?
Boris Cherny: 我这人,书单很长。先说技术类:第一本是《Scala 函数式编程》(Functional Programming in Scala)。这是我读过的最好的技术书,没有之一。它有点奇特,因为你可能根本不会真正去用 Scala,而且我也不确定这在未来还有多大现实意义——但函数式编程(functional programming)有一种纯粹的优雅,那种用类型体系(type system)思考的方式,就是我编程的方式,是我无法摆脱的思维模式。你可以把它当成一件历史文物来读,也可以当成一本能让你脱胎换骨的书。
Lenny Rachitsky: 我很喜欢这本从来没人提起过的书。
Boris Cherny: 我最爱的一本。
Lenny Rachitsky: 太棒了,太棒了。第二本呢?
Boris Cherny: 第二本是 Charles Stross 的《Accelerando》。我最喜爱的类型大概就是科幻,或者说科幻与文学类。《Accelerando》是一本令人叹为观止的书,节奏飞快,而且越来越快、越来越快。我觉得它比任何一本书都更能捕捉到我们此刻所处时代的本质——就是那种速度感。故事从技术起飞刚刚开始时讲起,逐渐逼近奇点(singularity),最终以一群拥有集体意识的龙虾绕木星飞行作结。这一切就发生在几十年的时间跨度里,所以节奏真的令人窒息。我非常喜欢它。再推荐最后一本——刘慈欣的《流浪地球》(The Wandering Earth)。他就是写《三体》的那位作者。很多人因为《三体》认识他。我觉得《三体》非常精彩,但说实话我更喜欢他的短篇小说。《流浪地球》是他的短篇小说集之一,里面有几个真的非常非常精彩的故事。读中国科幻也很有意思,它提供了与西方科幻截然不同的视角,至少从刘慈欣作为一个作家的思维方式来看是如此。真的非常值得一读,而且文字也写得极为优美。
Lenny Rachitsky: 科幻小说确实帮我们提前建立起对未来走向的思维框架,这一点真的很神奇——读完之后脑子里会形成一个模型:好,我见过这种世界,我知道它可能的走向。
Boris Cherny: 对,我觉得这正是我加入 Anthropic 的真正原因。就像我说的,我当时住在那个偏远地方,生活节奏非常非常慢,至少比旧金山慢太多了。你做的一切都围绕着季节,围绕着那些需要很多很多个月才能完成的食物。那里的社交活动也是这样组织的,时间的安排也是如此。你去农贸市场,发现现在是青椒(piman)季——你怎么知道?因为有二十几个摊位都在卖青椒。下一周季节就过了,变成葡萄季了,你能清清楚楚感受到这种流转。这就是那种漫长的时间尺度。当时我也在大量阅读科幻,身处那样的环境、处于那样的时刻,带着对漫长时间尺度的思考,我想:我知道这件事可以走向何方,我只是觉得我必须出一份力,让它走得好一点点——这就是我最终来到 Anthropic 的原因。Ben 也是一个很重要的推动因素。
Lenny Rachitsky: 我觉得可以专门做一期播客,只聊你在日本的时光、Boris 从日本走到 Anthropic 的历程,但今天就先点到为止吧。我快速给你推荐一本科幻小说,如果你还没读过——《深渊上的火》(A Fire Upon the Deep),读过吗?
Boris Cherny: 那是 Vernor Vinge 写的,对吧?
Lenny Rachitsky: 对,就是他。太棒了。对。从 AI 和通用人工智能(AGI)的视角来看,那本书真的非常有意思。读过它的人太少了,我自己……是的,里面有太多值得琢磨的东西。
Boris Cherny: 确实确实。我还很喜欢《天渊》(A Deepness in the Sky)。那应该是续集之类的,对吧?
Lenny Rachitsky: 嗯。对对对,是的。
Boris Cherny: 嗯。
Lenny Rachitsky: 读进去很费力,也很复杂,但真的太好看了。好,我们继续闪电问答。你最近有没有特别喜欢的电影或电视剧?
Boris Cherny: 说实话,我平时基本不看电视或电影,最近实在没时间。不过我想再提一个推荐——Netflix 上的《三体》剧集,我真的非常喜欢,觉得这个改编对原著系列的呈现相当出色。
Lenny Rachitsky: 所以 AI 领域领导者的共同规律就是:没时间看电视或电影,这我完全理解。好,有没有你最近发现、特别喜欢的产品?
Boris Cherny: 我直接说吧——Cowork,因为这真的是对我生活改变最大的产品。我一直开着它用,其中 Chrome 集成尤其出色。它帮我交过交通罚款,帮我取消过几个订阅,能替我处理掉的那些琐碎杂事真的太棒了。另外我也不确定算不算产品,但我还想推荐一个播客——除了 Lenny 的节目之外——就是 Ben 和 David 主持的《Acquired》播客。太棒了,内容非常精彩。他们深入挖掘商业历史、把历史讲得鲜活生动的方式,真的非常非常好。如果你还没听过,我建议从任天堂那期开始。
Lenny Rachitsky: 很好的建议。关于 Cowork,让大家了解一下——如果你还没用过:基本上就是你输入想完成的任务,它就能启动 Chrome 帮你去执行。我见过有人在 Anthropic 休陪产假期间,让它帮自己填那些医疗表格——就是那种特别烦人的 PDF——它会打开浏览器、登录账号、填好内容,然后提交。
Boris Cherny: 对,就是这样,而且它真的能跑起来。大概一年前我们也试过,但当时没成功,因为模型还没准备好。但现在,它真的就直接能用了,太神奇了。我觉得很多人根本不了解这是什么,因为他们之前从没用过智能体。在我看来,这和一年前的 Claude Code 给人的感觉非常相似——但就像我说的,它的增长速度远比 Claude Code 早期要快得多,所以我觉得它正在开始真正破圈。
Lenny Rachitsky: 还有你提到的那个 Chrome 扩展插件,可以单独使用,它就嵌在 Chrome 里,你可以直接跟 Claude 对话,它能看着你的屏幕和浏览器帮你做各种事情——告诉你你在看什么、总结页面内容,诸如此类。
Boris Cherny: 对,没错。对,就是这样。对于刚开始用 Cowork 的人,我的建议是:先下载 Claude 桌面版应用,打开 Cowork 标签页,就在 Code 标签页旁边。我推荐从让它使用某个工具入手。比如整理一下桌面,或者总结你的邮件,或者"回复最重要的三封邮件”——它现在真的会帮我回邮件。第二步是连接工具。比如你可以说"查看我最重要的几封邮件,然后发 Slack 消息”,或者"整理进电子表格”。再比如,我用它来管理所有项目:我们团队有一张统一的电子表格,每行对应一位工程师,每周大家填写状态更新,每周一 Cowork 就自动检查一遍,给所有没填状态的工程师发 Slack 提醒——我就再也不用手动去做这件事了。这就是一条提示词,全部搞定。第三点,就是同时跑一堆任务。Cowork 支持同时运行任意数量的任务。所以就是这样:启动一个任务——比如我这个项目管理任务在跑——再让它做别的,再做别的,把这些都启动了,然后我就去喝杯咖啡等着。
Lenny Rachitsky: 我会附上一篇文章链接,里面分享了很多人使用——以前叫 Claude Code、现在也可以通过 Cowork 来做——的各种用法。因为很多时候就是那种"哇,我没想到还能用它来做这个"的惊喜,而看到这些具体例子,我觉得正是人们需要听到的。顺便说,其中很多内容也受到了你的启发——你曾经发过一篇文章,好像是"Claude 的 50 个非技术用途"之类的。我们有一位 PM 就用那篇文章来评测 Cowork 上线前的效果。据我了解,当 Cowork 能完成 50 条里的 48 条时,他们说:“好,差不多了。”
Boris Cherny: 哇,我完全不知道这件事。这也太酷了吧。我……我成了一个测评基准。
Lenny Rachitsky: 感觉怎么样?
Boris Cherny: 棒极了。我感觉自己对 AI 的未来很有价值。
Lenny Rachitsky: 这算是反向破圈了。哈哈哈,太酷了。好,还有两个问题。你有没有什么特别喜欢、在工作或生活中常常回想起的人生格言?
Boris Cherny: 用常识。我觉得我见过的很多失败,尤其在工作环境中,都源于人们没有运用常识。比如不假思索地执行流程,不假思索地做事,或者在做一个并不好的产品、追着一个并不好的想法,却只是随着惯性走,从不停下来思考。我见过的最好结果,都来自那些从第一性原理出发、建立自己判断力的人。如果某件事感觉不对劲,那大概就是个坏主意。这是我给同事最多的一条建议,没有之一。
Lenny Rachitsky: 光是这一点就能单独开一期播客了——什么是常识?怎么培养?但我们今天就点到为止。最后一个问题:你最近在 Twitter/X 上活跃了很多,我很好奇这是为什么,以及你在 Twitter 这个世界里的体验是怎样的?因为你在 Twitter/X 上的互动非常多。
Boris Cherny: 有很长一段时间我只用 Threads,因为我当年也参与了一些 Threads 的开发工作,而且我也很喜欢它的设计——产品界面很简洁,我真的很喜欢。我开始用 Threads,其实是因为无聊。十二月我在欧洲——
Lenny Rachitsky: 你是说开始用 Twitter 吧?
Boris Cherny: 对对,没错。我开始用 Twitter,也是因为无聊嘛。十二月我和妻子在欧洲旅行,就是到处晃悠——去了哥本哈根,去了好几个国家。对我来说,那简直是一次"编程假期”,每天都在写代码,这是我最喜欢的度假方式,整天就是写代码,太爽了。有那么几个小时突然没灵感了,不知道接下来想做什么,就打开了 Twitter,看到有人在发关于 Claude Code 的推文,就开始回复。后来我想,也许我应该主动去找找,看有没有人遇到了 bug,或者有什么反馈想说——于是就介绍了一下自己,问大家有没有 bug 和意见要分享。我觉得大家都对我们现在处理反馈的速度感到有些惊讶。对我来说这已经太正常了——只要有人报个 bug,我大概几分钟内就能搞定,用 Claude Code 一跑,只要描述够清晰,它就自己去处理了,然后我再去回应下一条。但我想对很多人来说,这种速度还是挺出乎意料的,体验真的很棒。总体来说在 Twitter 上的经历非常好,能跟大家互动、了解需求、听 bug 反馈和功能建议,都让我很享受。前两天我还在 Twitter 上看到有人向 Nikita Beer 抱怨,说他们在 Threads 上连续发帖发着发着就崩了——我当时就想,天哪,这是怎么了。
Lenny Rachitsky: 对啊。对,对,确实有个 bug。希望现在已经修好了。太厉害了。Boris,我真的可以跟你聊上好几个小时。好了,不多占用你的时间了。非常感谢你来参加节目!你真的太棒了。听众们可以在哪里找到你?他们能为你做些什么?
Boris Cherny: 大家可以在 Threads 或者 Twitter 上找到我,那是最方便的方式。有什么就直接 @ 我——bug 也好,功能建议也好,觉得缺什么也好,想让产品变得更好的任何想法都欢迎。喜欢什么、想要什么,我都非常乐意听。
Lenny Rachitsky: 太好了。Boris,非常感谢你今天的到来。
Boris Cherny: 好的,谢谢你,Lenny。
Lenny Rachitsky: 各位再见!非常感谢大家的收听。如果您觉得本期节目有所收获,欢迎在 Apple Podcasts、Spotify 或您常用的播客应用上订阅本节目。也希望您能为我们打分或留下评价,这将大大帮助更多听众发现这档播客。所有往期节目及更多节目信息,请访问 lennispodcast.com。我们下期见。
术语表
| 英文 | 中文 |
|---|---|
| A Deepness in the Sky | 《天渊》,Vernor Vinge 的科幻小说 |
| A Fire Upon the Deep | 《深渊上的火》,Vernor Vinge 的科幻小说 |
| Accelerando | 《Accelerando》,Charles Stross 的科幻小说(书名常保留原文,无通行中译名) |
| Acquired (podcast) | 《Acquired》播客(由 Ben Gilbert 和 David Rosenthal 主持的商业历史类播客) |
| agent | 智能体(能够自主执行多步任务的 AI 系统) |
| AGI (Artificial General Intelligence) | 通用人工智能(AGI) |
| alignment | 对齐(AI 安全领域,指确保模型行为符合人类意图与价值观) |
| ASL-3 (ASL3) | ASL-3(Anthropic Safety Level 3,Anthropic AI 安全等级三级) |
| assembly code | 汇编代码 |
| batch tool | 批处理工具 |
| binary | 二进制 |
| builder | 构建者 |
| Claude Code | Claude Code(保留原名,Anthropic 旗下 AI 编程工具) |
| Claudify (clify) | Claude 化(动词,指让 Claude 来完成某项任务) |
| Codex | Codex(OpenAI 旗下代码生成产品) |
| commit | 提交(commit) |
| conversational AI | 对话式 AI |
| Cowork | Cowork(保留原名,Anthropic 旗下 AI 协作产品) |
| Cursor | Cursor(AI 代码编辑器产品) |
| daily active users | 日活用户 |
| developer intelligence platform | 开发者智能平台 |
| early adopter | 早期采用者 |
| FAANG companies | FAANG 大厂(Facebook、Apple、Amazon、Netflix、Google 等大型科技公司的合称) |
| Facebook Dating | Facebook 交友(脸书交友功能) |
| Facebook Marketplace | Facebook Marketplace(脸书二手交易平台) |
| fine-tune | 微调(对预训练模型进行针对性训练以适应特定任务) |
| first principles | 第一性原理 |
| form factor | 产品形态 |
| functional programming | 函数式编程 |
| generalist | 通才 |
| heap snapshot | 堆快照 |
| IDE (Integrated Development Environment) | 集成开发环境(IDE) |
| Jevons Paradox | 杰文斯悖论 |
| just-in-time program | 即时编写的程序 |
| latent demand | 潜在需求 |
| literacy | 识字率 |
| LM (Language Model) | 语言模型 |
| maximum effort | 最高算力模式(Claude Code 中启用最大计算资源投入的设置项) |
| MCP (Model Context Protocol) | MCP(模型上下文协议) |
| mechanistic interpretability | 机制可解释性(通过分析模型内部神经元等结构来理解其行为的研究方法) |
| memory leak | 内存泄漏 |
| MetaView | MetaView(AI 招聘工具) |
| multi-Clauding (multi-quading) | 多开 Claude(指同时并行运行多个 Claude Code 会话) |
| on distribution | 在分布内(指模型行为与训练分布保持一致) |
| piman(ピーマン) | 青椒(日语外来词,指甜椒/柿子椒,在日本农贸市场常见的季节性蔬菜) |
| plan mode | 计划模式(Claude Code 中让模型先规划、不直接写代码的工作模式) |
| post-training | 后训练 |
| printing press | 印刷机 |
| programming abstraction | 编程抽象 |
| prompt | 提示词(输入给语言模型的指令或上下文文本) |
| psychological safety | 心理安全感 |
| pull request (PR) | 拉取请求(PR) |
| punch cards | 打孔卡 |
| race to the top | 争先竞优(Anthropic 内部术语,指通过公开分享安全研究成果带动整个行业提升安全标准) |
| regression | 性能回退 |
| research preview | 研究预览版(产品早期发布形式,用于在真实世界中收集数据并验证安全性) |
| sandbox | 沙箱(受限的隔离运行环境,防止智能体越权访问系统资源) |
| scaffolding | 脚手架(围绕模型构建的外部控制逻辑与工作流框架) |
| scaling laws | 规模化定律 |
| scribes | 抄写员 |
| Seer | Seer(Sentry 的 AI 调试智能体) |
| SemiAnalysis | SemiAnalysis(科技行业分析机构) |
| Sentry | Sentry(应用监控平台) |
| singularity | 奇点(技术奇点,指 AI 超越人类智能的假设临界点) |
| stakeholder alignment | 利益相关方的协调对齐 |
| superposition | 叠加(神经网络中单个神经元同时对应多个概念、多个神经元共同表征复杂概念的现象) |
| telemetry | 遥测数据 |
| terminal | 终端 |
| The Bitter Lesson | 《苦涩的教训》 |
| Threads | Threads(Meta 旗下社交媒体平台) |
| tokens | token(AI 模型的计算用量单位) |
| transfer (learning) | 迁移(学习)效应 |
| Twitter/X | Twitter/X(推特,现已更名为 X) |
| type system | 类型系统 |
| virtual machine | 虚拟机 |
本期内容时间轴:
- Boris 与 Claude Code 简介
- Boris 为何短暂离开 Anthropic 加入 Cursor(以及他回归的原因)
- Claude Code 的一周年回顾
- Claude Code 的起源故事
- AI 正以多快的速度改变软件开发
- 实验精神在 AI 创新中的重要性
- Boris 当前的编程工作流(100% 由 AI 完成代码)
- 下一个前沿
- 快速创新的代价
- Claude Code 团队的行动原则
- 为何应该给工程师提供无限 token
- 编程技能在未来还重要吗?
- 用印刷机类比 AI 的影响
- AI 接下来将改变哪些职业?
- 在 AI 时代脱颖而出的建议
- 投票:哪些职业因 AI 而更享受工作
- 产品开发中的潜在需求原则
- Cowork 如何在短短 10 天内构建完成
- Anthropic AI 安全的三个层次
- AI 智能体不工作时的焦虑感
- Boris 的乌克兰根源
- 构建 AI 产品的建议
- 高效使用 Claude Code 的进阶技巧
- 对 Codex 的看法
- Boris 的后 AGI 时代规划
- 闪电问答与结语
参考资料: • Cursor:https://cursor.com • Cursor 的崛起:年收入 3 亿美元、工程师欲罢不能的 AI 工具 | Michael Truell(联合创始人兼 CEO):https://www.lennysnewsletter.com/p/the-rise-of-cursor-michael-truell • Anthropic:https://www.anthropic.com • Anthropic CPO 谈未来展望 | Mike Krieger(Instagram 联合创始人):https://www.lennysnewsletter.com/p/anthropics-cpo-heres-what-comes-next • 《Claude Code 是拐点》:https://newsletter.semianalysis.com/p/claude-code-is-the-inflection-point • Spotify 称其顶尖开发者自去年 12 月起已不再手写一行代码,AI 功不可没:https://techcrunch.com/2026/02/12/spotify-says-its-best-developers-havent-written-a-line-of-code-since-december-thanks-to-ai/ • Anthropic 联合创始人谈离开 OpenAI、AGI 预测、亿元人才争夺战、20% 失业率及令他夜不能寐的噩梦情景 | Ben Mann:https://www.lennysnewsletter.com/p/anthropic-co-founder-benjamin-mann • Haiku:https://www.anthropic.com/claude/haiku • Sonnet:https://www.anthropic.com/claude/sonnet • Opus:https://www.anthropic.com/claude/opus • Jenny Wen 的 X 主页:https://x.com/jenny_wen • Johannes Gutenberg:https://en.wikipedia.org/wiki/Johannes_Gutenberg • Anthropic 招聘:https://www.anthropic.com/careers/jobs • Lenny 在 X 上的 AI 投票帖:https://x.com/lennysan/status/2020266745722991051 • Fiona Fung 的 LinkedIn:https://www.linkedin.com/in/fionafung • Brandon Kurkela 的 LinkedIn:https://www.linkedin.com/in/bkurkela • Cowork:https://www.anthropic.com/webinars/future-of-ai-at-work-introducing-cowork • Chris Olah 的 X 主页:https://x.com/ch402 • 《苦涩的教训》:http://www.incompleteideas.net/IncIdeas/BitterLesson.html ……更多参考资料见:https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens
节目制作与推广:https://penname.co/ 播客赞助合作请联系:podcast@lennyrachitsky.com
Lenny 可能持有节目中提及公司的投资份额。
此文章由 AI 翻译