走进 ChatGPT:历史上增长最快的产品 | Nick Turley(OpenAI)

Nick Turley 2025-08-09

走进 ChatGPT:历史上增长最快的产品 | Nick Turley(OpenAI)


开场精选

Lenny Rachitsky: 你曾在 Dropbox 和 Instacart 做产品负责人,现在你管理着历史上最具影响力的产品。

Nick Turley: 我来这里时不知道自己要做什么,因为当时还是个研究实验室。我的第一个任务是修窗帘,大概就是那种活儿。

Lenny Rachitsky: 有人给你一艘火箭的时候,别问坐哪个座位。

Nick Turley: 我们的目标是打造一个超级助手。它最初只是个 hackathon 代码库。

Lenny Rachitsky: 它原来叫什么?

Nick Turley: 原本打算叫 Chat with GPT-3.5,因为我们确实没觉得它会成为成功的产品。

Lenny Rachitsky: 然后 Sam Altman 就说,“嘿,让我发条推吧。”

Nick Turley: 这是 AI 的一个规律——你不发布就不知道该打磨什么。我的梦想是每天发布。

Lenny Rachitsky: 等大家听到这期节目的时候,就已经能用上 GPT-5 了。

Nick Turley: 每周大约有全球百分之十的人口在使用。规模越大,责任越大。它感觉更有活力了一些,更像人了一些。这个模型有品味。

Lenny Rachitsky: 你们的首席产品官(CPO)Kevin Weil 让我问你一个原则——“是不是做到了最大程度地加速?”

Nick Turley: 我就是想直奔结论——“为什么我们现在不能做这件事?“我一直觉得自己在这里的角色之一,就是设定节奏和静息心率。

Lenny Rachitsky: 大家都在想,“聊天界面是这一切的未来吗?”

Nick Turley: 聊天是当时最简单的发布方式。它的火爆程度让我困惑,更让我困惑的是有这么多人照搬。

Lenny Rachitsky: ChatGPT 现在给我的 Newsletter 带来的流量已经超过 Twitter。

Nick Turley: 那种能力带来了极强的用户留存。我一直对我们在搜索方面做的事情感到很兴奋。

Lenny Rachitsky: 能给我们透露一下长远来看它走向何方吗?

Nick Turley: ChatGPT 有点像 MS-DOS。我们还没做出 Windows,但一旦做出来,一切就会不言自明。

嘉宾介绍

Lenny Rachitsky: 今天的嘉宾是 Nick Turley。Nick 是 OpenAI ChatGPT 的负责人。他三年前加入公司,当时 OpenAI 主要还是一个研究实验室。他参与了 ChatGPT 构想的提出,并将它从零带到超过七亿周活跃用户、数十亿美元营收,可以说是人类历史上最成功、最具影响力的消费软件产品。Nick 非常了不起,但一直很低调。这是他第一次做大型播客访谈,你们一定会喜欢。我们什么都聊了,包括刚刚发布的 GPT-5。

感谢 Kevin Weil、Claire Vo、George O’Brien、Joanne Jang 和 Peter Deng 为这次对话建议了话题。如果你喜欢这个播客,别忘了在你喜欢的播客应用或 YouTube 上订阅关注。接下来,有请 Nick Turley。

GPT-5 发布

Lenny Rachitsky: Nick,非常感谢你来参加节目,欢迎。

Nick Turley: 谢谢邀请,Lenny。

Lenny Rachitsky: 我本来就有无数问题想问你,结果你们偏偏在我们录制这周发布 GPT-5。所以现在我至少有二十亿个问题了。希望你时间充裕。首先,恭喜发布。明天,也就是录制后的第二天,它就要上线了。恭喜。你感觉怎么样?我猜这背后是难以想象的工作量和压力,你还撑得住吗?

Nick Turley: 这周很忙,但我们已经为此工作了一段时间,所以能把它推出来感觉也挺好的。

Lenny Rachitsky: 等大家听到这期节目的时候,就能亲手用上 GPT-5——最新的 ChatGPT。用最简单的方式来说,它是什么,它解锁了什么,人们能拿它做什么?给我们讲讲吧。

GPT-5 的整体感受

Nick Turley: 我对 GPT-5 非常兴奋。我觉得对大多数人来说,它会感觉像一次真正的质变。如果你是一个普通的 ChatGPT 用户——我们本周有 7 亿用户——你可能已经用 GPT-4o 有一阵子了,甚至可能都不会去想驱动这个产品的模型是什么。而 GPT-5,感觉就是截然不同。我后面会讲很多具体细节,但归根结底,感觉很好,至少我们自己这么觉得。我们希望用户也有同样的感受。而且我觉得,越来越多地,这是大多数人注意到的方面,对吧?他们不会去看学术基准测试,不会去看评估指标。他们试用模型,看感觉如何。仅凭这一点,我就非常兴奋。我已经用了一段时间了,它也是我们发布过的最聪明、最有用、最快的前沿模型。

在纯粹的智能方面,一个衡量方式就是学术基准测试——无论是数学、推理还是纯粹的智能,在很多标准基准上,这个模型都是最先进的。我特别兴奋的是它在编码方面的表现,不管是 SWE-bench 这个常见基准,还是实际的前端编码,都非常非常好,我觉得这是 GPT-5 真正实现质变的一个领域。但不管你怎么衡量智能,它都相当出色,我认为人们会感受到这个升级,尤其是那些之前没用过 o3 的人。

实用性与体验

除了智能之外,第二点就是它真的很实用。编码是实用性的一个维度——不管你是有编程问题还是在 vibe coding 一个应用——但它也是一个非常好的写手。我靠写作谋生,对内对外都在写。我刚写了一篇长博客文章,周一发布的,而它是一个令人难以置信的编辑。与一些旧模型相比,它有品味,我觉得这非常令人兴奋。对我来说,这是日常工作中真正有用的东西。还有很多其他领域,比如它在健康方面是最先进的,需要的时候很有用,但话说回来,那种你无法真正用用例或数据来表达的东西,就是模型的体验感。它感觉更有生命力了一点,更像人一些,这种感觉很难用语言描述,直到你亲自试用才知道。所以,感觉很好。

速度与免费开放

如前所述,它更快了。它也会思考,就像 o3 一样,但你不需要手动告诉它去思考。它会动态地决定什么时候需要思考。当它不需要思考时,就直接即时回应,这最终让人感觉比使用 o3 快了不少。然后也许最令人兴奋的是,我们把它免费开放了,这是我觉得我们在 OpenAI 能独特做到的事情。因为很多公司,如果它们有像我们这样的订阅模式,会把它挡在付费计划后面。而对我们来说,如果我们能规模化,我们就会去做,这感觉太棒了。我们当初对 4o 也是这样做的。所以,希望明天所有人都能试用 GPT-5。

Lenny Rachitsky: 这样一个东西要花多长时间?我不知道是否有简单的答案,但你们做 GPT-5 做了多久了?

Nick Turley: 我们已经做了一段时间了。你可以把 GPT-5 看作是多个不同努力的集大成。我们有推理技术,我们有更经典的后筛选方法,因此,很难给它设定一个起点,但它确实是我们一段时间前就开始的多种不同技术的终点。

ChatGPT 的长期愿景

Lenny Rachitsky: 你能不能给我们透露一下 ChatGPT 的发展方向,GPT 整体的发展方向?从表面上看,它长期以来都是同一个想法配上一个更聪明的大脑。我很好奇它长期会走向哪里。

Nick Turley: 回顾一下,现在你会把 ChatGPT 看作一个”是否会成为无处不在的产品”——毕竟每周有大约 10% 的世界人口在使用。

Lenny Rachitsky: 我的天哪。

Nick Turley: 我们现在有 500 万企业客户了。它本身已经是一个独立的品类。但实际上,当我们起步的时候,我们的目标是构建一个超级助手,我们当时就是这么叫它的。事实上,我们使用的代码库叫 SA Server。它本来应该只是一个 hackathon 代码库,但事情总是会有点不一样的走向。所以在某些方面,那仍然是我们的愿景。我没有更多地谈论它的原因是,我觉得”助手”这个词在我们试图构建的心智模型中是有点局限的。你会想到一个非常拟人化的东西,可能是实用主义的,可能是一个……坦率地说,拥有一个助手对大多数人来说并不特别有共鸣,除非他们在硅谷是经理之类的。所以它并不完美。

但我们真正设想的是这样一个实体,它能帮你处理任何任务——不管是在家里、在工作中还是在学校,任何场景——而且它是一个了解你想要达成什么目标的实体。所以,不像现在的 ChatGPT,你不需要事无巨细地向它描述你的问题,因为它已经理解了你的整体目标,并且对你的生活有上下文了解等等。这是让我们非常兴奋的一件事。给它更多关于你生活的输入的反面,是给它更多的行动空间。所以我们很期待随着时间推移,让它能够做到一个聪明、有同理心的人用电脑能为你做到的事情。我认为,一旦你给它这样的工具访问权限,你能为人们解决的问题类型的上限,与今天聊天机器人能做的完全不同。这是更多输出的方面。

我经常想,好吧,如果我是通用智能,如果我变成了 Lenny 的实习生之类的会怎样?而我不会特别高效,尽管具备我刚才提到的这两项属性,因为我认为与这种技术建立关系这个理念也非常重要。所以,也许让我兴奋的第三块是构建一个真正能随着时间了解你的产品。你看到我们今年早些时候发布了改进的记忆功能,这只是我们希望做的开端,让它真正感觉这是你的 AI。所以我不知道”超级系统”是不是仍然是最精确的比喻,但我认为人们会把它当作自己的 AI。我认为我们可以把一个 AI 放进每个人的口袋里,帮助他们解决实际问题——不管是变得更健康,不管是创业,不管是任何事情上多一个第二意见。人们在日常生活中有太多不同的问题可以得到帮助,这就是激励我的东西。

助手而非替代者

Lenny Rachitsky: 所以我在这里读到一个有趣的弦外之音,愿景是让它成为人们的助手,而不是替代人们。这似乎是拼图中非常重要的一块。也许可以谈谈这个。

驾驭感与信任

Nick Turley: AI 对人们来说确实很可怕,我理解这一点——几十年来关于 AI 的电影已经在人们心中植入了某种思维定式。而且即便只看今天的技术,我认为每个人都有过这样的时刻:AI 做了一件对你而言非常私人的事情,你会想,“AI 不可能做到这个。” 对我来说,是一些冷僻的音乐理论问题——我当时想,“天哪,这东西对音乐的理解竟然比我更深,“而这恰恰是我热爱的领域。所以这种恐惧是很自然的。我认为长期以来对我们来说非常重要的一点是,构建一个让你觉得它在帮助你、但方向盘在你手里的产品。随着这些技术变得越来越具有 agent 能力,掌控感变得更加重要。这种感觉可以体现在一些小事上。

我们构建了一种在 AI 处于 agent 模式时观察它在做什么的方式。并不是说你真的会全程盯着它看,但它给你一个心理模型,让你觉得自己在掌控之中。就像坐 Waymo 的时候会有一块屏幕——在座坐过 Waymo 的人应该知道,你可以看到周围的车辆。你不会真的去盯着看,但它给你一种感觉——你知道这个东西是怎么运作的、正在发生什么。或者我们会让你确认操作,虽然有点烦,但它让你坐在了驾驶位上,这很重要。正因如此,我们始终把技术——以及我们构建的技术——视为放大你能力的工具,而非替代你的工具。而这一点随着系统变得越来越强大,会变得更加重要。

ChatGPT 的诞生

Lenny Rachitsky: 好的。你刚才提到了 ChatGPT 的早期。我在另一篇采访中读到——你加入 OpenAI 后,ChatGPT 最初只是一个内部实验项目,基本上是用来测试 GPT-3.5 的方式。然后 Sam Altman 就是说,“嘿,我发条推文吧,看看有没有人觉得这东西有意思,“诸如此类。我想它应该是历史上最成功的消费级产品了——无论是用户增长速度还是营收,都非常夸张。你能给我们讲讲那段早期时光吗?在它变成所有人都在谈论的东西之前?

Nick Turley: 好的。我们决定要做面向消费者的产品,我想大概是在 GPT-4 完成训练前后,主要有几个原因。我们当时已经有一个产品在市场上,就是开发者产品。那其实是我最初加入时负责帮助的方向,它对使命的推进也非常成功。事实上它已经成长起来了,现在就是 OpenAI 平台,大概有——我不确定——我认为四百万开发者。但在那个阶段还比较早期,而且我们遇到了一些限制,主要有两个问题。第一,你没法快速迭代,因为每次改模型都会破坏所有人的应用。所以做实验非常困难。

第二,学习也非常困难,因为我们收到的反馈是从终端用户到开发者再到我们,中间隔了一层。所以我们很难直接触达用户,而我们迫切希望朝着 AGI 快速推进,感觉需要和消费者建立更直接的关系。于是我们开始琢磨从哪里起步。按照 OpenAI 的经典风格——尤其是当时的风格——我们组织了一个 hackathon,召集了一批爱好者来基于 GPT-4 做各种尝试,看能做出什么酷的东西、也许可以交付给用户。每个人的想法都是某种超级助手的不同变体。有些想法更具体一些——比如我们做了一个会议机器人,可以拨入会议,长远愿景是也许它能帮你主持会议。我们做了一个编程工具——现在回过头来看,可能超前于时代了。但问题是,当我们测试这些更定制化的想法时,每次人们都想把它用来做各种其他事情,因为这本质上是一种非常、非常通用的强大技术。

所以经过几个月的原型开发之后,我们带着同一批志愿者重新出发——当时真的是一个志愿者团队。我们有超级计算团队的人,以前做过 iOS 应用;有研究团队的人,这辈子写过一些后端代码。他们都是最初 ChatGPT 团队的成员。我们决定做一个开放式的产品,因为我们只需要真实的用户使用场景和分布。我认为这是 AI 的一个规律——你必须先发布才能理解什么是可能的、人们想要什么,而不是靠事前推理。所以 ChatGPT 最终成型,根本原因就是我们想尽快获取学习经验。我们在假期前把它发布上线,打算回来后收集数据,然后关掉它。显然,后面的事情完全不是那样发展的,因为人们真的喜欢这个产品本身。

我记得经历了这样一个过程:先是”糟糕,监控面板坏了”——“等等,人们好像喜欢它”——“肯定只是一时爆红,热度会退的”——到”哇,人们在持续使用,但我不明白为什么”——然后最终我们进入了正经的产品开发模式,但这一切多少有点误打误撞。

Lenny Rachitsky: 哇,我之前不知道 ChatGPT 是从一个 hackathon 项目中诞生的。绝对是有史以来最成功的 hackathon 项目了。

Nick Turley: 我很喜欢在我们办 hackathon 的时候讲这个故事,因为我是真心希望人们觉得自己可以把想法做成产品发布出去。过去这确实是真的,我们会继续让这一点成真。

Lenny Rachitsky: 你不一定方便透露,但我很好奇那个团队都是谁。

Nick Turley: 团队的成员大部分还在。有些现在正在做 GPT-5 的研究人员,其实一直都是 ChatGPT 团队的一部分。工程师还在,设计师还在,我也还在,大概算吧。所以是的,当初的团队还在负责运作,但显然我们已经大幅成长了,也必须如此——规模带来了责任。我们很快就要达到十亿用户,你必须以匹配这个规模的方式行事。

关于增长的反思

Lenny Rachitsky: 好,让我在这方面多聊一会儿。我不确定这是不是百分之百准确,但我相信是这样的:ChatGPT 是历史上增长最快、最成功的消费级产品,也是对人们生活影响最大的。它感觉已经成为了社会氛围的一部分。我太太会跟它对话,我有什么问题就去问它,用语音模式。我太太就是一句”让我问一下 ChatGPT。“它已经深深嵌入我们的生活了,而我觉得现在还只是早期阶段。还有很多人根本不知道发生了什么。作为主导这个产品的人,你会不会偶尔停下来想一想,就觉得”天哪”?

Nick Turley: 我必须这样。能运营这样一个产品,是非常令人谦卑的经历。我经常需要掐自己一下确认这是真的。我也必须有时候坐下来纯粹思考——这在一切发展如此迅速的时候其实很难做到。我喜欢在公司里推动快节奏,但为了有信心做到这一点,我每周至少需要一天完全断联,只是思考该做什么、消化过去一周的种种。

另外一件事是,我从来没有做过一个本质如此依赖经验观察的产品。如果你不停下来去观察、去倾听人们在做什么,你会错过很多东西——包括实用性方面,也包括风险方面,实际上。因为通常来说,在你发布一个产品的时候,你已经知道它会做什么了。你不知道人们会不会喜欢它,那始终是经验层面的事,但你知道它能做什么。而对于 AI,因为我认为它很大程度上是涌现出来的,你在发布之后真的需要停下来倾听,然后根据人们尝试做的事情、以及那些还不太行的地方去迭代。所以,仅仅因为这个原因,我觉得停下来观察正在发生的事情是非常重要的。

Lenny Rachitsky: 好,所以你每周休息一天……不是休息。好吧,这么说不对。你是每周拿出一天思考时间,做深度工作。

Nick Turley: 我需要这样。对对对。而且我需要在周六彻底断联,或者类似这样。显然——

Lenny Rachitsky: 在周六[听不清]。

Nick Turley: 但不这样真的不行。这已经是一场长达三年的超级马拉松了。是的。

Lenny Rachitsky: 就像一场冲刺马拉松。

Nick Turley: 冲刺马拉松,没错,或者间歇训练之类的。我不知道该怎么准确描述 OpenAI 的发布节奏,但你必须以一种可持续的方式来安排自己。即使这不是 AI,没有我刚才提到的那些有趣特性,我认为你也需要这样做。但尤其是在 AI 领域,去观察尤为重要。

节奏与紧迫感

Lenny Rachitsky: 顺着这条线说,我跟不少和你共事的人聊过,那些在 OpenAI 工作的人。Joanne 特别提到,紧迫感和节奏是你做事方式的重要组成部分,是你非常看重的东西——不断在团队中营造紧迫感,即使你们已经是历史上增长最快的产品,增长得疯狂。聊聊你对团队中节奏和紧迫感重要性的理解吧。

Nick Turley: 她这么说真好。两件事。关于 ChatGPT,当我们决定做它的时候,我们已经做了很长时间的原型开发,我就说”十天内,我们要把这个东西发布出去”,然后我们做到了。所以那可能是一个特定时刻的决定,我当时真的很想确保我们去学到一些东西。从那以后,我花了很多时间思考 ChatGPT 为什么会在第一时间取得成功。我认为其中一个因素就是去执行——当时有很多其他公司在 LLM 领域拥有技术,但就是从来没发布过产品。我觉得在所有我们可以优化的维度中,尽可能快地学习是极其重要的。所以我开始围绕这一点凝聚团队,它的形式也经历过变化。

有一段时间,在我们那个规模的时候,我每天主持一个发布同步会,把所有需要做决策的人都拉进来,我们就讨论该做什么、跟昨天相比需要调整什么,等等。显然,到了某个阶段这种方式就不可扩展了,但我始终觉得我的角色中有一部分——当然是思考产品方向,但另一部分就是为团队设定节奏和静息心率。再说一次,这在任何地方都很重要,但当找出人们喜欢什么、什么有价值的唯一方式是把东西放到外部世界中去的时候,这就尤其重要。所以,正因如此,我认为这已经成为 OpenAI 的一项超能力。我很高兴 Joanne 认为我在其中起了一些作用,但这确实是众人合力之功。

Lenny Rachitsky: 我很喜欢这个说法,“团队的静息心率”。这是一个完美的比喻——节奏就相当于你的静息心率。

Nick Turley: 实际上这是我在 Instacart 学到的。我到那里的时候,正值疫情期间,全员上阵。有一段时间,有这样一个……我觉得有一个全公司范围的站会,因为我们解散了所有团队,只是想维持网站不崩。对我来说,我之前习惯了从容不迫、对事情深思熟虑,这很重要,但我真的在那里学会了快节奏行事,我觉得这在 OpenAI 派上了用场。

“是否已最大程度加速?”

Lenny Rachitsky: 好。顺着同样的思路,我问了你们的 CPO Kevin Weil 该问你什么,他说要问你一个原则——“是否已最大程度加速?“聊聊这个。

Nick Turley: 有意思,我们现在据说已经有了一个专门的 Slack emoji,因为我老是说这句话。现在,我尝试换种说法。有时候我真的想直接跳到结论:“好,为什么我们不能现在就做?“或者”为什么不能明天做?“我觉得这是一种很好的方式,可以穿透团队面前的大量阻碍,并且灌输一种……尤其是当你的团队成员来自大公司。在某个阶段,我们开始从大型科技公司招人。我觉得他们习惯了”一周后再看看这事”,或者”下个季度再回头看看能不能上计划”。而我只是把它当作一个思维练习,总是希望人们问自己:“好,如果这是最重要的事情,而且你真的想把它最大程度地加速,你会怎么做?“这并不意味着你就真的那么去做,但它确实是一个很好的强制函数(forcing function),帮助你理解什么是关键路径(critical path),什么可以之后再做。我一直觉得执行力极其重要。这些想法到处都是。每个人都在谈论个人 AI,你可能也看到了相关新闻,我真的认为执行力是这个领域中最重要的事情之一,而这就是一个工具。所以,它变成了一个梗还挺有意思的。就是一个小小的粉色 Slack emoji,人们把它贴在任何他们想推动这个问题的地方。

Lenny Rachitsky: 我正想问,什么主题[听不清]。所以是个粉色的,里面是不是有什么——

Nick Turley: 是一个 Comic Sans 字体的 emoji,上面写着”这是否已最大程度加速?”

Lenny Rachitsky: 好。所以这种文化就是,当有人在做什么的时候,推动力就是”这是否已最大程度加速?有没有办法做得更快?有什么可以解除的阻碍?”

Nick Turley: 对。而且我们谨慎使用这个概念,对吧?因为它需要符合上下文。有些事情你不想尽可能快地加速,因为你确实需要流程。在这方面我们非常非常审慎——流程是一种工具。我们在安全领域有大量的流程。因为 A,风险已经很高了,尤其是这些模型,GPT-5 作为前沿模型在很多不同维度上都是如此。B,如果你相信指数级增长——我相信,大多数做这行的人也相信——你必须提前演练,为那个你确确实实需要流程的时刻做好准备。这就是为什么我认为将产品开发速度——这必须非常高——与前沿模型等方面区分开来非常重要。对于前沿模型,确实需要严格的流程:你要做红队测试(red team),编写系统卡片(system card),获取外部意见,然后在确认它经过了正确的安全保障之后才发布。

所以,再说一次,这是一个有微妙之处的概念,但我发现它在需要的时候非常有用。而对于所有产品开发来说,不这样做你基本就死定了,所以把东西发出去很重要。

Lenny Rachitsky: 我们得把这些表情包开源,这样其他团队也能在此基础上建立类似的方法。

Nick Turley: 绝对的。

ChatGPT 的留存率

Lenny Rachitsky: 有趣的是,ChatGPT 不仅是有史以来增长最快、最成功的消费级产品——这一点毫不令人意外——而且它的留存率也极高。有人分享过一些数据,说一个月留存率大约是 90%,六个月留存率大约是 80%。首先,这些数字准确吗?你能分享些什么?

Nick Turley: 显然我能分享的具体数字有限,但我们的留存数据确实非常令人振奋,而且这确实是我们重点关注的指标。我们完全不在乎你在产品里花多少时间。事实上,我们的激励机制就是帮你解决问题,如果你真的喜欢这个产品,你会去订阅,但没有任何动机让你在产品里停留过久。当然,如果在长期来看——三个月、更长时间之后——你还在持续使用这个东西,那我们显然非常、非常高兴。对我来说,这在早期一直是一个显而易见却没人提的问题——“嘿,这可能是一个非常酷的产品,但这真的是那种你会反复回来使用的东西吗?“所以我们不仅看到了强劲的留存数据,而且随着我们的用户群体从早期采用者逐渐变成普通大众,留存率还在持续提升,这确实令人难以置信。

Lenny Rachitsky: 对,这一点我觉得人们并不真正理解这有多罕见。一个产品,用户群体来了,试用了,然后留存率随时间下降,之后又重新回升——几个月后人们回来了,用得更多了。这叫做微笑曲线(smiling curve),极其罕见。

Nick Turley: 对,对。团队这边确实也有一些令人开心的事情。我觉得在技术层面,其中一部分并不完全是产品本身的原因。我认为人们实际上正在以一种非常有趣的方式逐渐习惯这项技术。我发现——这也是产品需要不断演进的原因——向 AI 委托任务这个想法,对大多数人来说并不自然。它不像你在日常生活中会去想”我能把什么委托出去”。硅谷的某些圈子里确实会这样做,因为他们处于自我优化的模式,试图把能委托的一切都委托出去。但我认为对世界上大多数人来说,这其实相当不自然。你真的需要去学习——“好,我真正的目标是什么,另一个智能体能帮我做什么?”

我认为这需要时间,而当人们与产品相处足够久之后,他们确实会弄明白。但当然,我们也做了大量产品层面的工作,无论是让核心模型变得更好,还是推出搜索、个性化之类的新功能,或者只是标准的增长工作——这些我们也正在开始做。它们当然也很重要。

模型即产品

Lenny Rachitsky: 你可能已经在回答这个问题了,但我还是直接问一下。人们可能会看到这个现象然后想——“好吧,他们在这种神一般的智能之上构建了某种产品层,当然它会增长得飞快、留存也会惊人。你们到底在这个模型之上做了什么,让它增长这么快、留存这么高?“有没有什么效果特别好、显著推动了指标的东西可以分享?

Nick Turley: 有一点我们学到的——我一会再回答那个问题——但我们在 ChatGPT 身上学到的一件事是,模型和产品之间确实没有区别。模型就是产品,因此你需要像对待产品一样去迭代它。我的意思是,显然你通常会先发布一个很开放的东西,至少如果你是 OpenAI 的话,这算是一种标准打法。但接下来你真的需要观察人们在试图做什么——好,他们在写作,他们在编程,他们在寻求建议,他们在找推荐,你需要系统地改善这些用例。这和产品开发工作非常相似。当然方法论有些不同,但发现问题的过程是一样的——你得和用户交流,你得做数据分析,你得尝试各种东西并获得反馈。

所以我们一直有意识地在做的一块工作,就是改善模型在人们关心的用例上的表现。当然还有所谓的感觉层面,我相信你也知道——这也是我对 GPT-5 感到兴奋的原因之一——就是那种感觉非常好。所以我们有一个模型行为团队,他们专注于这个模型的个性是什么,它说话和表达的方式如何。我粗略地说,这类工作大概占了我们所见留存改善的三分之一左右。然后我认为另一个三分之一是我所说的产品研究能力——它们确实是以研究驱动的,有研究成分,但实际上是新的产品功能或能力。搜索就是一个例子。如果你还记得以前,大概 20 个月前,你跟 ChatGPT 聊天,它会说什么”截至我的知识截止日期……”或者”我无法回答这个,因为这件事发生得太近了”之类的话。正是这类能力极大地提升了留存,原因也很充分——它就是让你能用这个产品做更多事情。个性化也是,比如高级记忆(advanced memory)这个想法,它可以随着时间的推移真正了解你,是另一个类似能力的例子。我觉得这是另一个大的部分。然后第三块就是你在任何产品中都会做的事情,这些当然也存在。不需要登录就是一个巨大的成功点,因为它消除了大量摩擦。我觉得我们从一开始就有这种直觉,但一直没做到,因为没有足够的 GPU 或其他资源限制让我们真正去实施。所以传统的产品工作也是有的。所以我经常把它大致想成三个三分之一,但实际上我们还在不断学习,而且我们计划对产品做大量演进,所以我确信会出现新的增长杠杆。

从决策到上线:十天

Lenny Rachitsky: 你提到了一件我想快速回过头来聊一下的事。你说从 hackathon 到 Sam 发推说 ChatGPT 上线,大概只有 10 天?

Nick Turley: hackathon 发生的时间要早得多,我们做了很长时间的原型开发。但到了某个时候,我们基本上对试图构建更定制化的东西失去了耐心。再说一次,这主要是因为每次我们测试的时候,人们总想用它做各种其他的事情。所以,从我们决定要发布到实际发布,确实是 10 天。至于那个研究,我们已经测试了很长时间,它是从我们所说的指令遵循(instruction following)演化而来的——也就是这些模型不只是补全句子,而是能真正遵循你的指令。所以如果你说”总结一下这个”,它就真的会去做。后来研究从那演化成了对话格式,可以进行多轮交互。所以那个研究花的时间远不止 10 天,一直在后台慢慢酝酿,但把这个东西产品化的过程非常、非常快,很多东西都没来得及塞进去。

把模型当成产品来迭代

Nick Turley: 我记得当时没有历史记录功能,这当然也是我们收到的第一条用户反馈。模型还有很多不足之处,但能够对模型进行迭代改进,这种感觉太棒了。我刚才说的那件事——把模型当作产品来对待——在 ChatGPT 之前根本不存在,因为以前我们的发布方式更像是硬件发布:发布一个 GPT-3,然后开始做 GPT-4,都是那些周期特别长、投入巨大的研发项目,规格就是当初定的规格,然后你得再等一年。而 ChatGPT 真正打破了这种模式,因为我们能够像做软件一样对它进行迭代改进。说真的,我的梦想是——如果我们能像软件行业那样每天甚至每小时发布更新,那将非常棒,因为你可以随时修复问题等等。但要在保持模型个性不变、不导致其他能力退化的前提下做到这一点,当然有各种各样的挑战。所以,这是一个还需要继续探索的开放领域。

Lenny Rachitsky: 这真是一个”是否做到了最大化加速”的好例子——好,我们就 10 天内发布 ChatGPT。

Nick Turley: 对——

聊天是终极界面吗?

Lenny Rachitsky: 哇。我们一直在聊 ChatGPT,显然它是一个聊天界面。大家一直在好奇:聊天是这一切的未来形态吗?有趣的是,Kevin Weil 曾经在播客上提出了一个非常深刻的观点,一直让我印象深刻。他说,对于构建在超级智能之上的产品来说,聊天其实是一个天才般的界面,因为它正是我们与各种智力水平的人类互动的方式——从智力较低的人到极其聪明的人,它都能覆盖。因此,作为一个能覆盖这个广阔光谱的交互方式,它非常有价值。也许你可以聊聊这个话题,以及聊天是否是 ChatGPT 长期的交互形式——毕竟它叫 ChatGPT。

Nick Turley: 我觉得我们迟早得把”Chat”或者”GPT”其中一个词去掉,因为合在一起实在太拗口了。这个名字我们算是被定住了,但不管怎样,产品本身会持续进化。我同意自然语言确实有某种深刻的东西——它确实是人类之间最自然的沟通方式,因此用自然语言与你的软件沟通,这件事感觉很重要。但我认为那和”聊天”是不同的。聊天在当时是最简单的交付方式。我对”聊天”这个概念能如此火爆感到困惑,更困惑的是那么多人直接复制了这个范式,而不是去尝试不同的 AI 交互方式。我仍然希望这会发生。所以我认为自然语言会一直存在,但这种一来一回的轮次式聊天交互,我认为是非常受限的。

这也是我不太喜欢那个”超级智能助手”类比的原因之一——虽然我们以前也经常用这个类比——因为如果你那样想,你就会觉得自己在跟一个人说话。而 GPT-5 在生成优秀的前端应用方面已经非常出色了。所以我不觉得有什么理由不让 AI 以某种方式渲染自己的界面。当然你要让这感觉可预期、体验良好。但把最终极的交互形式定义为聊天机器人,我觉得是局限的。甚至有点反乌托邦的感觉——我不想通过某个代理界面来使用所有软件。我喜欢待在 Figma 里,我喜欢待在 Google Docs 里,那些对我来说都是很棒的产品,而它们不是聊天机器人。

所以,对自然语言说”是”,对聊天说”否”——这就是我的立场。我整体上也希望看到更多关于人们如何与 AI 交互的消费端创新,因为可能性太多了,你只需要去尝试。聊天之所以成功,就是因为我们就这么做了,然后人们喜欢它。所以我希望我们会看到更多探索,我们也会尽自己的一份力。

那些改变历史的偶然决定

Lenny Rachitsky: 你提到你们算是被”ChatGPT”这个名字定住了。也许我接下来的问题能部分回答这一点,但我很好奇——你们早期有没有做出过什么偶然的决定,后来却一直延续下来,基本上改变了历史?

Nick Turley: 太多了。而且很好笑的是,你当时根本没有时间去深思熟虑,但它们后来却产生了超级重大的影响。名字就是其中一个,我们前一天晚上才从”Chat with GPT-3.5”改成了”ChatGPT”——稍微好了一点,但说实话还是不太好。

Lenny Rachitsky: 之前叫什么?

Nick Turley: 之前打算叫”Chat with GPT-3.5”,因为我们真的没觉得它会成为一个成功的产品。我们实际上是想让它看起来尽可能极客,因为它的本质确实如此——它是一个研究演示,不是一个产品。所以我们不觉得那样有什么不好。但我认为在最初的发布中,让它免费是一个重大决定。我们现在可能不太能意识到这一点,因为 GPT-3.5 模型在那之前至少已经在我们的 API 里放了六个月了。我觉得任何人都本可以构建出类似的东西,也许在模型层面没有那么好,但我觉得也会火起来。所以让它免费再加上一个好看的界面,在你现在看来理所当然的事情里,其实是影响深远的。这也是为什么我认为,即使在 2025 年,分发渠道和界面依然持续重要。

付费业务也是,现在它在消费端和企业端都已经成为一个巨大的业务。但它的诞生仅仅是为了挡住一部分需求——起初根本不是我们坐下来头脑风暴”AI 最好的变现模式是什么”。它真正要解决的是:什么样的机制能让我们筛掉那些不那么认真的用户,把资源留给真正想好好使用的人?订阅制恰好具备这个属性,然后它就长成了一个庞大的业务。我觉得另一个重要的是在功能还没打磨好的时候就发布那些很粗糙的能力——这看起来是一个战术决策,但它后来变成了一套方法论,因为我们从中学到了太多东西。还记得我们发布 Code Interpreter 的时候,发布之后我们学到了大量东西。现在它在 ChatGPT 里叫”数据分析”之类的名字,就是因为我们拿回了真实世界的使用场景,然后才能有针对性地优化。所以我觉得随着时间的推移,有很多决定最终被证明影响深远,但我们当时做决定的速度非常非常快,因为我们不得不如此。

Lenny Rachitsky: 每月 20 美元的定价感觉也是其中很重要的一部分,感觉现在所有人都在照搬——

Nick Turley: 说到这个,我记得我当时有一种恐慌发作的感觉,因为我们真的急需上线订阅制,因为那时候我们每次都不得不把产品下线。不知道你还记不记得,当时会出现那个失败页面——一个 AI 生成的小诗,像是宕机提示。所以大家说”我们得赶紧把这个推出来”。我记得我打电话给一位我非常尊敬、在定价方面极其厉害的人,问他”我该怎么办?“我们聊了很多,但我根本没时间把他的大部分建议整合进去。所以我做的事情就是,往 Discord 上发了一个 Google 表单,里面列了关于定价你应该问的那四个标准问题——

Lenny Rachitsky: 哈哈,真的假的?

Nick Turley: 对,没错。就真的只有那四个问题。我清楚地记得,第一,我们根据反馈得出了一个价格,这就是我们怎么定到 20 美元的。第二,第二天早上就有一篇媒体报道说”你绝对想不到 ChatGPT 团队用来定价的四个天才问题”……就好像他们比我们自己还懂似的。所以在这种极度公开的环境下做产品有一个特点——人们会赋予你的行为远超实际存在的意图性。不过我们最终选了 20 美元。当时也在讨论一个稍微高一点的价格。我经常想,如果当时不一样会怎样,因为后来有那么多公司都照搬了 20 美元这个定价。我就想,“我们是不是因为这个做法抹掉了大量市值?“但说到底我并不在意,因为让更多人用上这些技术才是最重要的。我认为在西方国家,对于很多人来说,考虑到他们获得的价值,这个价格点是合理的。

最重要的是,我们能够定期将一些功能下沉到免费层级,只要能这样做我们就一定会做——

Lenny Rachitsky: 所以这个调查——给它一个正式的名称——Van Westendorp 价格敏感度测试,就是你们最终给 ChatGPT 定价的方式?

Nick Turley: 那就是 Google 搜索排名第一的结果。那时候 ChatGPT 还没有实时信息获取能力,否则它可能自己就能给自己定价了。最终就是 Discord 加 Google 表单加一篇关于那个方法论的博客文章,帮我们定下了价格。

Lenny Rachitsky: 太不可思议了。真是个好玩的故事。这个调查方法是 Superhuman 的 Rahul Vohra 在他的第一轮融资文章中推广开来的——

Nick Turley: 对,没错,确实是。千万别把我当定价专家请来这里,你们肯定能找到更合适的人。

Lenny Rachitsky: 不管对还是错,这已经是世界上增长最快、营收最疯狂的业务了。所以我觉得你不必太在意。

Nick Turley: 确实,结果不错。

Lenny Rachitsky: 结果确实不错。顺便说一句,我现在用的是每月 200 美元的档次,所以显然还有空间——

Nick Turley: 谢谢,谢谢。

从 Plus 到 Pro:200 美元档次的由来

Nick Turley: 那个档次的来历也很有意思。最初 Plus 订阅计划的目的是先保证服务可用时间,然后能够推出我们无法扩展到所有人的能力。到了某个节点,Plus 层级的用户已经多到我们失去了这个属性。所以我们推出 200 美元档次的主要原因是,我们有大量真正非常强大的研究成果,比如 o3 Pro,或者明天的 GPT-5 Pro——能有一个渠道把这些交付给真正在乎的人,这本身就很令人兴奋。虽然这在某种程度上违背了标准 SaaS 页面该有的样子,10 倍的价格跳跃确实有点突兀。所以谢谢你的订阅,也谢谢所有正在观看并订阅了任何一个档次的人,太好了。

更多幕后故事

Lenny Rachitsky: 我再抛个问题出来——还有没有其他类似的故事?你已经分享了 Chat with GPT-3.5 作为最初名称的精彩故事,还有定价是怎么来的。还有别的吗?

企业版 ChatGPT 的诞生

Nick Turley: 企业版也是一个有趣的故事。我们在企业端看到了惊人的采用率。说实话,同时尝试构建开发者业务、消费者业务和企业业务,这在客观上是疯狂的。但故事是这样的:在第一个月或第二个月,很明显大部分使用都是工作用途——实际上比今天多得多。现在产品上有大量消费者,已经在某种程度上渗透进了流行文化。但当时主要就是写作、编程、分析这类用途。我们很快就以有机增长的方式进入了 90% 的财富 500 强公司。我之前在 Dropbox 的时候——那是我两份工作之前的事了——见过类似的模式。自那以后,出现了更多的 PLG 公司。

但我们做企业版的真正原因是——还记得当时我们在争论应该做企业版还是应该推出 iOS 应用吗,因为团队就那么小。真正促使我们行动的是,我们开始被一些公司禁用了,因为它们觉得——无论对不对——隐私和部署等方面的保障还不成熟。所以我就说,“天哪,我们得做点什么。否则我们将错过一个世代级别的机会,去构建一个工作场景的产品。“而且我们实际上把 AGI 定义为在具有经济价值的工作中超越大多数人——或者大概类似这样的表述,但我觉得我们的定义大致如此。所以我感觉我们必须在那个领域有所布局。这在当时是一个相当快速的决定,但它已经成长为一块巨大的业务。我们刚达到了 500 万企业订阅用户,从一两个月前的 300 万涨上来的。所以它某种程度上已经成了一个独立生长的分枝,对此我感到非常非常兴奋——

同时运营多条业务线的取舍

Lenny Rachitsky: 要同时处理这么多东西——平台基本上就是 API、消费者产品、历史上增长最快最成功的产品,再加上 B2B 业务,这显然也是一块巨大的生意。你有没有什么经验法则,关于如何做出这些权衡、同时做所有这些事情、保持清醒并取得成功?

Nick Turley: 这是个好问题。首先,我已经不再负责开发者业务了。我们找到了一个比我更有能力的人来做这件事,他非常出色。所以我仍然负责各种形式的 chat 产品,但幸运的是,不需要做 OpenAI 面临的那些权衡。这个我之后也可以展开说,但至少让我稍微保持了一些理智。我想说的是,在做 AI 产品的时候,你基本上需要用两种不同的方式来工作。一种是从模型能力出发往回推导,这在很大程度上是艺术而非科学。我认为你真的需要审视我们手头有什么技术,然后用最棒的方式把它产品化。如果你把某种产品经理框架套在上面,我认为你会犯很大的错误。因为如果你拥有的技术——比如说,GPT-5 现在在前端编程方面非常非常强——这意味着你必须重新排优先级。你必须真正把这个能力展现出来。也许这体现在让 ChatGPT 更擅长 vibe coding 和渲染应用,也许这更像是利用模型的审美品味让 UI 更有表现力。我们可以做很多事情,但你必须重新规划和重新排优先级,而且这比任何特定的受众细分都重要。核心就是看我们手里有什么神奇的东西,然后怎么让它发光。

语音功能也是类似的。并不是说我们的客户需要语音功能、迫切地求着要,而是我们想到,“哇,我们找到了一种方法,让这些东西可以任意输入、任意输出。“用一种有创意的、棒极了的方式把它产品化,然后看看人们会怎么用它。所以我认为这是一部分。但另一部分则更像是经典的产品管理——你需要倾听客户的声音。而当你的客户群体非常多样化时,这可能会让人困惑,因为 ChatGPT 是一个非常通用的产品。


Nick Turley: 当你看终端用户的时候,会发现他们想要的东西实际上有大量重叠。像项目、历史搜索、分享与协作这样的基础功能,诸如此类的东西,实际上非常、非常普遍。不管你是在和工作中的人交谈,还是和家里的人、学校里的人交谈,有时机制上会略有不同,但大体上是相似的投资方向,我认为我们可以从中获得很大的收益。然后还有一些企业级专用的工作是我们必须做的。你得做 HIPAA 合规,你得做 SOC 2,如果你想成为严肃的参与者,这些事情都得做。这些都是没有商量余地的。所以,正如你正确指出的那样,这确实很复杂,但这也是一种诅咒——因为你在做的是一项非常开放且强大的技术。

OpenAI 里有一位我很尊敬的人打了个比方,他说,“我们有点像迪士尼。迪士尼有一种核心创意资产,就是他们的内容,然后他们有游轮、有主题乐园、有漫画,有各种各样不同的东西。“我觉得我们有出色的模型,但有各种不同的方式可以把它们产品化,我们基本上就是要最大化在所有这些不同方向上的影响力。

Lenny Rachitsky: 听你说的时候我在想,通常那种非常通用、什么都能做的横向平台需要很长时间才能起飞,因为人们不知道拿它们做什么。它们在任何一方面都不是特别出色。而这是一个了不起的反例——它立刻就起飞了,每个人都搞明白了怎么用,然后随着时间的推移,人们又越来越多地发现了新的用法。

Nick Turley: 但我觉得原因就在于它直接上线了。说到另一个产生重大影响的决策——我们当时在讨论要不要设等待列表,因为——

实际上我们当时在讨论要不要设等待列表,因为我们确实知道工程系统扛不住那样的规模。而最终没有设等待列表——在这之前 OpenAI 的任何发布都没有这样做过——结果这件事产生了重大的影响,因为你能够实时看到所有人都在用它做什么。所以我觉得,当你对所有人同时发布这些东西的时候,确实会出现一个特殊的时刻,你可以看到其他人在做什么并从中学习。

而这其中很多实际上发生在产品之外。TikTok 上那些疯传的帖子下面有差不多两千条评论,列出了各种用例。我会仔细看那些内容,因为那些用例我自己也并不了解。它们是非常、非常涌现式的,我就是一条一条翻看评论去消化,因为能学到的东西太多了。正因如此,我觉得我们在一定程度上跳过了”空盒子”问题,因为大量的学习发生在产品之外——人们在现实生活中或线上互相观摩。

Lenny Rachitsky: 这太有意思了,因为你想想 Airtable,想想 Notion,这些公司花了数年时间来构建、打磨、思考、深耕自己的产品到底可以是什么。

Nick Turley: 就好比 Airtable,他们不得不做模板,不得不做各种各样的事情,把一个横向产品变成以用例为驱动的。相比之下,ChatGPT 更像是 Instant Pot(一种多功能电压力锅),到处都有人在线分享食谱,围绕它形成了一整个生态系统。我觉得我们真的很幸运,ChatGPT 也发生了同样的事情——用户到处在和其他用户分享用例。因此我觉得我们很幸运,在这个进程中直接跳到了前面。

Lenny Rachitsky: 感觉其中一个因素是 Sam 有庞大的粉丝基础,所有人都会关注你们发布的任何东西。所以这是一种非常有意思的发布横向产品的新策略——拥有一个巨大的分发渠道,直接发布,然后看会冒出什么来。

Nick Turley: 是的。当然,实际上我也很期待把其中一些东西融入到产品中去。我觉得我们不应该仅仅因为产品之外有这么多的使用场景发现就安于现状。我其实认为,对于普通消费者来说,如果产品本身能多做一些工作,真正向用户展示什么是可能的,那将会非常棒。

我仍然觉得 ChatGPT 有点像 MS-DOS,我们还没建成 Windows。等我们做出来的时候会一目了然,但现在确实有一种感觉……想象一下 MS-DOS 突然爆火,然后你只是往上面硬凑各种对话开场白。这可能就错过了真正向人们传达功能与价值的大方向。所以我认为,除了看着用例自发传播之外,我们实际上还有大量的产品工作要做。

Lenny Rachitsky: 你能分享一下你觉得那会是什么样子吗?这个 Windows 版的 ChatGPT?

Nick Turley: 等我们搞明白了我会告诉你的。我们正在招人。我觉得这里有太多有趣的产品问题了。

Lenny Rachitsky: 好的,明白了。顺便说一句,我也很喜欢 TikTok 成了你们的反馈渠道这件事。

Nick Turley: 那些评论区的内容真的很疯狂。还有人们对产品的热爱,分享使用产品时那种兴奋的心情——人们如此兴奋地分享他们用你的产品做的事情,我觉得这很特别。我不会把这视为理所当然。

发现新兴用例的方法

Lenny Rachitsky: 你们现在是怎么发现新兴用例的?我猜量非常大。你有没有什么诀窍来判断,“哦,这是一个我们真的应该认真想一下的新东西”?

Nick Turley: 在我组建产品团队之前,我先组建了数据科学团队,因为我当时很沮丧。我在尽可能多地和用户交谈。ChatGPT 上线后的那几周,我的日历上全是十五分钟一个的用户访谈,整个星期排得满满的。通常我在能够预测下一个人要说什么的时候就会停止访谈——这就是我知道自己已经和足够多用户聊过的方法。但那次就是停不下来,我不断得到新的信息。

所以数据是一条出路,我认为我们有一些对话分类器,不需要我们亲自查看对话,就能帮助我们了解人们在聊什么、哪些用例正在兴起等等。我觉得这非常有帮助。但这些东西的质量对于建立共情很重要。即使你永远不可能穷尽人们所有的用例,我仍然花大量时间做这件事。然后,像那些 TikTok 视频、帖子合集之类的,我觉得也非常非常有用。看人们互相讨论各自用例真的很有趣。

Lenny Rachitsky: 有没有什么新的边缘用例让你感到兴奋?或者有没有一种你觉得很有意思、值得分享的非常规 ChatGPT 使用方式?

Nick Turley: 我之前提到过,我一直把 ChatGPT 想象成一个偏工作属性的产品,不管你是在家还是在公司。我觉得报税求助和你工作中做的事情非常类似,而规划一次旅行其实和在工作中规划一场活动也很像。所以我一直觉得,“好,这个东西大概会是一种生产力工具。”

然后几个月前我发现情况开始发生了变化。我真的觉得,消费者开始转向用这个东西获取日常建议、帮助他们改善关系……有人说这个东西拯救了他们的婚姻,这让我非常兴奋,因为他们用它来梳理自己的情绪、获取关于沟通方式的反馈。他们就是有一个伙伴,可以谈论那些非常困难的事情。这伴随着巨大的责任,我们需要做大量工作才能把这些诸如生活建议之类的功能做好,但这对我来说也非常非常重要,因为你不能回避这些用例,你必须迎难而上,把它们做好。这也是我们正在努力的方向。所以这种涌现行为真的非常酷。

更广泛地说,我对教育领域非常兴奋,对健康领域也非常兴奋。我觉得如果我们不抓住这个机会,用 ChatGPT 真正地帮助人们,那将是一种浪费。我认为我们才刚刚触及了表面。所以还有很多我想要实现的愿景用例。

Lenny Rachitsky: 顺着这个话题,我最近有一个很有意思的用例,我觉得它对夫妻之间有分歧、需要第三方意见的时候会特别有用。我最近就遇到了——我妻子说:“你不能把一整份东西放进微波炉加热、只吃一部分,然后再把剩下的放回冰箱。“我说:“有什么问题?加热一下再放回去不就行了。“她说:“不行,那很危险。“我说:“我们问问 ChatGPT 吧。“她现在如此信任 ChatGPT、一整天都在依赖它,它作为我们可以求助的第三方独立角色,真的非常有价值。

Nick Turley: 对,完全同意。而且很多这类微交互,说到有趣的产品工作——这些微交互其实很重要。它是给出了一个明确的判断,还是帮助你们理清了分歧、让你们自己解决了问题?我认为这些细节实际上非常重要,也是我们花大量时间在研究的地方。

Lenny Rachitsky: 顺着这个话题,之前推出了一个极度谄媚版的 ChatGPT,就是那种”你是世界上最棒的人,你说的每句话都无比正确”。你能告诉我们到底发生了什么吗?

Nick Turley: 可以,我们在网上发布了大量相关材料,因为我们真的觉得应该充分沟通——我们是如何发现问题的、采取了什么措施等等。所以我鼓励大家去看一下。我们对那次模型发布做了一次完整的复盘。

基本上发生的事情是,我们推送了一个更新,让模型更倾向于对你说一些当下听起来很舒服的话——“你完全正确,你应该跟你男朋友分手”之类的。这真的很危险。我们对这件事的重视程度甚至可能超出你的预期,因为说实话,在目前的技术水平下,你可能会一笑置之。也许觉得就是,“哈哈,这东西老是夸我。我还以为只有我这样,后来看到网上那些评论才知道不是。“但确保这些模型在优化正确的目标,这确实非常重要。

而且我认为我们拥有一种巨大的奢侈——我们的使命允许我们真正帮助人们,我们的商业模式并不激励最大化参与度或产品使用时长。所以我们非常看重的是,你觉得这个产品在帮助你实现目标——不管是你当前的目标还是长远目标。

而极度迎合用户很多时候其实并不服务于这个目的。所以我们引入了新的测量技术。每当我们将这些模型与现实接触、发现一个问题时,我们都会回过头来确保对这类事情有好的衡量指标。所以现在每次发布我们都会测量谄媚效率,确保不会倒退,并且持续改善这个指标。GPT-5 在这方面有改善,这让我非常兴奋,但我们还有更多工作要做。

更广泛地说,这件事促使我们清晰地阐述了自己的立场。我实际上花了不少时间写一篇博客文章,就是我们周一刚发布的那篇,讲的是我们在优化 ChatGPT 的什么。核心就是帮助你成长和实现目标,而不是让你一直留在产品里。所以这次事件带来了一系列好的结果。这也是一个很好的例子,说明与现实接触不仅对用例很重要,对学习应该避免什么也很重要——因为除非你真正听取了医生们的反馈,否则你永远不可能在纯实验室环境中发现这个问题。

Lenny Rachitsky: 那我很期待读那篇博客文章。我本来就想问你——

Nick Turley: 对,期待你的反馈。

Lenny Rachitsky: 嗯,我想问的是,关于这种……因为这种张力真的很难处理——让人感到被支持,但又不让他们认为自己想相信的一切都是对的。这方面你还能多分享些什么吗?就是如何找到那个中间地带。

Nick Turley: 激励机制很重要。有一句名言:“给我看激励机制,我就给你看结果。”

Lenny Rachitsky: 好像是 Charlie Munger 说的?

Nick Turley: 对,我觉得就是他说的。

Lenny Rachitsky: 对。

Nick Turley: 是的,我认为这一点非常重要。所以我会仔细审视我们的使命、我们的商业模式、我们正在构建的产品类型。我真的认为 ChatGPT 是一个非常特殊的产品,因为在绝大多数情况下,它让你离开时感觉更好而不是更差,让你觉得自己正在实现想做的事情。所以我认为这些激励机制真的很重要,因为它帮助你去推理——“好,当现实中出现了不好的行为时,那是一个 bug 还是有意为之?“而我可以很明确地说,对我们来说那就是一个 bug。


面向未来的工作

Nick Turley: 然后在面向未来的工作中,有太多棘手的场景需要处理好。你很容易就会回避这些使用场景。比如你和你妻子就某段关系中的问题或争议来寻求建议,如果你完全规避风险,你很容易就会说”抱歉,我没法帮你这个。“我认为大多数科技公司达到一定规模后就是这么做的,他们回避这些使用场景。我认为这是错失了帮助人们的机会。

所以我们想要迎难而上,通过让模型行为变得真正非常出色来拥抱这些使用场景。这可能意味着在你遇到困难时为你提供外部资源。这可能意味着不直接回答你的问题,而是给你一个有用的思考框架——比如”我应该和男朋友分手吗?“ChatGPT 大概不应该替你回答这个问题,但它应该像一个体贴的伙伴那样帮助你思考这个问题的不同维度。所以我认为做好这项工作真的很重要,因为我认为其积极影响是巨大的。

Lenny Rachitsky: 你说的这一点非常深刻——大多数公司,如果他们的用户想要问一些有风险的问题,比如获取医疗建议,或者”我应该和伴侣分手吗?“或者”我遇到这个大问题该怎么办?”

Nick Turley: 我觉得,如果你拥有一个在健康基准测试上达到 state-of-the-art 的模型——GPT-5 在一系列医学基准测试上确实是 state-of-the-art——而你却不利用它来帮助人们,只是因为你想要避免所有可能的负面影响而禁用了那个使用场景,我们会感到深深的遗憾。我认为我们的责任是让它变得出色,去做那些工作,与专家交流,弄清楚它到底有多好、在哪里会出问题,把这些信息传达清楚。而且我认为这项技术太重要了,对人们潜在的积极影响太大了,不能因为这些高风险场景而退缩回避。

Lenny Rachitsky: 快进到今天,它已经在定期拯救生命了,可能也定期在挽救关系。这是一个影响深远的决策,我猜想这个决策是早期就做出的。

Nick Turley: 是的。我们才刚刚开始见证这些技术如何改变人们的生活。它的普惠性极其强大。如果你把它的推广与个人电脑的推广做个对比,计算机刚问世时是极其稀缺的。而现在这些东西已经无处不在——你可以获得医疗方面的第二意见,可以获得一个关系顾问,可以获得几乎任何让你好奇的话题的私人导师。我们能做这件事,真的很特别。这是历史上一个独特的时刻。

在 OpenAI 做产品的反直觉

Lenny Rachitsky: 让我拉远一点,聊聊 OpenAI 以及整体的产品话题。你曾在传统产品公司工作过——Dropbox、Instacart,现在你在 OpenAI。从你在 OpenAI 的时间来看,你学到的最反直觉的产品构建经验是什么?

Nick Turley: 每次换工作时,我总是选择差异最大的职位。所以在 Dropbox 之后,我渴望做一个面向真实世界的实体产品,因为那与做 SaaS 等等太不一样了。而在 Instacart 之后,我渴望做一些在智识上有趣的、能唤起我内心极客热情的东西。所以我一直在寻找真正不同的事物。

然后一旦到了这些地方,我就努力理解是什么让这个地方获得成功,他们真正破解了什么难题,以及我们如何能进一步放大那个优势。

我觉得我在 OpenAI 花了很多时间思考这个问题,尤其是在 ChatGPT 之后。在那之前这个问题有点 moot,因为我们并没有多少收入、产品或类似的东西。有几件事一直驱动着我们的许多决策。一是经验主义。我们之前谈到过这一点——你只能通过发布来验证,这就是为什么我们最大限度地倾向于发布,这也是我们之所以发布如此大量产品的重要原因。

二是出色的想法可以来自任何地方。运营一个研究实验室的关键在于,你不会告诉人们去研究什么,那不是你该做的事。即使我们从纯研究实验室转变为一家研究兼产品公司,我们也继承了这种文化。所以让有出色想法的人去做事,而不是当看门人或对所有事情进行优先级排序之类的,已经被证明对我们来说价值极大。大部分创新正是来源于此——来自各职能线上被赋能的聪明人。这是我从 OpenAI 成功基因中继承到的好东西,也是我们持续成功的原因。

三是跨学科的协作方式——确保你把研究、工程、设计和产品放在一起,而不是把它们当作各自为政的孤岛。我认为这正是让我们成功的原因,你在我们发布的每一个产品中都能看到这一点。比如我们要发布一个功能,如果这个功能不能随着模型变聪明两倍而也变好两倍,那它大概就不该发布。这个标准并非总是成立——SOC 2 合规不会因为模型更聪明而变好——但我认为对于许多核心能力来说,这是一个很好的检验标准。

所以我一直觉得你真的需要深入理解这个地方为什么成功,然后最大限度地加速放大那些因素,因为正是这些因素让你能把看似偶然的成果变成可复制的成功。

团队建设

Lenny Rachitsky: 你谈到了研究人员和产品人员之间的这种协作。你从 ChatGPT 第一天到现在一直在这里,从零增长到 7 亿周活跃用户——不是注册用户,是周活跃用户。你是如何随着时间推移来建设这个团队的?

Nick Turley: 作为研究实验室的另一个传承是,你把招聘看得很重。AI 实验室都知道每个人的重要性。但许多科技公司经历超高速增长后,他们会失去自己的文化认同,降低人才标准,陷入混乱。所以我们一直倾向于保持相对精简的团队规模。

所以运营 ChatGPT 的是一个很小的团队。我从 WhatsApp 那里获得了启发——它就是一个非常小的团队在运营一个全球规模的产品。而更重要的是,你必须把招聘当作更像高管招聘来做,而不是纯粹走流程式的批量招聘——你真正需要理解每个团队要填补的缺口是什么,需要什么具体技能,以及如何填补。

举个例子,我骨子里是个产品人,但有时候一个团队并不需要产品人,因为已经有人在承担那个角色了。在很多情况下,我们有一位非常有才华的工程负责人,他有着出色的产品感觉;或者我们有一位有着产品想法的研究员。在我看来他们就能承担那个角色。也许我们缺的是别的东西。也许我们需要多一点前端能力之类的。

在其他情况下,也许你缺的是优秀的数据科学家。所以我真的很喜欢逐个审视每个团队,弄清楚那个团队需要什么技能组合,然后基于原则来组建,而不是简单地假设”我们要为所有这些不同角色做一批批量招聘”,然后让人们之后再去找自己的团队。我认为这一点一直对我很重要。这也是你如何保持团队非常小、同时保持超高产出的方式。

关于”桶”与团队效率

Nick Turley: 这也让你能够招聘到那些——我想 Keith Rabois 把他们叫做”桶”,我觉得是的。桶是弹药,他认为……我想这个说法来自他,但核心思想是,组织的吞吐量取决于你有多少个”桶”,也就是那些能把事情做成的人。然后你可以在他们周围添加弹药,也就是帮助这些人的人。我觉得这对我们的招聘来说也是完全成立的——我们尽量最大化能独立交付的、被充分赋能的人的数量,因为这就是你如何用小团队完成大量工作的方式。

所以还有几件事,我也花很多时间在每个团队的氛围上,因为我觉得当你试图把研究和产品放在一起做时,一个很大的挑战是文化不同,人们的背景不同。而我认为要让这一切运转得非常好,你需要花时间做团队建设,确保人们对彼此的专业能力有极大的信任,觉得可以跨越自己的边界去思考。比如我真的相信产品是每个人的工作。正因如此,招聘并没有在人进门的那一刻结束。它其实才刚刚开始,因为你必须开始让团队变得出色。

Lenny Rachitsky: 在团队建设方面有没有什么有趣的事情可以分享?就是你做些什么来营造……?

Nick Turley: 我就是喜欢和团队一起用白板。我喜欢让大家进入一种生成性的思维状态。它能打破一切隔阂。这就是我尝试的方式。它不是特别有创意,但我发现它是一个万能工具——一旦你能让人们不再去想”这是我的工作还是他的工作”,而是更多地进入”我们都在一起试图解决某个问题”的状态,那就非常了不起了。

第一性原理思维

Lenny Rachitsky: 你提到了第一性原理这个概念。实际上我和很多人聊到你的时候这个话题都会出现,这是你非常看重的东西。很多人都在谈论第一性原理,但大多数人会说”我不太理解”,或者他们自认为很擅长从第一性原理出发思考。你能不能分享一些实际操作是什么样的?也许举一个你真正回到第一性原理、得出意想不到结论的例子?

Nick Turley: 这个,我自己不会这么说自己。别人这么说当然很开心,但这确实是个有点玄乎的东西。我觉得你真的要触及你所要解决问题的底层真相。比如我前面提到的招聘问题,我并不教条地认为你必须有一个产品经理、一个工程经理、一个设计师什么的。我们只是想打造一个能交付的出色团队。所以在这种情况下,第一性原理意味着真正理解我们实际需要什么、缺什么,而不是套用一个之前学过的流程或行为模式。我觉得这是一个很好的例子。

速度与打磨的权衡

另一个我觉得在这个环境中运用第一性原理的好例子是:这个功能需要被打磨到精致吗?我们因为模型选择器挨了很多骂,这个我来认领。我已经对所有愿意听的人说了。不知道模型选择器的人说一下,它是产品中一个巨大的下拉菜单,从传统好产品的角度来看简直就是反面教材。

但如果你真的从零开始想,是等到做出一个精致的产品更好,还是先发布一个粗糙的版本——哪怕它没那么合理——然后开始学习、让人们上手更好?我觉得一个有很多流程或很多既有行为模式的公司会做出一种判断:我们有发布时的质量标准,这就是我们的做法。而如果你的出发点是第一性原理,我觉得你会说:“你知道吗?我们应该发布。这确实令人尴尬,但那严格来说比得不到你想要的反馈要好。”

所以我认为在这个领域,从零开始审视每一个场景至关重要,因为我们正在构建的东西没有先例可循。你不能照搬一个已有的东西。没有人能告诉你”我们是 Instagram 还是 Google,还是某种生产力工具”之类的。我不知道。你可以从各处学习,但你必须从零开始。我觉得这就是为什么这个特质往往能让人在 OpenAI 更有效,也是我们在面试中会考察的东西。

Lenny Rachitsky: 这个主题不断出现,我觉得有必要强调你反复回到的一点,就是速度和打磨之间的权衡,以及为什么在这个领域速度更重要——不仅仅是为了保持领先,更是为了搞清楚人们到底想用这个东西做什么。关于为什么在 AI 领域需要如此快速行动,你觉得还有什么人们可能忽略的?

Nick Turley: 嗯,无聊的答案会是,哦,竞争很激烈,所有人都在做 AI,他们在互相竞争。这可能也是对的,但这不是我相信这一点的原因。真正的原因是,在这个领域你会打磨错东西。你绝对应该去打磨模型输出之类的东西,但在发布之前你不会知道该打磨什么。我觉得在一个产品的特性是涌现的、无法事先预知的环境中,这一点尤其成立。我认为很多人都搞错了这一点,因为最优秀的产品人往往是工匠型的人,他们对工艺有一个传统的定义。同时我也认为,把我刚才说的所有话当作借口,最终不去打造一个伟大的产品,是很容易的。所以我经常告诉我的团队,发布只是通往卓越之路上的一个节点,你应该有意识地选择这个节点——它不一定是迭代的终点,它可以是起点,但你必须跟进落实。

所以过去一个季度我们一直在做大量工作,尤其是清理 ChatGPT 的 UI。我很兴奋接下来对回复的布局和格式做同样的事情。原因很简单——一旦你知道人们在做什么,就没有借口不去打磨你的产品了。只是在一个你还不知道的世界里,你很容易被分散注意力。

所以这是视情况而定的。再次强调,你得用第一性原理来对待它。但我确实认为把速度,尤其是在早期,作为一种工具……实际上这在消费社交领域就有人说过。这不是第一个有人说”嘿,你就是要试十件事,因为你大概率会搞错”的领域。所以我不认为这种动态以前从未存在过,但我确实认为在 AI 领域,这一点需要被内化。

Lenny Rachitsky: 而且还有一个因素是模型在不断变化,所以你可能甚至都没意识到它们能做什么,我想是的。

失败案例与模型改进

Nick Turley: 完全同意。模型在不断变化,而改进它们的最佳方式——无论你是一个实验室,还是做上下文工程(context engineering)或微调模型的人——你都需要失败案例,真实的失败案例,才能让这些东西变得更好。基准测试越来越趋于饱和。所以你真正需要的是真实世界场景中你的产品或模型没能完成它本应完成的任务的那些情况,而你获得这些的唯一方式就是发布产品,因为你需要回到使用场景的分布中去,才能把这些事情做好。因此,这实际上也是向你的团队,尤其是机器学习团队阐述问题的最佳方式——“人们试图做 X,但模型在这些方面失败了。为什么?让我们把这些做好。”

Lenny Rachitsky: 关于失败案例这一点让我想到 Kevin Weil 和 Mike Krieger 都分享过的一个观点:evals 正在成为一种重要的新技能,产品人员需要掌握它,因为现在产品构建中很大一部分工作就是写 evals。关于这一点你有什么想分享的吗?

Nick Turley: 我在 OpenAI 的整个旅程,就是一个在略微新的语境中重新发现永恒产品智慧和原则的旅程。我记得我在还不知道 eval 是什么的时候就开始写 eval 了,因为我只是在为各种使用场景非常清晰地描述理想行为。直到有人告诉我,“嘿,你应该做一个 eval。“我才意识到存在一整个与产品毫无关系的研究评估基准测试的世界。我当时想,“哇,这可能就是向做 AI 研究的人传达产品应该做什么的通用语言(lingua franca)。“这让我一下子豁然开朗。

说到底,这和”在做任何其他事情之前先明确成功标准”这一智慧并没有太大不同。它只是一种实现这个目标的新机制。你可以在电子表格里做,可以在任何地方做。我真的希望为那些听到这个术语的人揭开它的神秘面纱——它不是什么你必须理解的技术魔法。它真正关乎的是以一种对训练机器人最有用的方式来描述成功。

Lenny Rachitsky: 太好了。我很快会发一篇帖子,给产品经理提供一个非常好的 eval 编写指南。

Nick Turley: 我很期待阅读。希望你同意我刚才说的,因为也许还有更多可以补充的。

Lenny Rachitsky: 当然,当然。而且现在有各种工具让这件事变得更简单。

Nick Turley: 没错。

Lenny Rachitsky: 好的,所以这基本佐证了这一点:这是产品团队和构建者需要掌握的一项非常重要的技能。

Nick Turley: 是的,是的。

ChatGPT 驱动流量增长

Lenny Rachitsky: 好的,还有几个问题。我知道你今天很忙。第一个是关于 ChatGPT 成为网站和产品流量增长重要驱动力的趋势。比如,ChatGPT 现在给我的 newsletter 带来的流量已经超过了 Twitter,这让我完全震惊了。我刚看了一下数据,心想,“怎么回事?这完全出乎我的意料。“所以想听听你对这个趋势未来的看法,你对 ChatGPT 为产品和网站驱动增长和流量这件事怎么看?

Nick Turley: 我对此非常兴奋,因为正如我觉得通过聊天机器人与一切交互有一种反乌托邦的感觉,我也觉得没有优质的新内容产出同样是一种反乌托邦。正因如此,我前面谈到搜索的时候提到过,它早期解决了一个很重要的用户问题,因为你遇到了知识截止的限制,然后突然什么都能聊了。事后看来非常明显——但这不仅是一个用户问题,也是一个生态系统问题。最初的 ChatGPT 没有外部链接,它只会回答你的问题,把你留在产品里。即使你想要继续阅读或深入了解,我们也没有办法将流量导回内容生态系统。我对我们在搜索方面所做的工作感到非常兴奋,不仅因为它给人们提供了更准确的答案,还因为它让我们能够将真正高质量的内容,比如这档播客,呈现给想看的人。

当然,还有很多有趣的问题。在 Google 时代,有搜索引擎优化(SEO),人们清楚地了解如何展现自己、获取更多流量的机制。所以我收到很多人问,“对应的机制是什么?在 AI 时代,如果我是 Lenny,我想让播客流量增长十倍,我到底需要做什么?“事实是,我们在那方面还没有非常好的答案,原因很简单——吸引 AI 模型的方式,理想情况下应该和吸引真实用户的方式一样,因为模型本应代理用户的兴趣,而不是其他任何东西。至少我希望我们的产品是这样运作的。正因如此,我的建议非常无趣,就是做出真正高质量的内容,这对于内容创作者来说显然不够可操作。我认为这也是为什么我们还有更多工作要做——也许我们可以想出更好的机制或协议。

但我很高兴这正在为你带来实质性的流量,也希望其他做出优秀内容的人开始有同样的感受,因为,这毕竟是一个非常新的场景。

AI 驱动的 SEO

Lenny Rachitsky: 人们现在用两个缩写来指代这项 AI 驱动 SEO 的技能。一个是 AEO,即回答引擎优化(Answer Engine Optimization)。另一个是 GEO,G 代表什么我忘了。

Nick Turley: Generative……对,我不太确定。

Lenny Rachitsky: Generative,对,生成引擎优化。

Nick Turley: 嗯。

Lenny Rachitsky: 这两个你更喜欢哪个?

Nick Turley: 不不,我尽量避免使用这些术语,除非它们变得不可避免,因为我还不太确定这是否应该成为一个概念。再说一次,我认为理想情况下,ChatGPT 理解你的目标,因此也理解什么内容会让你感兴趣。内容创作者的工作是分享足够多的信息和元数据,让 AI 模型能够做出与用户利益一致的决策。因此,我不确定给这个东西命名、把它变成一个概念到底是不是我们应该做的。我非常渴望向做内容的人学习,了解这可能会是什么样子。因为,我们仍在摸索中。

GPTs 的未来

Lenny Rachitsky: 顺着这个思路,另一个人们关心的问题是,你们有 GPTs,也就是那些自定义 GPT 应用,可以针对特定使用场景来构建。一直有这样一个问题:你们会不会做一个应用商店,让我可以把产品接入 ChatGPT 并从中变现?有没有什么你可以聊聊的、未来可能会出现的东西?

Nick Turley: GPTs 很酷。它们在某种意义上超前于时代,因为我们构建这个概念的时候,你还无法真正做出差异化很大的东西。至少在消费端,你的学习 GPT 跟模型开箱即用的能力会相当相似。所以它主要是一种向人们描述使用场景的方式,但它还没有足够的工具来做出感觉像一个真正应用的东西。

不过在企业端情况就不同了。我们在那里看到了 GPTs 的大量采用,因为每家公司都有非常定制化的业务流程和问题等等。这在那里是一个非常好用的工具。它们还有独特的数据可以接入这些 GPTs 进行检索。所以我们在企业端看到了很大的成功。

Nick Turley: 我认为这个方向是对的,我们也会找到一个好的实现机制。因为当 AI 内部打包了如此多的能力时,让人们能够用清晰的功能指向、明确的使用场景来封装这些能力,并且彼此之间有所区分,这会让人感觉非常强大。我也很希望有一天你可以在 ChatGPT 上创业。我认为确实存在这样一个未来:当这个东西达到十亿用户规模时,它可以为你提供分发渠道,可以帮你起步做东西,就像人们当年在互联网上搭建产品一样,会诞生全新的商业模式。

所以未来我们会有更多可以分享的。GPTs 是一次早期的尝试。随着模型变得越来越强,我们的覆盖面不断扩大,我很期待在这个方向上继续演进思路。

哲学与计算机的交汇

Lenny Rachitsky: 太棒了,真的很酷。我非常期待看到你们在那方面会做出什么。好,换个完全不相关的话题。我对你有所了解的一点是,你大学学的是哲学。

Nick Turley: 没错。

Lenny Rachitsky: 计算机科学和哲学,对吧?这个组合。

Nick Turley: 对。我一开始是哲学专业,后来上了一门编程课,因为我非常喜欢逻辑学,而编程和逻辑最接近。然后我就爱上了编程,后来又爱上了计算机科学,就越来越多地往这个方向走了。但在那之前,我从来没有真正觉得自己是一个技术型的人,所以这算是人生中比较晚才发现的事情,我对此非常感恩。

Lenny Rachitsky: 对于领导这款产品的人来说,这真是一个不可思议的组合。

Nick Turley: 确实如此。这在某种程度上完全是一种始料未及的闭环。你需要面对的问题数量之多、之有趣,真的非常吸引人。哲学不是一门传统意义上的实用技能,但它确实教会你从零开始思考问题,教会你清晰地阐述一个观点,我觉得这在很多次都派上了用场。

Lenny Rachitsky: 有没有哪位具体的哲学家或流派对你特别有帮助,还是说更多只是一般性的……

Nick Turley: 哦,太多了。我的毕业论文写的是理性的人是否以及为什么能够产生分歧,这在很多人的价值观非常不同、却对模型行为或产品应该怎么运作持有各自看法的时候,也非常有用。所以我非常喜欢二十世纪的分析哲学家。这些东西比较冷门,但我不知道自己有没有最喜欢的一位,太多了数不过来。但我喜欢的是这类东西。其中有些内容会变得非常分析化——你设定”令 P 为这种关于爱的理论,令 Q 为另一种关于爱的理论”,然后做某种符号推演。所以它和纯粹的脑力训练一样,甚至更偏向脑力训练而非实践,但它教会了我如何思考,这种能力持续地非常有价值。

职业路径:如何加入 OpenAI

Lenny Rachitsky: 太厉害了。多么酷的技能组合和背景。在进入非常令人期待的快问快答环节之前的最后一个问题。你曾是 Dropbox 的产品负责人,然后是 Instacart,现在你是可以说是历史上最重要的产品的 PM。你是怎么来到这个角色的?加入 OpenAI 并承担这项工作的故事是什么?

Nick Turley: 我做过的每一个职业决定,包括大学毕业后的第一个,都是先想清楚:我认识的人里谁最聪明、我最想跟谁待在一起并向他们学习,我能跟他们一起工作吗?我不知道怎么评估公司,也不知道怎么真正有逻辑地判断哪个领域会起飞之类的,但我确实觉得自己对人有感觉。Dropbox 那次,我跟的是我当助教那门课的主助教。Instacart 那次,我跟的是我认识的一些最厉害的产品人。而 OpenAI,招我进来的人是 Joanne,我之前给她发消息是想从 DALL·E 的等候名单里出来,她说”那你来面试吧”。她就把它变成了一次反向招聘。

说实话一开始,我并不知道来这里能做什么,因为这是一个研究实验室,而我是做产品的。他们说,“别担心,我们会想办法的。” 他们当时有点遮遮掩掩的。我以为他们遮遮掩掩是因为这是 OpenAI,不能分享任何东西,但他们遮遮掩掩是因为当时确实什么都还不知道。所以我到了之后什么都干,反正肯定不是产品。我想我的第一个任务好像是修百叶窗还是什么的。然后我开始给大家发保密协议,因为他们需要一些运营方面的帮忙。再然后我就开始问,“等等,我为什么要发保密协议?哦,是为了跟用户交流。” 我就想,“跟用户交流,这听起来是我会的事情。” 然后我很快就无意中开始做产品工作了,后来逐渐领导了一大堆产品工作。但这完全是有机生长的——就是到了那里,有什么需要做的就做什么,因为我加入的那家公司怎么说也不是一家产品公司。

Lenny Rachitsky: 哇。这是一个绝佳的例子,不知道你自己是不是这样想的,但当有人给你一张火箭船的票时,不要问坐在哪个位置。

Nick Turley: 对,其实我当时并不知道那是一艘火箭船。我更愿意把它描述为被”知识诱饵”钩住了。就是当我在为那个能从 DALL·E 等候名单里出来的对话做准备时,我真的就开始阅读这个领域的资料,然后这引起了哲学脑的兴趣,同时也引起了计算机科学脑的兴趣。我就想,“等等,这太酷了。” 然后我开始读那个时代所有的学术论文。所以最初是因为智力上的好奇心和人,但后来我留下来显然是因为产品机会。ChatGPT 发布之后,当它爆发的时候,我们意识到自己造了一艘火箭船——或者更准确地说,我们是在建造它的同时就把它发射了。但我不能说我申请的时候觉得这是一份多么炙手可热的工作。

Lenny Rachitsky: 所以一个教训就是,如你所说,跟随你认识的最聪明的人。另外还有一条线索就是,跟随你感兴趣的事物。你玩 DALL·E 这件事本身就引来了这个机会。

好奇心是最重要的特质

Nick Turley: 对,对。实际上我们现在仍然在考察这一点——好奇心是一个我们认为远比你的机器学习知识重要得多的特质。我不是在评论研究的招聘,我觉得确实需要一些机器学习知识。但对于产品和工程和设计人员,以及那些类型的职能,我其实认为,如果你对这些东西是怎么工作的感到好奇,你之前有没有做过根本不重要。事实上,如果你去筛选做过这件事的人,你会得到一个非常窄的筛子,筛出来的只是一些非常幸运的人,而不一定是你能招到的最优秀的人。所以我认为我们已经把这个标准扩大了。这当然也是我来到这里的原因,但我认为从普遍意义上来说,好奇心也确实是 OpenAI 成功的一个很好的预测指标。

Lenny Rachitsky: Nick,我跟你说我有十亿个……我说过我有二十亿个问题要问你。我觉得我已经问了不少了,但感觉还有十亿个没问。不过我知道,你跟我说过这个结束后你还有一个关于 GPT-5 的重要 check-in 要参加,所以——

Nick Turley: 我们得发布了。

Lenny Rachitsky: 我们得发布了。既然这段对话已经录下来而且要公开,最好赶紧发布。

Nick Turley: 确实如此。

Lenny Rachitsky: 这就是强制函数。好的,在我们进入非常精彩的快问快答之前,你还有什么想分享的、想留给听众的、觉得重要的东西吗?

Nick Turley: 我想分享一下我做决策的方式,因为我希望能……我离开学校也没多久。我很能共情那些即将进入职场、正在 figuring out 自己这辈子要做什么的人。我非常有信心,如果你身边围绕着那些给你能量的人,如果你追随自己真正好奇的事物,你在这个时代一定会成功。所以我给大家的临别建议真的就是:把自己放在好的人身边,做自己真正热爱的事。因为在一个这个东西能回答任何问题的世界里,提出正确的问题非常、非常重要。而学会这一点的唯一方式,就是培养自己的好奇心。这对我来说管用,也是我能分享的唯一一个可复制的经验。其他一切都是运气。

Lenny Rachitsky: 这和现在很多人正在做的恰恰相反——现在大家追逐的是钱。哪里赚得最多?我怎么把这个做大、赚到一个亿?所有那些拿到疯狂 offer 的人,当初并不是冲着赚大钱来的。

Nick Turley: 看到这些事情的发展挺有意思的,因为我觉得这些人当初进入学校都是出于真诚的理由。他们对这个领域很兴奋,在做研究,在追求知识,而我很高兴这些得到了回报。我不知道未来的回报会是什么样子,尤其是在后 AGI 世界里。但我有一种感觉,如果你遵循这个建议,你最终会没事的。

快问快答

Lenny Rachitsky: 那么,Nick,我们已经到了非常精彩的快问快答环节。我有五个问题给你。准备好了吗?

Nick Turley: 好啊,来吧。

Lenny Rachitsky: 有两三本你会经常推荐给别人的书吗?

Nick Turley: 在产品领域,大概是《High Output Management》或者《The Design of Everyday Things》这类经典之作,因为我认为它们在 AI 领域极其适用。

Lenny Rachitsky: 我们聊过哲学。有没有一本哲学方面的书你会说,“如果你要入门,就读这本”?

Nick Turley: 哎呀,Rawls 和 Nozick 的任何作品都行。我喜欢政治哲学那类东西,觉得特别有意思。这是我推荐的一类书。我觉得读这些东西没有什么实际的理由,但我可以跟你为此聊得津津有味。所以后果自负。

Lenny Rachitsky: 你最近有没有特别喜欢的电影或电视剧?如果你有时间看的话。

Nick Turley: 我觉得在这个行业就得看一点科幻。你不应该照搬其中的任何东西,但我觉得你能从中学到东西。所以我会定期重看《Her》和《Westworld》。《Severance》也很棒。这些就是我有时间时会看看的东西。

Lenny Rachitsky: 太棒了。我很喜欢这两部是你的选择。在所有科幻电影中,这两部是你最有共鸣、觉得最有趣和最有价值的。

Nick Turley: 是的,不过这大概是我自己的局限性,所以肯定还有更多值得发现的。

Lenny Rachitsky: 顺便问一下,你读过《Fire Upon the Deep》那本科幻小说吗?

Nick Turley: 没有。

Lenny Rachitsky: 好的。我不知道你有没有时间读这本书,但我觉得你会喜欢的。它是一本特别好的——

Nick Turley: 噢,天哪。好的。

Lenny Rachitsky: ——与 AI 相关的太空歌剧类型的书。

Nick Turley: 不错。

Lenny Rachitsky: 对。

Nick Turley: 我会去看看,谢谢。

Lenny Rachitsky: 好了,跑题了。

Nick Turley: 没错,没错,没错。确实。

Lenny Rachitsky: 好了。你最近有没有发现一个你特别喜欢的、新的产品?

Nick Turley: 说实话没有。我已经到了极限容量了。挺有意思的是,API 开发者会问我,“嘿,你们是不是要把我们的产品都抄了?“实际上我根本没有时间去关注 OpenAI 之外在发生什么,因为这里的节奏实在太快了。所以恐怕给不了你好的推荐。

Lenny Rachitsky: 这个回答对很多产品公司来说大概挺令人宽慰的。想想看,Nick 连看我们东西的时间都没有。天哪。好的。你有没有一个最喜欢的人生格言,在你遇到困难时会用,或者会分享给朋友和家人,而且别人也觉得有用?

Nick Turley: “你是你相处时间最长的五个人的平均值”——这句话我真的内化了,既体现在个人生活中,身边有那些给我能量、激励我、让我变得更好的人。我的未婚妻就是其中之一,但我生活中还有很多这样的人。但工作中也有同样的道理。再说一次,我所有的职业决策都是这样做的——我想向谁学习?所以我一直在运用这个原则。

Lenny Rachitsky: 最后一个问题,每个跟我聊过的人都告诉我你是一个非常优秀的爵士钢琴家。你赢过比赛。我听说你本来打算以此为业,后来不知道怎么走了一条岔路。

Nick Turley: 对,我在最后一刻打了退堂鼓,但我原本是打算去读音乐专业的。那仍然是我希望的,人生第二章。

Lenny Rachitsky: 哇,我很喜欢这可能还会发生。

Nick Turley: 可能还会发生。我现在在一些兴趣乐队里,偶尔会演出。这是我在其他方面筋疲力尽、脑子转不动的时候唯一能做的事,因为它以很好的方式让我恢复平衡。不过是的,希望未来能做更多。

Lenny Rachitsky: 音乐和你的工作之间有什么类比吗?有没有什么你觉得——

Nick Turley: 有,确实有。我觉得你可以把软件开发,或者说做产品的人,想象成一个管弦乐队的指挥,或者一个爵士乐队的成员。而我把它看作爵士乐队——我不太认同每个人都有一个固定的、必须演奏的部分,然后由我来告诉人们什么时候演奏。我喜欢爵士乐或其他即兴音乐中那种彼此即兴配合的方式——你听到一个人演奏了什么,然后你用你的演奏来回应。我认为伟大的产品开发也是这样的,因为想法可以从任何地方产生。它不应该是一个脚本化的流程。你应该不断尝试,享受乐趣,在你的工作中保有 play 的元素。所以我经常用这个类比。对于喜欢音乐的人来说,它通常会引起共鸣。

Lenny Rachitsky: Nick,非常感谢你抽出时间来做这个。我知道今天已经够疯狂的了。明天对整个世界来说会更加疯狂。他们完全不知道即将发生什么。非常感谢你做这个。最后两个问题。如果大家想在网上找到你,去哪里找?大家可能在哪里找到 GPT-5?然后听众怎样才能帮到你?

Nick Turley: 直接用产品就好。你甚至不需要付费。从明天开始它应该是你的默认模型,直接用就行了,别再想选模型的事了。除非你想折腾,而且你是 Pro 用户,那你可以访问所有旧模型。放心好了。说实话,我从广大用户和 ChatGPT 用户那里学到了很多东西,所以继续做你正在做的事就好。我在看、在学,也感谢所有的反馈。我确信等我们修好了模型选择器,你们又会拿别的事情来吐槽我,我照单全收。继续来吧。

Lenny Rachitsky: 太好了。Nick,非常感谢你来做这个节目。

Nick Turley: 谢谢邀请我,Lenny。

Lenny Rachitsky: 祝你明天好运。

Nick Turley: 谢谢。

Lenny Rachitsky: 大家再见。

感谢大家的收听。如果你觉得这期节目有价值,可以在 Apple Podcasts、Spotify 或你喜欢的播客应用上订阅。也请考虑给我们评分或留言,这真的能帮助更多听众找到这个播客。你可以在 Lennyspodcast.com 找到所有往期节目或了解更多关于这个节目的信息。下期再见。

术语表

原文中文
advanced memory高级记忆(ChatGPT 个性化功能,可长期记住用户信息)
AEOAEO(回答引擎优化,Answer Engine Optimization,保留原文)
AGIAGI(通用人工智能,Artificial General Intelligence)
ammunition弹药(比喻中辅助”桶”工作的支持人员)
barrel桶(Keith Rabois 提出的比喻,指能独立推动事情完成的核心人才)
Charlie MungerCharlie Munger(美国投资家、伯克希尔·哈撒韦公司副董事长,保留原文)
ChatGPTChatGPT(保留原文)
Code InterpreterCode Interpreter(ChatGPT 代码解释器功能,保留原文)
Comic SansComic Sans(字体名称,保留原文)
consumer social消费社交(面向消费者的社交产品领域)
contact with reality与现实接触(将产品投入真实用户环境获取反馈)
context engineering上下文工程(优化输入给模型的上下文信息的技术)
CPOCPO(首席产品官,保留原文)
critical path关键路径(项目管理术语)
DiscordDiscord(即时通讯平台,保留原文)
empty box problem空盒子问题(用户面对空白输入框不知道该做什么的困境)
evals评测(评估模型表现的测试用例和标准)
fail whale宕机提示页面(服务不可用时显示的错误页面)
fine-tuning微调(在已有模型基础上用特定数据进一步训练)
Fire Upon the Deep《Fire Upon the Deep》(Vernor Vinge 的科幻小说,保留原文)
first principles第一性原理(从基本事实出发、不依赖既有假设的思维方式)
forcing function强制函数(促使行为发生的约束机制)
frontier model前沿模型
GEOGEO(生成引擎优化,Generative Engine Optimization,保留原文)
GPT-5GPT-5(OpenAI 模型名称,保留原文)
GPTsGPTs(ChatGPT 中的自定义 GPT 应用,保留原文)
hackathonhackathon(编程马拉松,保留原文)
Her《Her》(2013 年科幻电影,保留原文)
High Output Management《High Output Management》(Andy Grove 的管理经典著作,保留原文)
HIPAAHIPAA(美国健康保险可携性与责任法案,保留原文)
InstacartInstacart(美国生鲜配送公司,保留原文)
Instant PotInstant Pot(多功能电压力锅,保留原文)
instruction following指令遵循(模型能力,即按要求执行任务而非仅补全文本)
JoanneJoanne(OpenAI 员工,保留原文)
Keith RaboisKeith Rabois(美国风险投资人、高管,保留原文)
Kevin WeilKevin Weil(保留原文)
Lenny RachitskyLenny Rachitsky(保留原文)
lingua franca通用语言(不同群体间沟通的共同语言)
Mike KriegerMike Krieger(Instagram 联合创始人,保留原文)
model behavior team模型行为团队(负责调优模型个性和表达风格的团队)
model chooser模型选择器(ChatGPT 中让用户选择使用哪个模型的界面组件)
MS-DOSMS-DOS(微软磁盘操作系统,保留原文)
Nick TurleyNick Turley(保留原文)
NozickNozick(美国政治哲学家 Robert Nozick,保留原文)
o3 Proo3 Pro(OpenAI 模型名称,保留原文)
OpenAIOpenAI(保留原文)
PLGPLG(产品驱动增长,Product-Led Growth)
Rahul VohraRahul Vohra(Superhuman 公司 CEO,保留原文)
RawlsRawls(美国政治哲学家 John Rawls,保留原文)
red team红队测试(安全评估方法)
retro复盘(团队对项目或事件的回顾总结)
SA ServerSA Server(内部代码库名称,保留原文)
Sam AltmanSam Altman(保留原文)
Severance《Severance》(悬疑剧集,保留原文)
sick efficiency谄媚效率(应为 sycophancy efficiency 的识别误差,指模型不必要迎合用户的程度)
smiling curve微笑曲线(用户留存率随时间先降后升的曲线形态)
SOC 2SOC 2(服务组织控制报告,保留原文)
SuperhumanSuperhuman(电子邮件服务公司,保留原文)
SWE-benchSWE-bench(软件工程基准测试,保留原文)
sycophantic谄媚的(模型过度迎合用户倾向)
system card系统卡片(模型安全文档)
The Design of Everyday Things《The Design of Everyday Things》(Don Norman 的设计经典著作,保留原文)
Van Westendorp surveyVan Westendorp 价格敏感度测试
vibe codingvibe coding(氛围编程,保留原文)
Westworld《Westworld》(科幻剧集,保留原文)

此文档由 AI 分片翻译(translate_long_document)