走进 OpenAI | Logan Kilpatrick(开发者关系负责人)

Logan Kilpatrick 2024-02-08

走进 OpenAI | Logan Kilpatrick(开发者关系负责人)


文字记录

找到高能动性的人

Logan Kilpatrick: 找到高能动性(high agency)且以紧迫感工作的人——如果我今天要招五个人,这两点是我最看重的特质。因为如果你身边有高能动性的人,不需要获得五十个人的共识就能采取行动,那你几乎可以征服世界。他们一听到客户遇到的挑战,就已经在着手寻找解决方案,而不是等待其他所有事情先发生……这些人直接去做、去解决问题,我很喜欢这一点。能够身处这样的情境中,真的很有趣。

Lenny: 今天我的嘉宾是 Logan Kilpatrick。Logan 是 OpenAI 的开发者关系负责人,负责支持在 OpenAI 的 API 和 ChatGPT 上进行开发的开发者们。在加入 OpenAI 之前,Logan 曾是 Apple 的机器学习工程师,并为 NASA 的开源政策提供咨询。不管你信不信,ChatGPT 发布至今才一年出头,却已经彻底改变了我们对 AI 的认知,以及它对产品和生活的意义。Logan 一直身处这一变革的最前线,每天都在帮助开发者和企业弄清楚如何利用这些新的 AI 超能力。

在我们的对话中,我们深入探讨了人们如何在工作和生活中使用 ChatGPT、新的 GPT 以及其他 OpenAI API 的实际案例。Logan 分享了一些关于如何提升提示词工程(prompt engineering)能力的非常有趣的建议。我们还聊到了 OpenAI 的内部运作方式、他们如何如此快速地发布产品,以及在招聘时最看重的两个关键特质。此外,Logan 也谈到了他认为基于 OpenAI API 构建新产品和新创业公司的最大机会在哪里。

我们也稍微聊到了 OpenAI 那个非常戏剧性的周末——关于董事会、Sam 和所有那些事情——以及更多内容。非常感谢 Dan Shipper 和 Dennis Ing 提出了很好的问题和建议。接下来,请收听我对 Logan Kilpatrick 的采访。

OpenAI 董事会事件的内幕

Lenny: Logan,非常感谢你的到来,欢迎来到播客。

Logan Kilpatrick: 谢谢你邀请我,Lenny,我非常兴奋。

Lenny: 我想先聊聊那个显而易见但大家可能已经开始淡忘的话题——虽然这已经是几个月前的事了,但我仍然非常好奇。在那个涉及董事会、Sam 和所有那些事情的戏剧性周末,OpenAI 内部是什么样的情况?当时到底是什么感受?有没有什么外界可能还没听过的故事,可以分享一下内部当时的情况和正在发生的事?

Logan Kilpatrick: 那确实是一个非常紧张的感恩节假期。先说大背景——ChatGPT 发布以来,OpenAI 一直在高强度推进,而那一周本来应该是全公司第一次真正放假休息、重新调整的时间。所以,说点私心的——我当时特别期待能和家人共度时光。然后,周五下午我们收到了变动的消息,这确实非常令人震惊。因为——这也是很多人的共同感受——大家对 Sam、Greg 和我们的领导团队一直有着、并且现在依然有着深厚的信任,所以这一切让人非常意外。而且 OpenAI 的公司文化是非常透明和开放的,当有问题或事情发生时,我们通常都会知情。而这次,很多事情发生在董事会和领导团队之间,我们中的很多人确实是第一次听说,所以非常、非常令人意外。

作为一个不在旧金山的人,说句私心的话,我其实有点庆幸这件事发生在感恩节假期,因为很多人已经回到了各自不同的地方。所以我觉得有一丝安慰,知道自己不是唯一一个不在旧金山的人——因为大家都在现场聚集在一起处理各种事情、共度那段时光。知道还有几个同事和我一样处于信息圈外,心里稍微好受一些。

最让我惊讶的是大家回归工作的速度之快。感恩节后的那一周我飞去了旧金山——这本来不在我的计划内——为了当面和团队处理事务。周一早上我走进办公室时,本以为会看到什么不对劲的情况。但事实上,大家都在全神贯注地投入工作。我觉得这体现了我们团队的水准——每个人都对我们正在建设的使命充满热情。所以,这确实是整件事中最令人惊讶的地方。我想很多公司遇到这种情况,很可能会被打乱相当长一段时间,但大家立刻就回到了正轨,这一点我非常喜欢。

Lenny: 我感觉这件事也许还让团队走得更近了。它像是一种共同经历的创伤体验,可能把人们凝聚在一起,因为这是所有人共同经历过的事情。这方面有什么感受吗——比如”哇,现在有些东西确实不太一样了”?

时机与团队凝聚力

Logan Kilpatrick: 我的一个感触是,这件事发生的时机其实让我很庆幸。我认为如今的代价……仍然不算低。很多人把自己的业务建在了 OpenAI 之上,我们有大量的 ChatGPT 用户,如果我们出了什么问题,确实会影响我们的客户。但放到世界层面来看,如果 OpenAI 不在了,别人也会去建模型,继续推进通用智能的进程。我觉得快进五到十年,如果类似的事情在那时发生——而我们还没有经历希望中即将到来的工作变革以及所有那些将要发生的变化——我认为结果可能会稍微、甚至严重得多。所以我很庆幸这件事发生在代价还比较低的时候。

我完全同意你的看法。自从我加入以来,团队在过去一年里增长得非常快。想到有那么多新同事加入,真是有点不可思议。我真的觉得这次事件把大家凝聚在了一起,因为在我加入的时候,把我们团结在一起的是 ChatGPT 的发布、GPT-4 的发布。对于那些没有赶上这些发布的同事来说,可能是某个重要的日子;对于参加了开发者日的同事来说,可能就是这次事件。所以我们经历了这些真正把公司跨部门凝聚在一起的事件,希望未来所有这样的事件都是像 GPT-5 这种令人兴奋的事情——不管它什么时候发布。

AI 最令人惊叹的新界面

Lenny: 太好了。我们接下来聊聊 GPT-5。换个完全不同的话题——最近你看到 AI 做过的最令人震撼或最出人意料的事情是什么?

Logan Kilpatrick: 最让我兴奋的是围绕 AI 的一些新界面,比如 Rabbit R1。不知道你有没有见过,那是一个消费级硬件设备。还有一家公司叫 TLDraw,不知道你有没有看过 TLDraw?

Lenny: 我想我看过。就是你画一个草图,然后它把它变成一个网站?

Logan Kilpatrick: 而这其实只是 TLDraw 正在做的很小一部分。现在有各种各样与 AI 交互的新界面,前几天我和 TLDraw 的团队聊过,想到如今人们使用 AI 的主要方式还是聊天,真是令人震惊。我实际上认为——这也是我对 TLDraw 团队非常看好的原因,我特别期待他们在做的产品——他们正在构建一种无限画布的体验。你可以想象,当你每天与 AI 交互时,你可能想跳转到你的无限画布上,AI 已经填充了所有细节,你可以看到对一个文件的引用、对一个视频的引用,以及各种不同的内容。

这是一种非常酷的方式。实际上,对于我们人类来说,以那种格式去查看信息,比在聊天里列出一堆东西要合理得多。所以我真的很期待看到更多人推动这件事。我认为 2024 年是多模态 AI 的元年,但也是人们真正突破围绕 AI 的一些新 UX 范式边界的一年。

Lenny: 很有意思。作为一个做了多年产品经理的人,我觉得聊天机器人这东西——我们每次头脑风暴讨论新功能的时候,总会有人说”嘿,我们应该做个聊天机器人来解决这个问题”。它就像一个永恒的老梗——“哦,聊天机器人”,或者”又有人建议我们做聊天机器人了”。而现在它们真的变得有用了、能正常工作了,大家都在做聊天机器人,其中很多都是基于 OpenAI 的 API。

这其实不算个问题,但我真正想问的——我本来打算后面再聊这个——就是当人们考虑构建一个产品的时候,比如 TLDraw,他们应该怎么思考?OpenAI 不会去做什么,而 OpenAI 会帮我们做什么?我们不用担心他们未来会做一个 TLDraw 的竞品。简单来说就是,在知道 OpenAI 可能会改变主意的情况下,怎么判断自己不会被 OpenAI 颠覆?

创业者的护城河:垂直 vs 通用

Logan Kilpatrick: 这是个好问题。我认为我们高度专注于那些非常通用的使用场景——通用推理能力、通用编程、通用写作能力。当你开始进入一些非常垂直的应用领域时……我觉得一个很好的例子其实是 Harvey。不知道你有没有了解过 Harvey,那是一个法律 AI 产品,他们在构建定制化的模型和工具来帮助律师和律所的工作人员。这是一个很好的例子——我们的模型可能永远不会做到 Harvey 正在做的那些事情,因为我们的目标和使命是去解决那些非常通用的使用场景,然后人们可以在此基础上进行微调,构建自己的定制化 UI 和产品功能。

我对那些今天正在构建非常通用的产品的人有很多共情,也有很多期待。我和很多开发者交流过,他们在构建通用助手、通用代理等等。我觉得这很酷,是个好想法。但他们面临的挑战是,他们最终会在这条赛道上直接和我们竞争。我认为这里有足够的空间让很多人取得成功,但对我来说,当我们最终推出某种通用代理产品时,你不应该感到惊讶——因为我们现在其实已经在通过 GPTs 来构建这个方向了。而我们不会去推出那些各种各样的垂直化产品。我们不会去做一个 AI 销售代理。那不是我们的方向。而那些正在做这件事、拥有特定领域知识、并且对那个问题空间充满热情的公司,可以深入其中,利用我们的模型,继续站在前沿,而不必自己去做所有的研发工作。

Lenny: 明白了。所以我听到的建议是:把使用场景做具体,这可以是针对某个场景做专门优化的模型,比如销售场景,也可以是通过界面或体验来解决一个更具体的问题。

Logan Kilpatrick: 而且我觉得,如果你要试图解决这种非常通用的问题——如果你要试图构建下一个通用助手来和 ChatGPT 竞争,那它必须要有根本性的不同。用户必须真心觉得”哇,这解决了我用 ChatGPT 时的这十个问题,所以我要去试试这个新东西”。否则,我们正在把大量的工程和研究精力投入到让 ChatGPT 成为一个出色的产品上,而这就只是创办公司常见的挑战了——和这样的东西竞争确实很难。

AI 如何提升公司内部效率

Lenny: 太好了,这个问题本来打算后面再聊的,很高兴提前聊到了。我猜很多开发者和创始人都在想这个问题。沿着类似的思路,现在有很多讨论说 ChatGPT、GPTs 以及你们提供的很多工具会让公司变得更高效——不需要那么多工程师、数据科学家、产品经理之类的。但我觉得对公司来说,也很难想清楚我们到底能做什么来让自己的公司变得更高效。我很好奇你能不能分享一些例子,比如有公司内部构建了一个 GPT 来做某件事,从而不必花费工程时间,或者总体上利用 OpenAI 的工具让内部业务变得更高效?

Logan Kilpatrick: 这个问题问得好。我不知道你能不能把这个放在节目笔记里之类的,哈佛商学院有一项非常好的研究……我忘了他们跟哪家咨询公司合作做的了,也许是波士顿咨询之类的,也可能是其他某一家。他们谈到的是,使用 AI 工具的人——我记得在那个研究场景中具体用的是 ChatGPT——相比不使用 AI 的人,效率提升了一个数量级。我也很期待,随着这项技术发布后时间推移,我们能获得更多实证研究。就我自己而言,作为一个工程师,我使用 ChatGPT 之后,交付速度比以前快了很多。

我没办法给自己一个具体的数字,但我猜现在应该有人在做了这些研究了。我认为工程实际上是目前用 AI 能做的杠杆率最高的事情之一,至少能带来 50% 以上的提升,尤其是一些比较容易上手的软件工程任务。模型做这些工作的能力真的很强。想想其实挺疯狂的……我猜 GitHub 大概也发布了大量围绕 Copilot 的研究,你可以用那些来类比人们从 ChatGPT 上获得的收益。但那些可能确实是杠杆率最高的应用场景了。

我认为现在有了 GPTs,人们可以去解决一些更具体的战术性问题。ChatGPT 有一个普遍的挑战,就是它在很多不同的场景下都能给出一个还算不错的答案,但往往不够贴合你们公司的风格,也不够贴合你工作的细微之处。而现在有了 GPTs,使用 ChatGPT 团队版和企业版的用户可以真正构建这些东西,融入自己公司的细节,让解决那些任务变得更有领域针对性。我们几个月前才刚发布 GPTs,所以我觉得目前还没有什么好的公开成功案例,但我猜现在各个公司里已经在取得成功了,希望接下来几个月随着大家越来越热衷于分享这些案例研究,我们会听到更多。

Lenny: 我分享一个例子。我有一个好朋友叫 Dennis Yang,他在 Chime 工作,他跟我讲了他们在 Chime 做的两件事,看起来挺有价值的。一个是他建了一个 GPT,帮助撰写 Facebook 和 Google 的广告,给你广告投放的创意,这样就减轻了营销团队或增长团队的一点负担。然后他还做了另一个 GPT,能交付实验结果,有点像数据科学家的角色,告诉你这个实验的结果是什么,然后你可以跟它对话,问”你觉得我们还需要再跑多长时间”,或者”这对我们的产品可能意味着什么”之类的。我觉得这真的很——

Logan Kilpatrick: 我很喜欢这个。

Lenny: 就像你说的那样。还有没有其他例子?就是你听说别人做了什么,让你觉得”哇,这做法真聪明……”我知道工程方面有 Copilot 那样的工具,还有没有其他让你印象深刻的?给大家一点灵感,比如”哇,这种思路很有意思,我也应该这样去用这些工具”。

Logan Kilpatrick: 我见过一些围绕规划场景的很有意思的 GPT,比如你想为你的团队做 OKR 规划之类的。我昨天还真看到有人发推文分享了。我也见过一些做风险投资相关事务的,用来对项目交易流做尽职调查,挺有意思的,能获得一些不同的视角。我觉得所有这类横向应用场景——你能引入一个不同的角色,从不同角度获取观点——都非常酷。我个人也用一个 GPT,是我自己用的私有 GPT,帮助我做不同季度的规划之类的事情,确保我在框架设计上保持一致,比如把所有内容都回溯到具体的指标上,这些都是人们做规划时在数据方面经常遗漏的东西。有一个 GPT 来强迫我思考这些事情,对我来说帮助非常大。

Lenny: 等等,能多说一些吗?这个 GPT 具体帮你做什么,你给它输入什么?

Logan Kilpatrick: 我忘了之前在网上看到的是哪篇文章了,但它讲的是如何最好地为规划做好准备。我从那篇文章里提取了一堆内容——我看能不能之后把它公开,把链接发给你——把其中的一些建议放进 GPT 里,现在每当我做任何规划、想构建什么东西的时候,我把它输进去,让它生成一个时间线,生成所有具体的细节,包括我要追踪的指标和成功标准是什么、规划过程中可能需要纳入哪些重要的跨职能利益相关方,等等这些,确实很有帮助。

Lenny: 哇,这太酷了。如果你把它公开的话那就太好了。如果你真公开了,我们会在节目里放链接,然后把它捧成 GPT 商店里最受欢迎的 GPT。

Logan Kilpatrick: 好极了。

提示词工程的兴起

Lenny: 换一个稍微不同的方向,现在有整个一类关于提示词工程的东西。感觉它是一个正在快速兴起的技能。我真的看到一家创业公司在招聘提示词工程师——是我投资的一家公司——我觉得这会让很多人大吃一惊,居然出现了这样一个新职位。我知道大家的看法是这个不会永远存在,理论上 AI 会变得足够聪明,你不需要再费心去想怎么巧妙地让它做你需要它做的事。但你能不能描述一下提示词工程这个概念——人们可能经常听到这个术语——然后再更有意思的是,你对大家提升写提示词的能力有什么建议,比如在 ChatGPT 上或者通过 API 使用时?

Logan Kilpatrick: 这个领域确实非常有意思,我也很期待大家做更多科学的实证研究,因为现在有太多凭感觉总结的最佳实践,也许在某种意义上并不真正成立。提示词工程之所以存在、之所以被提起,是因为模型由于训练方式的原因,非常倾向于对你提出的问题直接给出一个答案。垃圾进垃圾出。如果你问一个很基础的问题,你就会得到一个很基础的回答。其实对人类来说也是一样的,你可以想一个很好的例子。当我走到另一个人面前问”今天过得怎么样”,对方说”还不错”。

几乎没有零细节,没有层次,一点都不有趣。反之,如果你跟一个人有一些上下文、有私人关系,我跟你打招呼说”Lenny,你今天怎么样?上一期播客做得如何”等等,你就有更多的上下文和能动性来回答我的问题。我觉得这就是提示词工程。

Logan Kilpatrick: 我对这件事的整体看法是,提示词工程其实是一件非常人类化的事情。当我们想从一个人身上获取价值时,我们就在做这种提示词工程——我们努力与那个人进行有效沟通,以获得最好的输出。模型也是一样的。我觉得,同样地,因为我们使用的是一个看起来非常聪明的系统,我们就假设它拥有所有这些上下文,但实际上你可以把它想象成一个具有人类水平智能却完全没有上下文的存在。它完全不知道你会问它什么。它从来没见过你。它不知道你是谁、做什么、目标是什么。有时候你得到非常泛泛的回答,原因就在于人们忘记了需要把这些上下文放进模型里。

所以我认为能帮助解决这个问题的方案——其实我们在 DALL-E 的场景中已经在某种程度上这么做了。当你使用我们的图像生成模型 DALL-E,说”我想要一张乌龟的图片”时,它实际上会接收这个描述,把”我想要一张乌龟的图片”转化成一个高保真度的版本——生成一张乌龟的图片,带壳,绿色背景,水里有睡莲等等。它添加了所有这些丰富的细节,因为模型就是用这些高保真度的示例训练出来的。文本模型也会走上这条路。

你可以想象这样一个场景:你进入 ChatGPT,说”帮我写一篇关于 AI 的博客文章”,它会自动去生成一个更高保真度的描述——“帮我写一篇关于 AI 的博客文章,讨论不同技术之间的权衡,给出一些示例用例,引用一些最新论文”——它把这些全部替你做好,然后你作为用户就可以说”对,这差不多就是我想要的,我来编辑一下,这里改改那里改改”。

说到底,根本问题在于我们人类是懒惰的。我们不想把所有……我们并不真的愿意把自己的意思全部打出来,而我认为 AI 系统实际上会帮助解决一部分这个问题。

提升提示词的具体建议

Lenny: 那么,在那一天到来之前,大家在使用比如 ChatGPT 写提示词时,可以做哪些改进?我举个例子。Tim Ferriss 提过一个很好的建议,我一直在偷师——就是当你准备做访谈时,你去 ChatGPT。所以这次我就为你这么做了。我说”嘿,我要在我的播客上采访 Logan Kilpatrick,他是 OpenAI 的开发者关系负责人。以 Tyler Cowen 的风格给我十个问题”。Tyler Cowen 我觉得是最好的访谈者,他特别擅长问非常尖锐、原创的问题。所以你有什么建议能帮我改进这个提示词、获得更好的结果吗?那些问题还不错,挺好的,也挺有趣,但没有到那种”天哪,这些问题太厉害了”的程度。所以在这种场景下,你会给我什么建议?

Logan Kilpatrick: 这是一个很好的例子,你需要思考你在问的那个人是谁。我可能不是一个在互联网上有足够多信息的人,模型在训练中并没有掌握我背景的细节。我想如果你的嘉宾更有名,互联网上可能有足够的上下文来回答这些问题。实际上你需要自己做一些工作。比如说,如果你使用了 Bing 联网浏览功能,你可以说”这里是 Logan 的博客链接,还有他谈到的一些内容。这是他的 Twitter 链接。去看看他的一些推文和博客文章,找出他有哪些有趣的观点值得在播客中展现”,诸如此类。

这又是给模型足够的上下文来回答问题。我觉得,那个提示词对于某些人来说可能效果很好——比如你去采访 Tom Cruise 这样在互联网上有大量信息的人,可能效果会好一些。

Lenny: 所以建议就是多给上下文。它不会跟你说”嘿,我对 Logan 其实不太了解,给我更多信息”。它就是直接给你一堆好问题。

Logan Kilpatrick: 没错。它太想回答你的问题了。它根本不在意自己没有足够的上下文。它是你能想象的世界上最渴望回答问题的人,没有那些上下文,就很难给出任何有价值的东西。如果我们要印 T 恤的话,上面应该写着”上下文就是你所需要的一切,上下文是唯一重要的东西”。让语言模型为你做任何事情,上下文是极其重要的一环。

Lenny: 还有其他建议吗?就是大家坐在那里,也许现在正打开 ChatGPT 在写提示词,你还有什么能帮助他们获得更好结果的建议吗?

Logan Kilpatrick: 我们其实有一份提示词工程指南,大家可以去看看,里面有一些示例。具体能在多大程度上提升性能,取决于各种因素。有很多很小但看起来有点傻的做法,比如加一个笑脸表情,就能提升模型的表现。我相信大家见过很多这类看起来很傻的例子——让模型休息一下再回答问题,诸如此类。再想想看,之所以如此,是因为训练这些模型的语料库(corpus)就是人类之间互相发送的信息。你告诉一个人”我休息一下再回来工作,状态会更清醒,回答问题会更好,工作也会更出色”——这些模型也遵循非常类似的规律。同样地,当我看到消息末尾有一个笑脸,我会觉得这是一次积极的互动,我应该更愿意给出一个好回答,在对方要求的事情上花更多心思。

Lenny: 哇,等等。所以这是真的?加一个笑脸表情确实可能给你更好的结果?

Logan Kilpatrick: 再说一次,所有这些东西的挑战在于它非常微妙,而且性能提升幅度很小。你可以想象大概百分之一二的水平,对于几句话的回答来说可能根本看不出区别。但如果你在生成一整部长篇文本,笑脸表情可能确实会带来实质性的差异,对于简短的文本内容可能就看不出来了。

GPTs 的推出

Lenny: 好的,好建议。太神奇了。好,我们之前聊到了 GPTs——也许可以介绍一下你们推出的这个新东西 GPTs 是什么?我也很好奇它的进展。这是 OpenAI 一个很大的变化和新要素,就是你可以构建自己的迷你——我差点自己在解释了——迷你版 ChatGPT,然后人们可以……我觉得你可以收费?你可以对自己的 GPT 收费,还是现在全部免费?

Logan Kilpatrick: 现在全部免费。

Lenny: 好的。我猜未来大家应该可以收费。所以现在有了这个完整的商店。基本上就是你们推出的一个完整的应用商店。进展如何?有什么动态?有什么让你意外的地方?大家需要了解什么?

GPTs 的实际价值与未来潜力

Logan Kilpatrick: 进展很好。再说一下,过去如果你有一个很酷的 ChatGPT 用例,想分享给别人,你实际上得进去跟模型开始一段对话,用提示词引导它做你想做的事,然后在对话中的操作还没发生之前就把那个链接分享给别人,说”来,你可以在 ChatGPT 里接着我开的这个对话聊下去”。

GPT 改变了这一点——你把所有重要的上下文预先放进模型里,然后人们就可以去跟一个定制版的 ChatGPT 聊天。真正有趣的是,你可以上传文件,可以给它自定义指令,可以添加各种工具。比如内置了代码解释器,可以做数学运算;还内置了浏览功能、图像生成功能。对于更高级的开发者用例,你还可以连接外部 API——比如 Notion API、Gmail API 等等,让它真正替你执行操作。

大家解锁了非常多很酷的东西。最让我兴奋的,其实是非开发者现在也能去解决那些非常非常有挑战性的问题了——只要给模型提供足够的上下文,告诉它问题是什么,它就能解决。回到”上下文就是你所需要的一切”这个理念,在 GPT 的场景下确实如此:给够上下文,你就能解决更有趣的问题。

这方面让我兴奋的事情太多了。关于变现,本季度晚些时候商店上线后,人们可以根据谁在使用自己的 GPT 来获得收入,这将是一个巨大的解锁,会让很多人看到这里的机会。我也认为继续为不会写代码的人提供更多 GPT 能力是非常令人兴奋的。就算是我作为一个软件工程师,把 Notion API 或 Gmail API 接到我的 GPT 里也不是特别容易。我更希望能一键用 Gmail 登录,然后我的 Gmail 就能被访问了,或者别人也能登录自己的 Gmail 并授权访问。我觉得这些功能随着时间推移都会到来,但今天来看,自定义提示词基本上还是 GPT 最大的价值所在。

Lenny: 太棒了。我在另一个显示器上打开了,Canva 的 GPT 目前排在第一。我刚才一边跟你聊一边试着玩一下,想做一个大横幅写着”关键在上下文啊傻瓜”,但没成功,肯定是我哪里操作不对,不过我也没太专注在上面毕竟咱们在聊天。确实很酷。最后再问一个问题:你有没有看到过谁做了一个 GPT,让你觉得”哇,太厉害了,太酷了”,有让你惊喜的?我也分享一个我觉得很酷的例子,你听到这个问题时有想到什么吗?

Logan Kilpatrick: 我的第一反应是 Zapier。Zapier 围绕 GPT 做的所有东西都是你能想象到的最有用的。你能用它做到的事情非常深入……我不确定 Zapier 的 GPT 目前是怎么打包的,但作为第三方开发者,你实际上不需要会写代码就能把 Zapier 集成到你的 GPT 里。他们在这方面推进了很多,基本上 Zapier 目前支持的 5000 种连接你都可以带入你的 GPT,让它基本上什么都能做。所以我对 Zapier 和基于它们构建的开发者都感到非常兴奋,用那个平台能解锁太多东西了。对于非开发者来说,这可能是我觉得最令人兴奋的。

Lenny: 太棒了。Zapier 总是能在那里把东西串起来。

Logan Kilpatrick: 是的,他们很棒。

Lenny: 我想到的那个例子是,我有个朋友,他是一家叫 Runway 的公司的 CEO,做了一个叫 Universal Primer 的东西,帮助人们学习。它的描述是”关于任何事物,学习一切”,基本上是一种苏格拉底式的方法来帮你学习。比如你说”解释一下语言模型中 transformer 是怎么工作的”,然后它会逐步讲解并提问,帮你学习新概念。我觉得它是教育类 GPT 里排名第二的。

Logan Kilpatrick: 我很喜欢那个。他确实很厉害。

OpenAI 的工作方式与快速迭代

Lenny: 我想聊聊在 OpenAI 工作是什么感觉,产品团队怎么运作,公司怎么运作。你之前待过的两家公司是 Apple 和 NASA,这两家都不以速度见长。而现在你在 OpenAI,以速度极快著称——对某些人来说可能太快了,就像我们看到的那次董事会事件。所以我很好奇,OpenAI 到底做对了什么,才能以这么高的标准这么快地构建和发布?有没有什么流程或工作方式是你觉得其他公司也应该尝试的,以便更快地行动、发布更好的产品?

Logan Kilpatrick: 这里面有非常多有趣的权衡和围绕公司行动速度的张力。对我们来说,如果你以 Apple 和 NASA 为例,它们都是比较老牌的机构,随着时间的推移,趋势就是事情变慢。越来越多的检查和制衡机制被建立起来,拖慢了进度。我们还年轻,是一家新公司,所以没有太多那种随着时间积累下来的制度性障碍。

高能动性与高紧迫感

Logan Kilpatrick: 我觉得最重要的一点——Sam 似乎在 2022 年左右发过一条推文谈到这个——找到具有高能动性并且带着紧迫感工作的人,这是最重要的……如果今天让我招五个人,这两项特质是我最看重的。因为如果你身边都是高能动性的人,不需要去获取五十个人的共识——你信任这些高能动性的人,他们可以直接去做该做的事——我觉得这是最重要的,如果把一切浓缩到本质的话,这就是最关键的东西。

我和身边的同事都能看到这一点。大家的能动性非常高。看到问题就直接上手解决。听到客户反馈什么困难,就已经在推进解决方案了,而不是等待其他环节——我觉得传统公司就是被这些拖住了,“哦,先跟七个部门确认一下,收集反馈。“我们的人直接去做,解决问题。我非常喜欢这一点。能成为这种环境的一部分,太有意思了。

Lenny: 太酷了。我特别喜欢这两个特质,因为之前没听人这么说过。这两点可能是你们最看重的——高能动性、高紧迫感。为了让大家对这两个词在招聘中的具体表现有更清晰的认识,你刚才举了一个客服的例子,听到一个 bug 就去修。还有没有其他例子能说明高能动性是什么样的?紧迫感呢,除了”快快快,发发发”之外,还有什么更具体的体现?

Logan Kilpatrick: 我们在 Dev Day 发布的 Assistants API 就是个很好的例子。我们不断收到开发者的反馈,说希望在现有 API 之上有更高层的抽象。然后团队里一群人就凑到一起说,“嘿,我们来规划一下,看看怎么做一个这样的东西。“然后很快就协作开发了实际的 API,现在这个 API 驱动着市面上大量的助手应用。我觉得这是一个很好的例子——它不是自上而下的,不是某个人坐在那里说”我们做这五件事”,然后”好,团队去执行”。而是大家真正看到了问题,并且知道可以作为一个团队迅速聚在一起解决这些问题。Assistants API 就是一例,类似团队主动出手的情况还有无数个,但这个是我在脑海中首先想到的。

OpenAI 的规划与优先级

Lenny: 这就让我想问了——OpenAI 的规划是怎么做的?在这个例子里,感觉就是”嘿,我们觉得需要做这个,那就去做吧。“但我想应该还是有路线图、优先级、目标之类的吧?路线图制定和优先级排序一般来说是怎么运作的,才能允许这种事情发生?

Logan Kilpatrick: 我觉得这是 OpenAI 更有挑战性的部分之一。挑战很多。所有人都想从我们这里得到一切,尤其是在 ChatGPT 如此庞大、我们的 API 使用如此广泛的今天,人们会直接来说”嘿,我们要所有这些东西。“我们有一系列核心指导原则。首先回到使命——这件事真的能帮助我们迈向 AGI 吗?所以焦点在于:眼前可能有一个闪亮的诱惑——比如优化用户参与度之类的东西——但那真的是我们该做的吗?也许答案是肯定的,也许那确实能帮我们更快走向 AGI,但用这个透镜来审视一切,我认为永远是做任何决策的第一步。

在开发者这一侧,也有一些核心原则,比如可靠性——“嘿,如果我们增加各种很酷的新 API、新端点、新模态、新抽象,那当然很好,但我们有没有给客户提供稳健可靠的 API 体验?“这往往是第一个问题。我觉得我们在这方面有过做得不够的时候,当时还有很多其他想做的事情,但我们必须把焦点和优先级拉回到可靠性上——因为说到底,如果你的东西别人没法稳定可靠地使用,那再好也没人在乎。

所以有这些核心原则。我想再说一次,除了这些决策原则之外,实际的规划流程其实相当标准化。我们聚在一起,有 H1、Q1 的目标,大家全力冲刺。我觉得真正有意思的是事情随时间如何变化。你以为要做这些高层级的事情——新模型、新模态,等等。然后随着时间推移,各种动荡和变化层出不穷。有趣的是如何建立机制来说,“嘿,当脚下的地面不断变化时——就像今天 AI 领域的疯狂一样——我们如何更新对世界的理解、更新我们的目标?”

Lenny: 有意思,听起来跟大多数其他公司差不多。有 H1 规划,有 Q1 规划。那你们有没有具体的指标和目标?比如 OKR 之类的?还是说就是”好,我们要发布这些产品”?

Logan Kilpatrick: 我觉得粒度要高得多。说实话,我不认为 OpenAI 是一个很 OKR 导向的公司。我不觉得各团队现在在做 OKR,我也不太清楚为什么会这样。我甚至不知道 OKR 是不是还是行业主流。你大概在跟更多做这类决策的人聊,所以我反而好奇——你从其他人那里看到的情况是怎样的?OKR 现在还普遍吗?

Lenny: 是的,绝对普遍。很多公司用 OKR,喜欢 OKR。也有很多公司讨厌 OKR。OpenAI 不是一个 OKR 驱动的公司,我并不意外。沿着这个话题,我不知道这些你能分享多少——你们怎么衡量发布的东西是否成功?我知道有 AGI 这个终极目标,那有没有什么方式追踪我们离它越来越近了?发布 GPT Store 或者 Assistants 之类的东西时,你们还会看什么,来判断”好,这正是我们期望的”?就是看采用率吗?

Logan Kilpatrick: 是的,采用率是一个很好的指标。还有一系列围绕收入的指标、在我们平台上构建应用的开发者数量等等。我不想深入太多——让 Sam 或者我们领导团队的其他人来谈更多细节。但我觉得其中很多指标其实是对其他东西的代理。即使收入是一个目标,收入本身并不是真正的目标。收入是获取更多算力的代理,而算力才是真正帮助我们获得更多 GPU、训练更好的模型、最终达成目标的手段。所以有这些中间层——即使我们说某件事是目标,你单独听到可能会想,“哦,OpenAI 就想赚钱。“但实际上,钱是获得更好模型的机制,这样我们才能实现使命。我觉得这些角度都很有意思。

Slack 与沟通文化

Lenny: 我不确定我是否听说过比这更宏大的公司愿景——构建通用人工智能。我很喜欢这一点。我想很多公司大概都在想,“我们的版本是什么?“在离开这个话题之前,你有没有看到 OpenAI 还有什么做得特别好的地方,让它能这么快地行动、这么成功?你谈到了招聘高能动性、高紧迫感的人。还有没有什么让你觉得,“哇,这真是一种很好的运作方式?“我想其中一部分可能就是招到了极其聪明的人,这点大概不用明说。但除此之外还有别的吗?

Logan Kilpatrick: 我觉得使用 Slack 带来了不可忽视的好处。这可能有些争议,也许有些人不喜欢 Slack,但 OpenAI 的文化重度依赖 Slack,这真的……Slack 上的即时实时沟通至关重要。我非常喜欢可以把不同团队的人拉进来,让大家迅速汇聚到一起。所有人都一直在 Slack 上,所以不管你是远程的、在不同团队、还是在不同的办公室,公司文化很大一部分都深植在 Slack 里,它让我们能非常快速地协调,有时候给某人发一条 Slack 消息甚至比走到他工位还快,因为他就挂在 Slack 上,而且肯定在看。

我看到——不知道你有没有看——最近 Sam 和 Bill Gates 的那次访谈,Sam 说到 Slack 是他手机上使用时间最长的应用,“我甚至都不看手机上的使用时间了,因为我不想知道自己用 Slack 用了多久。“但我确信 Salesforce 那边的人看到这些数据肯定觉得,“这正是我们想要的。”

Lenny: 我也很喜欢 Slack,我是 Slack 的大力推广者。我知道有很多人黑 Slack,但它真的是一个非常好的产品。我试过很多替代品,没有一个能比的。我觉得对你们来说 Slack 有趣的一点是——你都不知道里面会不会有一个 AGI,不是真正的人,就在公司里工作。

Logan Kilpatrick: 我知道里面都是真人。目前还没有 AGI。不过我觉得,Slack 自己也在做很多很酷的 AI 工具,我很期待能用到。这也是为什么现在有这么多令人兴奋的 AI 进展。说到底,作为所有这些新 AI 产品的消费者,真的很令人激动。Google 就是个很好的例子——我很高兴 Google 在做很酷的 AI 东西,因为我是 Google Docs 的用户,我很喜欢用 Google Docs,还有他们其他一些产品。看到大家在围绕这些模型构建如此有用的东西,太棒了。

团队规模

Lenny: OpenAI 团队现在大概多大了?你能分享多少就分享多少,给大家一个规模感。

Logan Kilpatrick: 我记得去年年底公开的数字大概是 750 人左右,780 之类的。我们现在还在快速增长,所以具体最新的数字我就不当那个披露的人了,但团队正在疯狂扩张,我们的工程团队和产品经理团队也都在招人。如果有朋友感兴趣,非常欢迎来聊聊。

Lenny: 也许再问最后一个问题。你们在增长,可能要接近 1000 人了,但显然仍然非常创新,行动速度极快。你有没有观察到 OpenAI 在保持创新、不让新的大想法慢下来方面,有什么做得好的地方?

研究团队与小团队优势

Logan Kilpatrick: 有几件事。其中一件是,实际的研究团队——他们孵化了 OpenAI 大部分的创新——被有意保持在一个小规模。OpenAI 的大部分增长都集中在面向客户的角色、为 ChatGPT 等产品提供基础设施的工程角色上。研究团队是刻意保持小规模的。而且有各种各样的讨论,这真的很有意思。我刚看到我们一位研究人员发的帖子,他在讲:在一个受 GPU 算力容量约束的世界里——这对 OpenAI 的研究人员来说是现实,对其他所有地方的研究人员也是一样——每增加一名新的研究人员,对整个研究组来说实际上是一个净生产力损失,除非这个人能以一种如此深刻的方式提升所有其他人的水平,从而提高整体效率。

如果你只是加一个人,让他去搞一个完全不同的研究方向,那现在你就得跟他共享 GPU,其他所有人的实验都变慢了。所以这是研究人员面临的一个非常有趣的权衡,我觉得做产品的人不会遇到这种情况——如果我给 API 团队或某个 ChatGPT 团队加一个工程师,他们确实能写更多代码、做更多事情,这对所有人都是一个净正面的改善。但对研究人员来说并非总是如此,这是很有意思的一点,至少在一个 GPU 受限的世界里是这样——希望我们不会永远处于这种状态。

未来方向与新模态

Lenny: 我想把视角拉远一点,然后还有几个后续问题。OpenAI 接下来的方向是什么?大家应该预期你们即将推出和发布的工具有哪些?

Logan Kilpatrick: 新的模态。我认为 ChatGPT 会持续拓展各种可能的交互体验。今天的 ChatGPT 基本上还是文本输入、文本输出——或者应该说三个月前还只是文本输入、文本输出。我们已经开始改变这一点:现在你可以用语音模式,可以生成图片,可以拍照。所以我认为,持续扩展你与 AI 交互的方式,是 ChatGPT 接下来要做的事情。

我认为 GPTs 是我们迈向代理未来的第一步。同样,今天你使用一个 GPT 的时候,基本就是你发一条消息,几乎立刻得到一个回答,交互就结束了。我觉得随着 GPTs 变得更加成熟,你实际上可以说,“嘿,去做这件事,做完了告诉我。我现在不需要答案,我想让你真正花时间、认真对待这件事。”

回想一下所有那些人类类比——我们作为人类就是这么做的。当我请别人帮我做一件重要的事情时,我不指望他立刻做完、立刻把答案给我。所以我认为,推动更多这样的体验,将为大家释放多得多的价值。

最后一点是,GPTs 作为一个机制,把接下来几亿人带进 ChatGPT、带进 AI。我觉得如果你跟那些不近距离接触 AI 领域的人聊过,很多时候你会发现——即使他们听说过 ChatGPT(很多人其实没听说过),但当他们打开 ChatGPT,面对那个空白界面,他们会觉得,“我真的不知道我该拿这个东西做什么。它什么都能做,但不清楚它到底怎么解决我的具体问题。”

但 GPTs 的厉害之处在于,你可以把它打包成——“这是 AI 可以为你解决的一个非常具体的问题,而且做得非常好”——我可以把这个体验分享给你,你去试试那个 GPT,它真的帮你解决了问题,然后你会想,“哇,它帮我做了这件事。也许我应该花点时间看看我另外五个问题,看看 AI 是不是也能解决它们。“所以我觉得会有非常非常多的人开始上线、开始使用这些工具,因为那些非常窄的垂直工具对他们来说将是一个巨大的解锁。

GPT-5 的预期与现实

Lenny: 那么在刚才说的这个情况里,其实就是一个典型的横向产品问题——它能做的事情太多了,人们反而不知道它到底能为自己做什么。所以,转向更模板化、更针对具体使用场景、帮助用户上手,这些都非常合理。这也是很多 SaaS 产品面临的共同难题。你提到的另外几点也非常有意思,基本上就是更多交互界面,让人们更方便地与 OpenAI 的语音交互。你提到了音频之类的,这些都很有道理。然后就是代理这个方向,核心理念是——不再仅仅是一个聊天,而是”嘿,帮我把这件事做了”。

关于 GPT-5,我们之前稍微聊到过。大家对更强的版本有很多猜测,我觉得人们对 GPT 的未来发展抱有一些不切实际的期望——GPT-5 会解决世界上所有的问题。我知道你不会告诉我它什么时候发布、会做什么,但我从一个朋友那里听到过一个建议:今天构建产品时,应该面向 GPT-5 的未来来构建,而不是基于 GPT-4 目前的局限。为了帮助大家做到这一点,在 GPT-5 的世界里,哪些方面可能会变得更好?仅仅是更快吗?仅仅是更聪明吗?还是会有其他让人惊叹的东西,让人觉得”我真的应该重新思考我设计产品的方式”?

Logan Kilpatrick: 如果大家看过我们在三月份 GPT-4 发布时公布的技术报告,GPT-4 是我们训练的第一个模型,能够根据我们投入的计算量可靠地预测其能力。我们做了一项实证研究来展示——“这是我们的预测,这是实际的结果。“所以,作为一个对技术感兴趣的人,我觉得值得关注的是这个规律在 GPT-5 上是否仍然成立,希望在那个模型发布时我们能看到相关信息。

我同时也觉得可以得出几个观察。其中一个就是 GPT-4 发布后,世界的共识是”一切都变了。一切都突然不同了。这改变了世界,改变了一切。“然后慢慢地,大家回归现实——“这是一个非常有效的工具,它能更有效地帮我解决问题。”

我认为这毫无疑问是人们看待所有模型进步应该采用的视角。GPT-5 肯定会非常有用,会解决一些全新层级的问题。希望它会更快,希望在各方面都会更好,但从根本上说,世界上存在的问题还是那些问题,你只是有了一个更好的工具来解决它们。

回到垂直使用场景,我认为那些在解决非常具体场景的人,只是会能够做得更加高效。我不认为……人们对 GPT-5 有些不切实际的期望,觉得它会在背景里后空翻,同时帮我写代码,还替我跟妈妈打电话之类的。

这不是事实。它只会是一个非常有效的工具,跟 GPT-4 非常相似,而且它也会非常快地变得稀松平常。我觉得这其实是一个非常有趣的点。如果你能提前规划一个人们很快就会习惯这些工具的世界,我认为这本身就是一种优势。而假设这个东西会彻底改变一切——在很多方面我认为这反而是一个劣势——这是看待这些工具面世时错误的思维框架。

OpenAI 的 B2B 产品

Lenny: 顺着这个方向,你们在 B2B 产品上投入了很多。我上次听说,收入的一半是 B2B,另一半是 B2C,不过不确定是不是真的。作为一家公司、一个企业,如果与 OpenAI 合作,你能获得什么?它能解锁什么?是不是叫 OpenAI Enterprise?它叫什么,能获得什么?

Logan Kilpatrick: 好的,我觉得我们很多 B2B 客户是通过 API 来构建产品的,这是一个方面。如果你是 ChatGPT 的 B2B 客户,我们销售 Teams 版,就是把多个 ChatGPT 订阅打包在一起。我们也有 ChatGPT 的企业版。企业客户需要一堆企业级功能,比如 SSO 之类的,这些都跟 ChatGPT Enterprise 相关。

我觉得最酷的其实是能在内部共享一些提示词模板和 GPTs。你同样可以创建非常适合你公司的定制化工具,使用与解决你公司问题相关的所有信息,并在内部共享。对我来说,你肯定希望能跟团队成员协作你用 AI 创建的那些很棒的东西。所以这对企业来说是一个巨大的解锁。我认为这是两个最大的价值点。还有一些更高的模型使用限额之类的,但我觉得能共享你非常垂直的专业应用才是最有用的。

Lenny: 如果有公司在听这个播客,而且觉得很多员工都在用 ChatGPT,最简单的做法就是把它整合成一个企业账户,加上单点登录,这大概能省钱,也更容易协调和管理。

Logan Kilpatrick: 对,还有很多安全方面的功能,比如你想控制——你不希望员工使用 GPT Store 里的某些 GPTs,因为你担心安全或隐私之类的问题。你不想让你的私密数据流到不该去的地方。注册企业版就很有意义,这样你就能对正在发生的事情有更多控制。

即将发布的新功能

Lenny: 好的,明白了。明天有一场发布会,在我们录制这期节目之后。你能聊聊有什么新的东西、即将发布什么吗?我想这期节目会在录制几周后才上线,但大家应该知道明天 OpenAI 在我们的领域有什么新东西发布?

Logan Kilpatrick: 好的,更新了,有几件不同的事情。简单来说,更新了 GPT-4 Turbo 模型,也更新了在 Dev Day 上发布的预览模型,有了一个更新版本。它修复了这个问题——如果大家在网上看到过人们讨论的模型”懒惰”现象——我们在这方面做了改进,修复了很多出现这种情况的场景。所以希望模型会不那么”懒惰”一点。最关键的是第三代嵌入模型。我们之前在录制前聊过嵌入的各种酷炫使用场景。如果大家之前用过嵌入,它本质上是支撑很多”用你自己的文档或你自己的语料库进行问答”的技术。就像你说的,你有一个网站,人们可以在上面针对播客录音提问。

Lenny: Lennybot.com,去看看吧。

Logan Kilpatrick: 对,lennybot.com。我的推测是 lennybot.com 实际上就是基于嵌入运行的。所以你把整个语料库——所有的录音、你的博客文章——全部做嵌入,然后当人们提问时,你就可以去比对问题和知识库之间的相似度,进而给出一个答案,并且引用一个实证事实,也就是你知识库中真实存在的内容。这非常有用,大家在这方面做了大量的工作。它的核心思路就是让这些模型扎根于现实、扎根于它们已知为真的内容。我们知道你播客中的所有内容至少是你曾经说过的,在这个意义上是真实的,我们可以把它们带入模型针对问题生成的回答中。所以这会非常酷。

新的 V3 嵌入模型,同样是业界最先进的性能。很酷的一点是非英语语言的性能有了极大提升。我觉得过去大家基本上只能用嵌入做英语的内容,而且效果也只有在英语上才真正好。而现在我觉得你可以在那么多新的语言上使用了,因为跨语言的性能确实提升了很多,而且价格也降到了原来的五分之一,这太棒了。没有什么比帮大家降低成本更让人开心的了。我很喜欢这件事。我记得现在大概 1 美元可以嵌入大约 62,000 页文本,非常非常便宜。所以嵌入能做的酷事情非常多,很期待看到大家发明出更多新玩法。

产品经理和创始人如何利用 AI

Lenny: 真划算。在进入非常令人兴奋的快问快答环节之前,最后一个问题。假设你是一家大公司的产品经理,或者你是一个创始人,你觉得对他们来说,利用你们正在构建的技术——GPT-4 以及其他所有 API——最大的机会是什么?人们应该怎么思考”我们到底该如何在现有产品中真正利用这种能力”这个问题?或者新产品也可以,你想往哪个方向聊都可以。

Logan Kilpatrick: 我觉得回到”新体验”这个主题,真的很让人兴奋。我觉得消费者会……如果你提供的 AI 体验不仅仅是一个聊天机器人可以获取的那种,你就会比别人有优势。大家大量使用聊天界面,它确实是一个很有价值的服务领域,用户量说明了一切。但我认为那些超越聊天界面的产品,真的会有巨大的优势。另外,也要思考如何把你的使用场景提升到下一个层次。我试过大量非常基础的聊天应用,提供给我的价值很有限,但我会想,“这其实应该走得更远,真正从零开始构建你的核心体验。”

我用过一款产品,它可以让你管理和查看网上围绕某些话题的讨论之类的。所以我可以在网上去看,大家对 GPT-4 都在说什么?而我刚才说出口的那句话——“大家对 GPT-4 都在说什么”——就是我真正想问的问题。在今天典型的产品体验中,我得进入一堆仪表盘,调整一堆筛选器之类的东西。而我真正想要的只是直接问我的问题:大家在做什么?大家对 GPT-4 在说什么?然后以一个有数据支撑的方式得到答案。

我也看到有人解决了这个问题的一部分,比如他们会展示,“哦,这里有几个人在说什么什么”,但这其实不是我想要的。我想要的是对整体情况的总结。我觉得实现这一点只需要再多一点工程上的努力。但我认为那种才是真正的魔法解锁感——“哇,这是一个不可思议的产品,我会一直用下去”,而不是”嗯,这个有点用,但我真的想要更多”。

Lenny: 太棒了。我来推荐一款产品。我不是投资人,但我认识创始人,叫 visualelectric.com,我觉得它做的正是你说的这件事。它基本上是一个专门为创意人士打造的工具,我觉得主要是平面设计方向,帮助他们创作图像。市面上有 Dali 之类的东西,但这个把它带到了一个全新的高度——它是一种画布,一个无限画布,你可以在上面生成图像、编辑、微调,不断迭代直到得到你需要的东西。Visualelectric.com。

Logan Kilpatrick: 我要去试试。它跟 Canva 类似吗?

Lenny: 我觉得它更细分,面向更专业的平面设计,大概是这样的使用场景。但我不是设计师,所以不是目标用户。不过我妻子是平面设计师。她以前从没用过 AI 工具。我把这个给她看,她就上瘾了。她都没告诉我一声就直接付费了,然后用它创作了我们家狗的图像和各种艺术作品。现在那些作品出现在我们电视上了。她创作的那些艺术作品现在就放在……我们有一个画框电视,那个就是电视上显示的画面。所以……

Logan Kilpatrick: 我太喜欢这个了。那个叫什么来着?

Lenny: Visualelectric.com。总之,在进入非常令人兴奋的快问快答之前,你还有什么想补充或分享的吗?

给 AI 开发者的建议

Logan Kilpatrick: 我在网上和其他场合说过几次这句话,但对于那些有酷想法、想用 AI 来实现的人来说,现在就是时候。有太多酷的事情需要用 AI 来为这个世界构建。还是那句话,如果我或 OpenAI 团队的其他同事能帮你迈出开始构建很酷的东西的第一步,请随时联系。这个世界需要更多用这些工具做出的优秀解决方案,也很期待看到大家在构建的厉害作品。

Lenny: 我本来打算最后再问你这个问题的,但大家怎么联系你呢?最好的方式是什么?

Logan Kilpatrick: Twitter、LinkedIn。我的邮箱应该在网上能找到。我不想在这里说出来然后被邮件淹没。如果你需要的话,应该能在网上找到我的邮箱。不过 Twitter 和 LinkedIn 通常是最方便的。

Lenny: 在 Twitter 上怎么找到你?

Logan Kilpatrick: 就是 Logan Kilpatrick,或者我的显示名好像是 Logan.GPT 或者——

Lenny: Logan.GPT?

Logan Kilpatrick: 或者 official Logan K。

Lenny: 好的,太棒了。我们会在节目简介里放上链接。太好了。Logan,说到这里,我们进入非常令人兴奋的快问快答环节。准备好了吗?

Logan Kilpatrick: 准备好了。

快问快答

Lenny: 第一个问题,你向别人推荐最多的一两本书是什么?

Logan Kilpatrick: 第一本是很久以前读过、最近又重读的一本书,是 Sal Khan 写的《一间教室的学校》(One Room Schoolhouse)。非常精彩。对,我不想……这是快问快答所以我不多说,但故事非常精彩,而且 AI 正是能让 Sal Khan 的”每个学生一位老师”愿景真正实现的技术。所以我对这个特别兴奋。另一本是我一直反复推荐的是《我们为什么需要睡眠》(Why We Sleep)。睡眠科学太酷了。如果你不关注自己的睡眠,这可能是你能为自己做的最大的提升之一。

Lenny: 你最近最喜欢的一部电影或电视剧是什么?

Logan Kilpatrick: 我对那种鼓舞人心的真人故事毫无抵抗力。最近假期里我和家人一起看了《Gran Turismo》这部电影,讲的是一个伦敦小孩,从小玩 SIM racing(模拟赛车),然后参加了一场比赛,最终通过某个竞赛成为了一名真正的职业赛车手。看到一个人从开虚拟赛车到开真正的赛车,参加勒芒 24 小时耐力赛什么的,真的很酷。

Lenny: 我以前也玩过那个游戏,挺好玩的,但我完全不觉得自己有能力驾驶一辆真正的赛车。所以那个故事确实很鼓舞人心。你在面试候选人时,有没有一个特别喜欢问的面试问题?

Logan Kilpatrick: 有的。我一直很想知道,别人有什么东西是他们深信不疑但别人却不认同的。

Lenny: 你在回答中会寻找什么信号,让你觉得”哇,这是一个非常好的信号”?

Logan Kilpatrick: 很多时候,这个问题本身就挺有意思的,但它也……我觉得看到一个人内心深处坚定的信念是什么,这件事本身很有意思。不是说我要判断我自己是否也认同,而是单纯好奇人们为什么会那样想。

最近发现的好产品

Lenny: 你最近有没有发现一个特别喜欢的产品?

Logan Kilpatrick: 顺着睡眠这个话题,我有一个特别好的睡眠眼罩,是一家叫……不是广告啊,我只是随口说说,叫 Manta Sleep 什么的。它是一个加重的睡眠眼罩,戴上感觉特别棒。我也不知道,可能就是我的头比较重之类的,但晚上戴着加重的眼罩确实很舒服。我真的很喜欢。

Lenny: 我有一款与之竞争的睡眠眼罩,我也非常推荐。我找一下。我在newsletter的送礼指南里已经给好几个人推荐过了。

Logan Kilpatrick: 是吗。

Lenny: 我最喜欢的那款叫 Waoaw Sleep Mask,W-A-O-A-

Logan Kilpatrick: 你喜欢它什么?

Lenny: W-A-O-A-W。我会在节目备注里放链接。它的空间很大,整体很大,给眼睛留了足够的空间,所以睫毛什么的、眼睛不会被压到,而且戴在头上非常贴合。我妻子和我晚上都戴眼罩。说到睡眠,这确实帮了我们睡得更好。它没有加重的部分,所以也许值得试试你那款,但每个我推荐过的人都跟我说,“这改变了我的生活,谢谢你帮我睡得更好了。“所以我们会在节目备注里放链接。

Logan Kilpatrick: 看看这个。

Lenny: 看看我们俩。真是太成年人的话题了。还有两个问题。你有没有一个经常回来的人生格言,会分享给朋友或家人的,不管是在工作还是生活中?

人生格言

Logan Kilpatrick: 有。我贴了一个便利贴……就贴在我摄像头后面,上面写着”以百来衡量”(Measure in hundreds)。我特别喜欢以百为单位来衡量事物这个理念。这主要是给那些刚开始某段旅程的人的。我经常和人聊天,他们会说,“嗯,我试过这个东西,但没用。“如果你的思维模式是”以百来衡量”,那你失败了五次就等于零次——你根本还没有真正尝试过。我特别喜欢这个理念。它很好地提醒你,生活中一切都是建立在复利和多次尝试之上的。如果你没有尝试足够多次,你永远不可能成功。

Lenny: 我很喜欢这个。我能理解为什么你在 OpenAI 做得很成功,为什么你很适合那里。最后一个问题。我让 ChatGPT 给我想了一些很蠢的问题。“给我一些蠢问题来问 Logan Kilpatrick,OpenAI 开发者关系负责人。“我过了一遍,这里挑了三个,但我只选一个。如果一个 AI 开始做单口喜剧,你觉得它最常讲的笑话或关于人类的有趣观察会是什么?

AI 的单口喜剧

Logan Kilpatrick: 我觉得今天的话,如果你真的去做这件事,我觉得最常见的笑话会是类似”So an AI walks into a bar”这种,可能是因为,说到底它是基于某个训练数据分布训练出来的,而这恰好是最常见的笑话类型。这大概就是……我在想如果你现在编一个笑话出来,它会不会出现在某个训练样本里。

Lenny: 我太喜欢了。但笑话是什么?我们需要笑话。我们需要笑点。我开玩笑的,我知道你不可能当场编出一个精彩的——

Logan Kilpatrick: 这就是我们 ChatGPT 存在的意义。

Lenny: 我们已经被淘汰了。太棒了。Logan,非常感谢你能来。最后两个问题,虽然你已经分享过这些信息了,但还是帮大家回顾一下。人们可以在哪里找到你,如果想联系你、问你更多问题?以及听众怎么能帮到你?

联系方式与反馈

Logan Kilpatrick: Twitter 和 LinkedIn,Logan Kilpatrick,或者 Twitter 上是 Logan.GPT。请给我发消息。我收到大量的私信,内容总是非常有趣。我觉得希望大家帮忙的是,如果你们在 ChatGPT 中发现 bug 或者有不好用的地方,我经常看到有人说”这个功能不太好用”。关键在于——我觉得我们 OpenAI 在向用户传达这一点上需要做得更好——有分享的对话链接或者实际的、可复现的具体示例,是我们真正修复用户问题所需要的两样东西。模型偷懒就是 一个很好的例子,当时很难弄清楚到底怎么回事,因为人们会说”模型变懒了”,但很难弄清楚他们当时用的是什么提示词,什么示例,所有那些东西。所以遇到不好用的地方请把这些示例发给我们,我们会为你改进。

Lenny: 太好了。我也想提醒大家一下,如果你正在听这个,觉得”哦,好的,关于 OpenAI 和 ChatGPT 有很多很酷的想法”,你需要做的就是直接去 chat.openai.com,亲自试试这些东西。很多人只是在理论层面讨论,但我觉得一旦你真正开始动手,你会以不同的视角看待这些事情。到现在,我每天都在上面做点什么——比如问它面试问题的灵感,为一个 newsletter 文章做研究——它就是一个我总是会回到的标签页。我知道有很多人只是在谈论这类事情,我只是想提醒大家:直接去。注册。玩一玩。问你正在做的事情相关的问题,看看效果如何,然后持续回来用。关于这方面,你还有什么想分享的来激励大家尝试一下吗?

Logan Kilpatrick: 说得好。我觉得有一个说法是人们担心人类会被 AI 取代,我在网上也看到了这种叙事——但实际上不是 AI 要取代人类,而是那些被 AI 增强了、正在使用 AI 工具的人会在就业市场等等方面更有竞争力。所以去试试这些 AI 工具吧。现在是最好的学习时机。你会在你的工作和你热爱的事情上变得更高效、更有能力。所以,很期待看到大家用 ChatGPT 做出什么。

Lenny: 而且你可以报销账号费用。大概一个月十块或二十块钱。很多公司都会为你付费,所以问问你老板能不能报销,确保你用的是最新版本。好了,Logan,再次非常感谢你能来。

Logan Kilpatrick: 太棒了,Lenny。感谢邀请我来。问题都很有深度。希望不是全部从 ChatGPT 那儿生成的。

Lenny: 不是,只有最后一个。我确实还准备了不少备选问题,在腰带上——不对,是揣在后兜里,应该是后兜,这个比喻才对——不过我们聊的内容已经够精彩了,所以没来得及用。所以不是的,全是我自己想的。人类 AI。

Logan Kilpatrick: 谢谢。

Lenny: 谢谢,Logan。

Logan Kilpatrick: Lenny.ai。

Lenny: 我喜欢。大家可以去看看 Lennybot.com。好的,谢谢 Logan,大家再见。非常感谢你的收听。如果你觉得这期节目有价值,可以在 Apple Podcasts、Spotify 或你喜欢的播客应用上订阅本节目。也请考虑给我们评分或留下评论,这真的能帮助更多听众发现这个播客。你可以在 lennyspodcast.com 找到所有往期节目或了解更多关于节目的信息。下期再见。

术语表

原文中文
agent代理
AGIAGI(通用人工智能,保留原文)
Assistants APIAssistants API(保留原文)
copilot/CopilotCopilot(保留原文)
corpus语料库
deal flow项目交易流
Dev DayDev Day(开发者大会,保留原文)
Developer Relations开发者关系
diligence尽职调查
empirical study实证研究
fine-tuning微调
GPT StoreGPT Store(保留原文)
GPTsGPTs(保留原文)
GPUGPU(保留原文)
HarveyHarvey(法律 AI 公司,保留原文)
high agency高能动性
OKROKR(目标与关键成果,保留原文)
prompt engineering提示词工程
Rabbit R1Rabbit R1(保留原文)
TLDrawTLDraw(保留原文)
Tom Cruise汤姆·克鲁斯
UXUX(用户体验,保留原文)

此文档由 AI 分片翻译(translate_long_document)