揭秘训练每一个前沿 AI 模型的专家网络 | Garrett Lord

Garrett Lord 2025-08-24

揭秘训练每一个前沿 AI 模型的专家网络 | Garrett Lord


文字记录

Garrett Lord: 再也不会有这样的时刻了。我从未见过这样的景象,我怀疑在商业生涯中再也不会有类似的感受——需求是无限的。你怎么确保三个月后、六个月后自己不会后悔?登上飞机去和客户面谈,深夜加班冲刺,把数据反反复复核查六遍。

Lenny Rachitsky: 你的公司通过创造新数据来持续推进模型的智能水平。这是你在已有业务之上又建起来的一门新生意。

Garrett Lord: 我们是全球最大的专家网络。我们拥有巨大的战略优势——几乎没有客户获取成本。人类数据领域唯一的护城河就是对受众的触达。

Lenny Rachitsky: 你们是在模型训练完成之后介入,根据你们创造的额外数据来调整权重。

Garrett Lord: 模型已经强大到不再需要通才了。他们真正需要的是专家。

Lenny Rachitsky: 一方面是所有这些学生在训练模型变得更聪明,另一方面他们自己可能反而更难找到工作,这两者之间存在一种张力。

Garrett Lord: 我们从雇主那里听到的并不是这样,这只是让人类能够更加高效。过去你会在简历上写”熟练使用 Google 搜索”,因为你是伴随 Google 长大的。作为 AI 原生代,年轻人拥有巨大的优势。

Lenny Rachitsky: 今天的嘉宾是 Garrett Lord。Garrett 是 Handshake 的联合创始人兼 CEO,Handshake 是你可能还没听说过的最有趣、最了不起的 AI 成功故事之一。Handshake 已经运营了十多年,本质上就是大学生的 LinkedIn,是学生与企业对接找工作的平台。它是每一家财富 500 强公司的首选平台。超过 1,500 所高校、超过 2,000 万学生和校友、以及超过 100 万家企业使用他们来招聘毕业生。今年年初,Garrett 和他的团队意识到,他们庞大的、独有的学生网络——其中包括数以万计的博士和硕士——对 AI 实验室来说极其有价值,可以帮助他们创建和标注高质量的训练数据。于是,他们在今年一月从零到一启动了一项新业务。四个月后,ARR 达到了 5,000 万美元。目前他们正朝着 12 个月内突破 1 亿美元 ARR 的速度前进。不到两年,这项新业务的收入就将超过他们经营了十年的老业务。

这是一个真正令人难以置信且罕见的故事,也是我认为很多团队可以从中学习的——AI 正在创造大量机会,但也带来大量潜在的颠覆,而这是一个公司基本上自我颠覆的精彩案例。这期节目干货满满,包括一个入门科普:人们标注和创建数据来训练模型到底是在做什么?非常感谢 Garrett 抽出时间来做这期节目,他的妻子本周刚生了宝宝,同时他还在扩展这项疯狂的新业务。谢谢 Garrett。如果你喜欢这个播客,别忘了在你最喜欢的播客应用或 YouTube 上订阅关注。

Lenny Rachitsky: Garrett,非常感谢你来做客。欢迎来到播客。

Garrett Lord: 谢谢邀请。我是长期订阅者。

Lenny Rachitsky: 感谢支持。好,在我们深入讨论你的数据标注业务那疯狂的轨迹之前——这确实是一个精彩的故事,我认为很多创始人和产品团队在面对这波 AI 颠覆时都能从中学到很多——我想先帮大家理解一下,数据标注到底是怎么回事?人们到底在做什么?为什么这东西这么有价值?当今世界上增长最快的一些公司,包括你们,做的就是这件事。显然这里面有非常重要的东西。我大概算了解一点,可能也不太了解。我想很多听众也有同感。那我就直接问了,数据标注到底是什么?人们到底在做什么?还有,为什么这对前沿 AI 实验室如此有价值?

什么是数据标注

Garrett Lord: 好的。我觉得可以先退一步,看看训练一个模型到底是什么样的。基本上有两个主要环节:预训练(pre-training)和后训练(post-training)。很长一段时间以来,这些 AI 提供商、大语言模型(LLM)或前沿实验室主要专注于在预训练端不断吸入越来越多的信息。那基本上就是整个人类文字知识语料库——不仅是文字,还包括每一段 YouTube 视频、每一本书,基本上就是在追求把互联网上的一切都吸收进来,这就是预训练的部分。预训练带来了很多收益,模型持续变得更好。大约 18 到 24 个月前,我们开始看到来自预训练的收益明显趋于平缓,因为他们基本上已经把互联网上的所有知识都吸收完了。于是,实验室的重心转向了后训练端——现在大部分的收益都来自那里。

Garrett Lord: 后训练做的事情,就是对他们关心的每个学科或能力领域的数据进行增强和改进。比如编程、数学、法律或金融,他们专注于收集能真正提升模型能力的高质量数据。你可以看到很多流行的基准测试,就是所谓的模型榜单。当 Llama IV 发布时,你会看到各个领域的基准成绩,实验室内部的每个研究团队都有不同的用例。基本上他们在做实验,你可以想象成类似科学方法的过程。他们对如何改进模型提出假设,然后尝试收集小规模的数据来验证这个假设是否成立。如果假设被验证为真,他们就会在该方向上扩大数据收集的规模。具体形式可能是强化学习环境,可能是轨迹数据,也可能是音频和多模态数据,也可以是基于文本的提示-响应对。

也可以是基于人类反馈的强化学习,即偏好排序数据。这就是当前模型训练的前沿。现在模型的大部分提升都来自后训练环节。而要保持模型始终处于绝对前沿,需求量是极其庞大的。

Lenny Rachitsky: 所以,预训练就是把整个互联网喂进去——这是人类创造的所有数据,让模型自己学会知识、事实、推理等等。后训练的话,能不能说基本上分两大类?一类是基于人类反馈的强化学习 RLHF,另一类是微调?

Garrett Lord: 算对也不完全对。比如拿轨迹数据来说,或者你想让模型完成航班搜索,或者端到端的会计流程,或者进行生物实验,这些都需要实际的轨迹数据。目前很多实验室对于应该收集什么数据仍然有自己的判断,而且这个领域变化非常快。但我觉得强化学习主要就是偏好排序——你更喜欢哪个回答,A 还是 B?SFT 数据则是一个提示和一个响应。显然,各实验室现在非常关注这些思维或推理模型。要提升推理模型的能力,就需要真正提供逐步的推理步骤。而当你与这些前沿模型交互时,它们在非常高级的领域中仍然会遇到困难。所以,我认为他们在使用多种类型的数据来提升模型的各种能力。

Lenny Rachitsky: 我听到的是,后训练还有其他方式。在这些分类里,你们主要聚焦哪个?这三个左右的类别中,你们在哪些方面对模型的帮助最大?

Garrett Lord: 我们作为企业真正的独特价值在于我们拥有一个高度活跃的专业受众群体。我们有 1800 万专业人士,其中包括 50 万博士,300 万硕士,是一个全球性平台。所以,无论你在任何领域需要什么——学术知识也好——博士的定义是什么?怎么拿到博士学位?你要答辩你的论文。答辩意味着,一般来说,你已经证明了自己在某个特定领域拓展了人类的知识边界。所以我们能够精准地将这些受众定位到化学、数学、物理、生物、编程等各个方向,真正触及那些从未出现在互联网上的人类知识领域,这正是我们的优势所在。我想说的是,谈到数据标注市场,为了让它更直观——过去这种工作主要是通才做的。

在模型变得更好之前,市场上大量依靠的是有才华的、低成本的国际劳动力来完成基础的通用任务。但实际上发生的是,模型已经变得足够好,通才不再被需要了。他们真正需要的是专家——模型所关注的每个领域的专家。你可以把这些模型构建者理解为,他们聚焦于经济中最具经济价值的能力领域。目前来说,主要集中在高级 STEM 领域、高级科学和数学领域,以及由此衍生的会计、法律、医学、金融等领域,他们希望在这些方面让模型变得更强。至于我们正在做的工作,我想回到你的问题来回答——我们跨越了非常多的领域。我们有数百万本科生被用于音频方面的工作,用于根据语音和语调、你所在的地理位置、女性和男性各自的偏好来定制模型。一直到最前沿的博士级 STEM 领域。

标注工作的实际内容

Lenny Rachitsky: 好。那是不是可以说,基本上所有可获得的数据都已经被训练过了,而你们公司创造新的数据、新的知识,来持续提升模型的智能水平?

Garrett Lord: 对。我还会补充说,我们也帮助指出模型薄弱的地方。要让一个模型出错,对普通人来说其实挺难的,普通人很难让模型给出错误回答。但如果你是一个物理学博士,你可以进入物理学的多个子领域,证明模型到底在哪里出了问题——要么是推理步骤出错,要么是标准答案本身有误,或者当我们引入工具或需要遵循某些步骤流程时出错。我不会说这对他们来说很容易,但普通人确实无法让模型出错,这正是我们发挥作用的地方。

Lenny Rachitsky: 所以本质上就是发现模型犯的错误。好的,那这些人到底在做什么?我知道有各种不同的类型,你也描述了数据生成的各种方式和什么样的数据有用。那能不能举几个最常见的例子?假设一个博士坐在那里做标注,他们实际上在做什么?

Garrett Lord: 一个很好的例子是一篇公开发表的论文,叫 GPQA。感兴趣的工程师可以去读一下。这篇论文的核心思路是:你先让模型出错,然后提供一个标准答案——即问题的正确答案,再提供逐步的推理步骤。你可以想象,因为模型是非确定性的,模型可能偶尔一次答对了,但五次里不能稳定答对三次。所以你要真正证明模型在哪里失败了,并具体拆解它在哪里失败。也许它知道问题是什么,也能得出正确答案,但得出答案的步骤是错的,而他们真正关注的是到达答案的那些步骤。比如一道数学题有十个步骤,第六到第十步是错的。那怎么修复这些步骤呢?

他们具体在做什么呢?他们进入平台——我们非常注重打造这种体验,把这些人当作专家来对待。博士学生对被对待方式的期望,与低成本国际劳动力是不同的,工作期望也不一样。这些博士进入一个社区,我们有教学设计团队和评估团队,会反复帮助他们了解如何使用我们构建的工具,以及如何与最新的模型交互。然后他们就开始实际创建数据了。而这个过程——从我们这边来看,模型构建者需要确认我们产出的数据是高质量的。所以我们有自己的研究团队,自己的后训练团队。

我从 Meta 招了一位负责过后训练的同事,然后我——

Lenny Rachitsky: 希望你给他开出了不错的薪酬。

Garrett Lord: 当然。AI 人才的争夺战确实代价不菲,但我非常、非常荣幸能与他共事。那么,对于每一条数据,我们都要为他们搭建一个实际创建数据的工作环境。然后我们需要在单元级别上评估那条数据带来的实际收益,以及它能否在某个特定能力方向上带来提升。此外,我们还专注于不断演进使用场景,紧跟模型构建者的需求——他们需要越来越多的是真实世界中的工具使用和基于轨迹(trajectory)的数据。

Lenny Rachitsky: 好的。这里面的内容太多了,我们可以无限聊下去。但我觉得这真的很有意思,因为人们总是在听到这些概念,却几乎不了解它到底是怎么回事。所以对我来说这非常有趣,我觉得对很多人都会有帮助。所以本质上来说,一位博士,比如一位生物学博士,他们的工作就是找出 ChatGPT 产出的内容中的缺陷,然后给出正确答案。这些被用来微调模型——这里是你做得不对的地方,这是正确答案——从而改进模型。

Garrett Lord: 没错。

Lenny Rachitsky: 这样理解是否简单准确?请纠正我说错的任何地方,我不想让人产生误解。

Garrett Lord: 嗯,一个很好的例子,我们拿一个不可验证的领域来说,比如教育学。我们的网络上有位博士学生 Rachel,她在迈阿密大学获得了博士学位,当了二十年的老师,教八年级学生。她还在当地一所社区学院担任教育学兼职教授。所以,她正在与最先进的模型进行教育设计方面的交互——实际上是在尝试理解教导人的最佳方式,以及如何发现模型在培训方式上的错误,并帮助模型理解教育设计的前沿——这是建立在她十多年教八年级的一线经验和教育学博士学位之上的。这就是一个例子。从这种不可验证的领域,一直到可验证的工程问题——你可以看到最新模型在哪些问题上失败了。

轨迹数据与人类思维研究

还有一个方面,我们谈到专业领域,比如那些强化学习(reinforcement learning)环境。目前有不少论文,基本就是让人在完成逐步工具操作时进行旁白解说。比如他们从头到尾解决一个问题,与多个不同的服务区域交互,使用多种不同的工具。有论文专门研究这个——一边操作一边讲述自己在做什么,实际跟踪并录屏,记录鼠标的移动轨迹,展示他们是如何解决问题的。当他们遇到障碍时会怎么做?模型构建者真正想理解的是人类的思维方式。

Lenny Rachitsky: 你提到了”轨迹”这个词。能解释一下它到底是什么意思吗?感觉你已经提了好几次了,而且这个概念对这一切似乎很重要。

Garrett Lord: 轨迹基本上就是收集你正在做的一切的完整环境。所以它包括你的屏幕、你的鼠标——

Lenny Rachitsky: 噢,我明白了。哇。

Garrett Lord: 对。

Lenny Rachitsky: 包括旁白解说,好的。另外,这可能太技术了,但所有这些工作的最终产出是什么?比如那位老师,产出的是 JSON 文件、XML 文件,还是文本文件?

Garrett Lord: 是结构化的 JSON 数据。

Lenny Rachitsky: JSON 数据?好的。

多模态数据与评分标准

Garrett Lord: 然后我们还有多模态(multimodal)方面的工作,比如音频——对音乐进行分类和理解。我们正在与全国顶尖音乐院校里数百名最优秀的音乐专业学生合作,改进模型对音乐的理解。还有一个东西我们还没谈到,叫做 rubric(评分标准)。Rubric 模型就是让模型充当评判者。什么是好的教育设计?什么是好的 MRI 结果?在某些领域,你其实没有一个确定无疑的正确答案。所以模型可以坐在中间充当评判者,实际去评估什么是对的。回想一下你的学生时代,你怎么才能在五千字的论文里拿到 A?需要有出色的开篇陈述和科学论据。所以你可以构建一套 rubric,让模型在中间自动评估回答。我们也看到了大量关于 rubric 的工作。

市场验证与模型构建者的核心需求

Lenny Rachitsky: 你可能会想,凭什么相信这一个老师的意见,认为这样做就是对的?但很酷的一点是,市场自己会说话。如果这些模型被越来越多地使用,人们喜欢它们、认可它们,那么我猜中间一定有验证步骤来确认这些做法是好的、其他人也认为这是个好主意。市场机制本身就会告诉你,你提供的数据是否正确、是否是人们想要的。这里面还有更多的说法吗?

Garrett Lord: 我自己没有 AI、数学或物理的博士学位,也没有亲自训练过模型。我们有前沿 AI 模型,但每一条数据是否真的带来了改进,其中涉及大量的学问。目前有很多关于如何确保你产出的数据确实在改进模型的科学研究。这对模型构建者来说也是非常难判断的。退一步看,他们真正关心的有三件事。首要的是质量。你必须拥有高质量的数据。你可以想象,训练模型就像教学生,如果你给了它错误的数据,后续要纠正极其困难。所以质量是第一位的。其次是另一个巨大的难题——数量。你怎么在最前沿的化学、数学、物理领域生成数千条数据,同时确保质量足够高?

拿物理来说,我们直接联系斯坦福、伯克利、MIT 的学生,他们是全美最顶尖物理院系中 GPA 最高的。所以我们能够快速扩展数据规模,产出高质量数据,这是他们非常看重的。第三点是速度,因为模型构建者有大量假设,在不断测试不同的 pipeline。他们可能同时押注三四个方向,一旦其中一个开始显示出收益——想象你是研究员或负责这个流程——你就会开始扩展那条 pipeline,扩大那类确实带来改进的数据的生产,同时可能砍掉另外两三个没有显示提升的项目。

所以,能够在几天内快速为他们周转,并提供大量高质量数据,是模型构建者最关心的事情。为此我们在自己的端上构建了相当多的技术来评估每一条数据。我们有自己的后训练团队,租用我们自己的 GPU,力求能够直接与这些研究员坐在一起,分享我们在创建数据过程中观察到的信息,以及这些数据如何能改进他们的模型、他们最好如何利用这些数据来训练。希望这些能帮助你理解。


后训练的类型

Lenny Rachitsky: 回到后训练的类型,我觉得这也许会有帮助——至少对我建立心智模型来说:有预训练,有后训练,后训练内部有强化学习、人类反馈,还有微调的概念。还有 evals 之类的——

Garrett Lord: 还有 SFT,对。

Lenny Rachitsky: SFT,就是监督微调(supervised fine-tuning)?

Garrett Lord: 对。

Lenny Rachitsky: 好。那你刚才描述的那些工作,主要算是监督微调吗?

Garrett Lord: 是的,而且我们上述所有类型都在做。我们不搞自动 eval(auto eval),我们产出 rubric,这些 rubric 会被用于自动 eval。但没错,其他的都在做。

Lenny Rachitsky: 好的,太棒了。所以本质上就是:有一个模型,在所有这些了不起的数据上训练好了,你们在模型训练完之后介入,根据你们创建的额外数据来调整权重。有趣的是,这是一个可扩展的系统。我想谈谈你们拥有的那些产出这些数据的优秀人才的供给问题,但更令人惊叹的是,人类居然能做到这件事。你可能以为这需要某种无限可扩展的东西,但人类坐在那里创建数据,确实在起作用,并且在显著提升模型的智能。

人类在 AI 训练中的角色

Garrett Lord: 哦,是的。我觉得可能有个有趣的笑话:所有 MBA 都觉得这一切都会消失。而我认为,只要模型还在进步,这个过程中就需要人类的参与。当你和这些实验室的首席科学家和研究员交谈时,你会发现数据类型会不断演进,他们试图捕获和收集的内容也会变化,但在未来十年内,在达到完整的 ASI 之前,这个领域都需要人类的参与。你可以想想,目前很多模型连基本的 trajectory 都难以正确完成。所以现在人们非常关注学术领域,我认为他们会继续关注学术领域,但对专业领域的需求也会远远大得多——基本上,知识工作者在工作场所解决的每一个 trajectory 或分步问题,这些实验室都在追求收集数据,以便在这个过程中为人类创造尽可能多的价值。

AI 与就业的张力

Lenny Rachitsky: 那我来问你一个问题。我觉得人们可能会感受到一种张力:一方面,这些学生在训练模型变得越来越聪明;另一方面,如果模型聪明到入门级岗位不再大量招聘,他们自己可能更难找到工作。你怎么看待这种张力?你觉得这是一个真实的问题吗,还是说——

Garrett Lord: 我可能更倾向于”GDP 增长”而不是”全民基本收入”那个阵营。我非常相信这将提升和加速每个人在经济和世界中创造影响力的能力。我们听到的是——大约有一百万家公司在使用 Handshake,百分之百的财富 500 强都在用 Handshake,所以我们基本上支撑了绝大多数年轻人找工作的渠道。很多人夸张地说所有年轻人都会找不到工作,而我们从雇主那里听到的并非如此。我们听到的是:拿社交媒体营销来说,以前你需要一个会用 Photoshop 的人,要拍照,要做视频。然后你需要一个懂营销分析平台的人来追踪你在不同社交媒体上的发帖情况。而现在,一个年轻的、有才华的、AI 原生的、穿上钢铁侠战衣的年轻人就可以上手了——他们可以自己制作视频,自己产出创意素材,在多个社交媒体平台上发布,运行自己的所有分析。他们不需要一个数据科学的学位就能做到这些。

拿我们公司的一个实习生来说,我记得他第一天下午就提交了他的第一个 PR。你做过 PM,你知道历史上要搭好开发环境、搞清楚在哪里创造价值有多难。他直接拿了一个 bug 就修掉了。所以,我真的相信这只是让人类变得更加高效、创造更大影响力。当然,数以亿计的工作岗位,工作会演变。人们会被替代,他们需要提升和重新学习技能,我认为 Handshake 在帮助知识工作者完成这种转型方面可以发挥重大作用。

AI 原生代的优势

Lenny Rachitsky: 这一点已经出现了好几次,我觉得非常好——刚从学校出来的年轻人实际上更有可能取得成功,因为他们是伴随这些工具长大的,对所有这些先进工具更加原生态,所以他们一进来就像猛兽一样,能做的事情多得多。

Garrett Lord: 你还记得吗——这稍微早于我的时代——以前你会把 Google 搜索作为一项技能写在简历上。你是一个善于用 Google 的人,因为你是伴着 Google 长大的。我觉得 AI 原生、穿上钢铁侠战衣、懂得如何利用这些工具,就像年轻人拥有巨大优势一样。

Lenny Rachitsky: 对。而且如果他们参与了训练这些模型,我猜还有其他很酷的优势。

Garrett Lord: 是的。关于这一点,我们从数千名 fellow 那里听到的是:他们在课堂上的同时,实际上也在产出研究成果。我们说的是全国顶尖机构的博士。他们可以在自己的专业领域赚取每小时 100、150、200 美元。这很棒。当助教每小时赚 25 美元,或者你可以每小时赚 150 美元来破解最新的模型。我们从 fellow 那里听到的是,他们把很多这样的洞察带回课堂,帮助自己更有效地教学。更重要的是,他们开始学习如何利用这些工具来真正推进自己的研究领域。他们相信这些工具可以帮助他们更高效地利用时间,从而推进自己的研究。所以,靠学习一项技能还能拿钱,确实很酷。

数据标注领域的前沿认知

Lenny Rachitsky: 在我聊这一切是怎么诞生的之前——那确实是一个很精彩的故事——关于数据标注、强化学习这整个领域,还有什么你觉得人们没有充分理解的,或者你认为非常重要的东西?现在发生的事情太多了。就像我说的,全球增长最快的一些公司都在这个领域,Scale 刚刚被收购——某种程度上被以 300 亿美元收购。还有什么你觉得人们需要理解的吗?

Garrett Lord: 总体来说,任何时候你在与一个模型交互,让它做一些非常高级的事情,而它没有达到你的预期——那么在某处,很可能有一位该领域的顶尖专家,正在直接为前沿实验室最优秀的研究员工作,试图理解和经历科学迭代的过程来让它变得更好。这里的假设是,他们已经拥有了人类所有已书写和记录的知识。所以,只要用 AI 解决任何问题——任何人类问题——还存在困难,就需要人类参与其中来帮助推进。而且模型不会泛化。我的意思是,显然这个领域会有很大进步,他们收集的数据类型也会发生很大变化,但在前沿上,这一切相当令人兴奋。

Lenny Rachitsky: Kevin Wheel 上过我的播客,他是 OpenAI 的 CBO(首席商务官),他有一个观点让我印象深刻:你今天使用的模型,将是你用过的最差的模型。

Garrett Lord: 我特别喜欢这句话。

Lenny Rachitsky: 只会越来越好,想想就令人难以置信,现在我们知道了事情为什么会变得更好,因为你们所有人都在做这些工作。关于 Scale 这件事还有一个简单的问题,他们大概算是这个领域的主要公司,现在他们被收购了,Alex 去了 Meta 负责超级智能部门。他们在数据标注领域还是一个重要参与者吗,还是说他们已经退出,这是一个巨大的机会?

Garrett Lord: 是的。我的意思是,向整个 Scale 团队致敬,非常尊重他们所建立的一切,这个领域有很多优秀的公司在运营。我觉得你问题的核心是,如果你把你的研究团队和模型构建团队,以及他们正在运行的实验,视为你改进模型的基石,那你大概不会希望你正在研究的最新研究成果被一个同行投资。我的意思是,这基本上就是我们在行业中听到的普遍声音。所以,我们看到了令人难以置信的需求激增,而且我认为我们的定位极为有利。我们喜欢说,人类数据领域唯一的护城河就是对受众的触达。基本上,这个领域有很多很多小玩家,一些中等规模的玩家,他们基本上就是在投放 TikTok 广告、Instagram 广告,花钱买 Google 搜索展示广告、YouTube 广告,然后他们会说,“你能帮我找 200 个物理学博士吗?”

他们能做什么?他们只能做一件事。他们有 100 个招聘人员在岗,全都上 LinkedIn,全都发消息,花几百万美元做效果广告投放。某个人在刷 Instagram 动态,他是个物理学博士——而你其实没法精准定位到他们——然后他们看到”来训练模型吧”。他们的反应是,“我从来没听过这个品牌。“我们拥有的巨大优势,以及为什么我们在市场上如此迅速地引起共鸣,是我们用十年时间与 1800 万人建立了信任,他们信任我们,我们建立了很强的品牌亲和力,他们使用 Handshake,他们有活跃的个人资料,我们拥有大量关于他们学业表现和在校经历的信息。所以我们能够非常精准地触达目标人群,以比任何人都更快的速度实现高质量数据的规模和体量。我认为这种触达受众的竞争优势在市场上确实产生了强烈的共鸣。

从职业平台到 AI 数据业务的诞生

Lenny Rachitsky: 这正好引向了我接下来想聊的话题,就是这个业务是如何诞生的。这是一个建立在你已有业务之上的新业务。据我了解,当时你们已经有大约 1.5 亿美元的收入,你们在这个领域已经做了很长时间。你发现了这个机会,现在回过头来看,这显然是一个绝妙的主意——实验室需要数据,而你们拥有大量顶尖专家的供给。多么好的机会。谈谈你是如何首先意识到这是你可以做、也应该做的事情,然后又是如何开始沿着这条路执行的。

Garrett Lord: 是的,我觉得这是从帮助人们启动、重启或开始他们的职业生涯这个核心使命出发的一次非常自然的延伸。在这个新的就业生态系统中,用你的技能变现,未来会呈现出非常不同的面貌。具体说到我们是怎么发现这个机会的,因为我们拥有对这个受众群体如此庞大的触达,而且随着世界从通才转向专才,我们成为了全球最大的专家网络。我们拥有比任何其他平台都多的博士——其中 50 万博士在使用 Handshake。我们有 300 万硕士在校生和校友。所以我们开始看到大量中间商公司来找我们说,“我们能不能在你的平台上招募博士和硕士生?“就像任何一个优秀的交易平台一样,我们开始把这些用户导流到各个平台上去,然后从用户的反馈中开始意识到,他们的体验非常糟糕。

训练过程非常事务化,你怎么获得报酬也非常不透明。从开始到实际完成项目,中间有大量的流失。所以我们开始思考——公司当时从帮助这些其他平台中赚取了数千万美元——而真正推动我们行动的是,我们也听到了前沿实验室的声音,他们开始直接联系我门,试图直接合作,几乎想要跳过中间商。我们开始意识到,我们可以真正服务好我们的用户、我们的博士、我们的专家,可以善待他们。我们坚信,在追求 ASI 和推进 AI 的过程中,必然会需要一个平台,一个以专家为先的平台,也会需要一个全世界所有人都可以去的地方,在这些实验室专注于改善所有这些多学科能力的时候,去将自己的技能和知识变现。是的,我们进入这个业务——实际上我是在圣诞节和新年期间开始做的。那是我开始四处飞的时候。

我的家人觉得我有点疯狂,居然在飞机上追着各种负责人跑,但我们组建了一支令人难以置信的团队,成员来自人类数据领域,然后真正开始在一月份搭建我们的平台,大约五个月前开始真正将这些合作关系变现。快进到今天,我们正在与七家前沿实验室合作,基本上是每一家在做工作、构建最好的大语言模型的实验室,团队规模暴涨,收入暴涨,这真的是一段不可思议的旅程——在公司内部重新运营一家新公司,相当于第二次创业。

Lenny Rachitsky: 分享一些数字——告诉我这些是否准确,或者你是否愿意公开——但我听说你们仅用四个月就达到了 5000 万美元的收入?如今已经八个月了,你们有望在第一年达到 1 亿美元的收入。

Garrett Lord: 我觉得我们会远超这个数字,但确实如此。

Lenny Rachitsky: 好的。太厉害了。我甚至不知道有七家前沿实验室——

Garrett Lord: 四个月从零到 5000 万,确实还不错。

Lenny Rachitsky: 从零到 5000 万四个月,这确实了不起。门槛一直在不断变化。一年前这会是传奇级的成就。现在就像,好吧,又一个这样的。四个月 5000 万,没什么大不了的。真的太疯狂了。稍微拉远一点,对于那些不太了解 Handshake 原始业务的人,那是什么?你当时坐拥的那个网络到底是什么?

Garrett Lord: 那个网络大概做到两亿。这个大概会做到——

Lenny Rachitsky: 两亿。

Garrett Lord: 对。

Lenny Rachitsky: 好的。

Garrett Lord: 我们大约有 600 位非常投入的团队成员在核心业务上工作,我想把他们区分开。这不是两个业务,我认为是一个业务,但这个业务是什么?如果你是美国的年轻人,在过去五、六、七、八年里毕业的,你手机上大概率有 Handshake。你一定知道 Handshake 是什么。它在美国年轻人中已经成了一个动词,在大学读博士或硕士的人中也成了一个动词。我把它叫做一个无需连接的图,意思是 LinkedIn 非常关注你认识谁、你的经历是什么。LinkedIn 上第一个问题是你的工作是什么?而很多年轻人起步时,从来没有过工作。他们没有 500 个人脉可以加到自己的关系图里。

而在 Handshake 上,你从探索和发现开始,弄清楚如何在学校中找到方向,“哦,我是工程师。也许我想做 PM,也许我想去创业公司,也许我想去大公司。” 你想从同龄人和年轻校友那里了解利弊是什么。所以 Handshake 是一个我称之为非常社交化的平台,有群组、消息、个人资料、短视频和动态流,全部围绕你的兴趣,真正帮助你在职业生涯早期建立信心,找到第一份工作、第二份工作,管理 18 到 30 岁这个阶段。

Lenny Rachitsky: 这个业务做了多久了?

Garrett Lord: 已经十年了。

时机与不公平优势

Lenny Rachitsky: 十年,好的。所以这感觉就是——真他妈的,你们在正确的时间、正确的地点,拥有这个现在极其有价值的网络。多么有趣的故事。我觉得这只是又一个有趣的例子——你做了一件事情很长时间,然后突然间 AI 就打开了一种全新的方式,来利用你长期积累的东西。这让我想到 Bolt 和 StackBlitz,他们花了七年时间构建一个基于浏览器的操作系统,可以在浏览器里运行一个 OS。他们就像,“我不知道,没人需要这个。我们在干什么?” 然后突然间 AI 来了,他们说,“哦,如果我们用 AI 在浏览器里构建应用,直接用 AI 为你生成产品会怎样?” 现在它大概是世界上增长最快的公司之一。

Garrett Lord: 是的。

Lenny Rachitsky: 太有意思了。所以我觉得这对大家来说是一个值得思考的时刻——我们做过的事情中,有没有什么能给我们一个新的机会,基于这种不公平优势去构建一些巨大的东西?

Garrett Lord: 我还觉得,随着你的公司规模、人数和成熟度的增长,在业务内部孵化新东西也很难。在很多方面都很难。从零到一构建、找到产品市场契合点、快速扩张团队的方式,和运营一家已经存在十年、有几百几百人的成熟业务的方式是非常不同的。所以,我非常享受并在业务内部第二次重新来过中找到了大量热情。而且我们有这个巨大的战略优势——零获客成本,而且我们的转化率和留存率比其他任何平台都高出一大截,因为我们有这么强的用户认同感。

数据标注的获取方式

Lenny Rachitsky: 这里其实有两条线索我想追问,我先追第二条——数据标注的工作从哪来的问题。有一种非常清晰、简单易懂的方式,就是专家坐在那里创建数据。另一个我知道这个领域很多其他公司使用 Scale,特别是用国际低成本劳动力。除了这两种之外还有没有其他方法?其他公司是怎么做的?

Garrett Lord: 我觉得如果你在乎构建一个真正高质量的业务,有好的毛利率和高质量的增长,这个生态里的一家领先玩家有 200 个招聘人员。这是不可持续的。有 200 个人在 LinkedIn 上逐个发消息来获取这些人,因为没有品牌,没有信任。他们每个月在效果广告上花费数千万美元,Google Ads——

Lenny Rachitsky: 为了找专家、找人。

Garrett Lord: 找专家。

Lenny Rachitsky: 而且这个时候主要是专家了。

Garrett Lord: 对。然后他们把这些专家放到一种体验里,就像让他们在菲律宾给停车标志画边界框一样。顶尖的税务会计师不想被当作低成本国际劳动力来对待,我觉得没人喜欢那种体验。所以,能够构建一个根植于社区、根植于高质量培训的体验——如果你在 MIT 读博士,大概率你在如何使用这些工具方面就是没被教够。

不是你无法突破模型,而是其他平台花了数千小时获取一个用户,然后直接把他们扔进一个项目里,没有任何培训。所以我们从第一天起就构建这个专家……我们相信这里会有一个深度网络效应,与我们帮助人们启动或重启职业生涯的核心业务紧密相连。你进来,建一个个人资料,看到社区,有群组和动态流,展示大家是如何学习的。你进入一个实际的个人小组,组员和你相似、背景类似。你被教导如何交互,有试错的过程,我们有教学设计环节确保你能胜任。然后你被放到项目上——我们正在构建……有某些泳道,我们实际上在预生产数据并把数据卖给所有实验室。

所以我们可以做这样一件事:我们自己生产一个单位的数据,我们付费,几乎像电影制作一样。我们为一个单位的数据付费,然后确保它质量非常高。我们用自己做后训练,然后生成一堆数据规格说明,实际上把那个数据包卖给很多不同的实验室。所以你被放到那样的项目上。一旦你在我们的项目上做得非常非常好,通常我们就会把你放到客户项目上——他们只想要机器学习领域最顶尖的人才。然后他们从我们的项目转到他们的项目。所以这里有巨大的用户获取优势。你喜欢在播客里深入探讨,所以就说一下——真正重要的其实就是几件事。

用户获取与生命周期价值

Garrett Lord: 你有客户获取成本,即 CAC,然后还有 LTV,即用户的生命周期价值。在这门生意里,LTV 的计算相当简单,基于一个人的留存率,以及他能参与多少项目。所以,如果你把人对待得非常好,培训得非常好——首先,我们没有客户获取成本,因为我们与 1600 所大学建立了合作,覆盖了全美排名前 500 的学校中的 92%。我们几乎覆盖了全国所有的大学和社区学院。我们获取这些人才几乎没有客户获取成本。我们与他们之间建立了大量的品牌和信任积累,所以他们的转化率非常非常高。然后,如果你把他们对待得很好——因为他们对我们的期望,他们了解 Handshake,他们的学校购买的是 Handshake,我们关心善待这些人,但大学不会容忍我们的合作关系,除非我们善待了这些人。

所以,你把他们放进这个流程里,我们的 LTV、重复参与率和在不同项目上的留存率都非常高。因此,当你对比一下——一个领先的供应商有 200 个独立的个人招聘者,每月在效果营销上花费数千万美元——这些结构性优势就显得非常显著了。我想这就是我们取得这么大成功的原因。

Lenny Rachitsky: 这极其有趣。而且感觉就像你说的,过去人们的关注点很大程度上在通才上——世界上任何地方的低成本劳动力都能做这些工作,比如给东西画边界框。而本质上市场已经从低成本通才转向了专家。像 Scale 这样的公司,很多都在为通用工作模型的训练数据做优化,而你们则被定位为在基于专家的数据上做到极致。所以,你们在对的时间出现在了对的地点,拥有对的供给。多么好的一个生意。

Garrett Lord: 是的。

Lenny Rachitsky: 干得漂亮。

Garrett Lord: 我想说的是,在第一个业务里面构建第二个业务并不容易,但是——

Lenny Rachitsky: 是的。那让我顺着这条线聊下去。这也是我想聊的方向。具体是什么情况?所以,你开始注意到模型公司在找你们的人,发现这些人在这个领域的其他公司那里遇到了困难,然后你想,“哦,也许我们应该做这种事情”?最初的想法是怎么产生的,你又是怎么开始探索这个想法、判断它是否真的可行的?

从观察到行动:进入数据业务的起点

Garrett Lord: 具体来说,我们当时正在与许多中间商公司合作。我们开始看到需求,正如我之前谈到的。我们开始看到前沿实验室直接联系我们,试图绕过中间商,以获取更高质量的数据。当我们开始把这些线索串联起来——我们可以为我们的专家打造一个更好的体验,可以直接把他们对接给实验室,与实验室建立直接的客户关系,基本上就是砍掉中间商。同时为实验室提供更好的体验,为我们的专家提供更好的体验,也为我们网络中的一百万家公司提供更好的体验。

你可能也在思考技能提升和再培训,那个领域会发生什么。所以我们进入了这个领域。我们大概在十二月真正开始探索和深入了解,做专家电话访谈,深入钻研。我聘请了三家专家公司——AlphaSights 和 GLG,开始与最新的研究人员做大量电话访谈,因为我们有资源。作为一家较大公司的一个好处是,我们的核心业务已达 2 亿美元 ARR,所以我们有资源来加速这里的学习曲线。然后,大约五个月前,我们开始与可以说是排名第一的实验室合作。

Lenny Rachitsky: 我想知道那是谁。

Garrett Lord: 是啊。

Lenny Rachitsky: 是啊,想知道是谁。

Garrett Lord: 我们与排名第一的实验室合作了不同的项目,现在我们正在与前沿实验室合作,我们目前最关注的就是扩大规模。我们从四五个做这件事的人增长到了 75 人以上。我记得上周一就有 12 个人入职。我们在这个机会面前严重受限——因为在这个市场上,需求基本上是无限的。如果你能生产高质量的大量数据,你大概率能卖掉你生产的所有东西。所以对我们来说,我们真正关注的是确保选择正确的长期战略,确保不要增长太快以至于侵蚀了我们在这些前沿实验室中建立的信任。不过确实很有趣。

Lenny Rachitsky: 你说在现有业务中启动新业务也非常困难。最难的是什么?最难的部分是什么?你已经提到了其中一些因素,还有什么?

在现有业务中构建新业务的经验

Garrett Lord: 我觉得在这次经历中,我更多地追随了自己的直觉。Handshake 的故事是我们必须签约 1600 所大学,所以我必须学会成为最好的……我们是历史上增长最快的高等教育公司。所以我们签约了 1600 所学校。然后我们必须构建一个雇主业务,我们必须学会如何销售——所有这些财富 500 强公司都在用,其中 70% 是付费的——所以我必须学习向上销售,面向高盛、通用汽车、谷歌和世界上最大的公司,这与向大学销售完全不同。然后我们还必须学会构建一个出色的学生社交网络。最好的信息流应该是什么样的?群组消息应该是什么样的?所以我对这种从零到一的过程有一种熟悉感。

通常来说,市场平台就像很多个从零到一。有时候我开玩笑——实际上我不做梦,但我开玩笑说我真希望我们是一家网络安全公司,只有一个买家、一个产品,只需要……在市场平台里,你必须服务三个不同的边,你在 Airbnb 的时候应该深有体会。所以在 Handshake 启动这三个不同业务的过程中,我的一个心得是我非常亲力亲为。每个人都直接向我汇报。我在很多会议上真的说的是,“我不是要当老板,我只是想多一个聪明人在房间里。“我们招聘了一支令人难以置信的团队,他们在这个领域花了大量时间,曾是这个领域很多人力数据公司的重要领导者。

所以每个人都非常清楚地看到了我们拥有的结构性优势,而很多精力集中在确保我们能在扩展到其他客户之前,先把高质量的数据交付给一个客户。你必须对很多东西说不。然后,核心业务中也有很多人——这理所当然——存在着制衡,有很多人想参与进来。每个人都想说——不是每个人,这有点夸张——但说”不”很容易。很容易说,“我这周或这个月无法优先处理这件事,我有一组现有的优先事项。“所以基本上,除了少数几件事之外,每个人都直接进入了这个我建立的新组织,每个人都不再承担现有业务部分的责任。在新公司的每个领域里,谁是直接负责人非常清晰。现在我们与业务其他部分有了更深的耦合和整合点,但最初我们坐在办公室里一个独立的区域。

独立运营的节奏

Garrett Lord: 每个人每周五天在办公室,很多周末也在。在招聘人才方面也有完全不同的期望,就是”嘿,这是一份 24/7 的工作。这是一家早期公司。“薪酬也不一样,是基于新业务的阶段性目标来设定的,所以人们觉得自己是这家新公司的创造者、所有者。而且,现在依然非常敏捷,非常非常扁平。仅仅因为你负责某个职能,并不意味着你就是某个项目的直接负责人。我们会选择最有能力推动某个项目前进的人来担任 DRI,而不论他属于哪个职能。我们也更加以指标为导向。当初做 Handshake 的时候,我们很长一段时间都抗拒这种运营节奏——每周、每月、每季度的运营节奏。而 Handshake AI 从早期开始就更加注重以数据、指标和严谨性来运营。我们团队里有一位叫 Sahil 的同事在这方面做得非常出色。向 Sahil 致敬,向 Young 致敬,向 Paco 致敬。

Lenny Rachitsky: 好的,这太了不起了。所以,一家十年历史的公司内部能够成功做出这件事,关键要素是什么?顺便说一下,你的传统业务年收入已经达到两亿美元。而正如你所说,这个新业务第一年就要突破一亿美元。也就是说,如果继续按这个趋势发展,新业务头几年的收入就将超过你花了十年打造的业务的规模。太不可思议了。要让这一切成功,根据你刚才说的,我注意到了几个关键点:第一,很明显你就是以创始人模式在运作。你是这个新业务的领导者。你没有把它委托给别人,说”嘿,你去启动这个东西。“你配备了专职人员,“来,我们挑选一些人。你现在没有其他事情了,这是你的新工作。你就做这件事。“大家在办公室的不同区域工作。有一套基于指标的运营节奏——就是,让我们保持高度的严谨,关注进展如何、方向在哪里、我们的轨迹是什么、KPI 是什么之类的。你觉得还有什么对做成这件事特别重要的?因为我想很多公司都会尝试这么做,所以我很好奇你还发现了哪些关键因素。

Garrett Lord: 是的。我的意思是,我真的非常相信”分离”二字。独立的工程团队,独立的设计团队,独立的账户和运营团队,独立的财务团队。早期一切都分开。每个人只有一个工作,而且只有一个工作,那就是让 Handshake AI 成功。我们有几个更多的整合点,而且我有一支非常出色的核心业务高管团队在运营着核心业务,现在两者的联动越来越多。但那些长期打造 Handshake 的高管们负责运营核心业务,而我把 80% 以上的时间和精力专注在这件事上。我们招募了一位非常出色的工程负责人,比如 Avery,他……我们有很多创业者,那些之前创过业的人。或者说,抱歉,是之前自己创过业的人。这一点非常重要。我们在招聘人才方面有很多经验,专门招那些只在早期公司工作过的人,所以他们非常习惯模糊性和不确定性。

我们也在一开始就更加坦率地说明——这会很混乱。在全公司的大会上直接讲清楚这个叙事,跟团队直接沟通。我们有单独的大会,有单独的入职流程,有独立的招聘团队。我有一些连接点,但基本上是独立的。我认为这绝对至关重要。我们从核心业务中调走了一些顶尖人才——我们核心业务有很多优秀的人——我们对他们说:“抱歉,我知道你热爱你原来的团队,我知道你喜欢你在做的事情。你愿意加入 Handshake AI 吗?“他们完全放下了过去的职责,过来了。当业务开始快速扩张、快要撑不住的时候,这一点变得尤为关键——我们的增长如此之快,所以调来了一些最顶尖的高级工程师,他们非常有创业精神,还有一些 principal engineer 和 staff engineer,让他们空降进来。能够问核心业务中最有才华的人”嘿,你想过来做这件事吗?“这感觉太棒了。

有时候他们会说不。他们会说:“我不想大部分周末都在工作。“我们这个业务里凌晨两三点还在干活是家常便饭。确实很频繁。有些人不想做出这样的承诺,但我们从一开始就说得很清楚——这个团队的期望就是这样。节奏疯狂。如果你想成为硅谷增长最快的业务之一的一部分,你可以加入。主人翁意识也非常重要——对这个结果负责。我们有这样一个座右铭:不留任何遗憾。有一段时间我们在白板上画出一年的天数,就是那种——这样的时机再也不会有了。我从未见过这样的景象,我怀疑在商业中再也不会有这种感受了——需求是无限的,就看我们能不能抓住它去执行。

所以我们有这样一个座右铭:不留任何遗憾。怎么确保三个月不会变成六个月?不留遗憾。坐飞机去跟客户当面谈,做深夜的代码推送,把数据反复检查六遍,多上线一个有帮助的功能。而且,我们还有一种非常浓厚的庆祝文化。组织非常扁平,所以没有什么层级观念……有太多人在做出贡献,直接点名表扬那些正在立功的人,围绕影响力营造一个非常有趣的环境,我觉得这一点非常棒。

信任与市场愿景

Lenny Rachitsky: “不留任何遗憾”这一点,我想部分说明了信任的价值。只有当他们能信任你的数据是出色的、优质的、一致的,你才能赢。我能理解为什么这成为你们所构建的东西中如此重要的一部分。听你描述这些,我理解这显然是一个巨大的机会,你们显然拥有巨大的优势,但同时这种机会带来的压力也一定非常高——就是那种我们不能搞砸的感觉。

Garrett Lord: 没错。是的,Handshake 应该是一家……作为一家上市公司做到数十亿美元收入的企业,我们应该能够继续……我的意思是,这也在帮助我们的核心业务。我们看到的更长期的机会是——它是连接、是构建互联网上最好的招聘匹配市场。这可能是世界上最大的问题之一——劳动力供需匹配。人们把大部分时间和精力都花在工作上,人生中大量的时间都花在了工作上。找工作、投简历的过程将会被 AI 彻底重塑。我们一直在引领这一进程。一个 AI 面试官,收集技能信息,真正询问你的经历,做工作模拟体验,帮助雇主找到最佳候选人。我的意思是,我不知道你上一次做这件事是什么时候,但招聘经理审阅两百份简历的过程,你在开玩笑吗?

Garrett Lord: 我还会坐在那里审阅两百份简历?五年后不可能了。学生手动写求职信……不可能了。所以,必然会有一个招聘匹配市场胜出,把供给和需求、人才和机会连接起来。我们对这里能产生的影响力感到非常兴奋。这就是我的故事——我上的是社区大学,自己打工挣学费。我上的是密歇根上半岛一所不知名的学校。我在 Palantir 做实习生,那段经历彻底改变了我的人生。我创立 Handshake,是因为我想让任何人——不管你认识谁、你父母做什么、你上什么学校——都能更容易地找到好的机会。我认为 AI 在匹配上是一个阶跃式的提升。而我认为我们的人类数据业务,真正在为改善匹配奠定基础。

人类数据业务中我们正在做的很多事情,正在被整合到核心业务中。我认为这会改善雇主的招聘结果,长远来看能为他们节省数十亿美元。我也认为这会大大改善学生的体验。所以,我们必须抓住这个时刻。我们在核心业务和新业务中,仍然保持着体力、热情和激情去冲锋。这也是我们在内部不断传达的信息——是时候加把劲了。这是一生一次的机会,我们的位置非常好,我们作为一个团队,一定要抓住这个时刻。

Lenny Rachitsky: 确实如此。这真的非常像一生一次的机会。让我沿着这个方向再问几个问题,这也是我一直在思考的、很多人也在思考的问题——既然你在这里,趁这个机会聊聊。大家一直在问:我们会用完数据吗?模型会停止进步吗?我们会不会撞上某个平台期,实际上根本不会出现什么 AGI 时刻、ASI 时刻?所以首先,你认为我们会用完数据吗?会不会有某个时间点,我们就是无法再产生更多的知识和数据来喂这些模型了?与此相关,你认为推进模型更快、更远的最大瓶颈是什么?

数据枯竭与模型进步的瓶颈

Garrett Lord: 嗯,我的看法是,我们所需的数据类型会不断演变。它会是 CAD 文件,会是科学工具使用数据——当模型试图自动化科学发现和药物发现时。它会是在科学仪器上运行的各种冷门操作系统。所以我非常看好这条轨迹——把逐步指令遵循的能力拼接起来。我们所需的数据类型会发生很大的变化。而且我们甚至还没谈到多模态,以及视频、文本和音频。现在对音频数据的需求非常巨大。所以,数据的类型会不断演变。

Lenny Rachitsky: 对,我一直在用语音模式。那是我默认的 ChatGPT 体验,就是直接跟它对话——

Garrett Lord: 太棒了,真的太棒了。我刚刚——我太太周日刚生了宝宝,语音模式帮了大忙。我是说,每天晚上,每隔两小时,我就有更多的问题。语音模式真的太重要了。向语音模式致敬。嗯,所以数据的类型会发生很大的变化、很大的演变。我认为合成数据会有一席之地,在可验证的领域中尤其如此。但我们从各家公司的反馈中一致听到的是——合成数据不会占主导地位。在接下来的十年里,作为一家公司,紧跟前沿 AI 模型的发展轨迹,有数十亿、数十亿、数十亿美元的价值可以被提取出来。

Lenny Rachitsky: 首先,我要向你致敬——你太太几天前刚生了孩子,你还在经营这家疯狂增长的公司,还来做这期播客。真的非常感谢你。

Garrett Lord: 谢谢。

给年轻创业者的建议

Lenny Rachitsky: 当然。还有什么我们没有聊到的、你觉得可能对大家有帮助的内容?或者你故事中的某个部分,你觉得可能值得大家学习?或者有什么之前聊过的你想再强调一下的?在我们进入非常精彩的快问快答环节之前。

Garrett Lord: 我最想聊的、一直很有热情的话题,是鼓励人们创办公司并帮助他们做到这一点。我觉得在当下这个 AI 的时刻,对于年轻的创业者们——那些收听、阅读这期播客的人——因为我从 2020 年起就是读者了。我们查过的。

Lenny Rachitsky: 对,我们确实确认过了,太厉害了。

Garrett Lord: 对,长期的读者。我就是特别好奇,喜欢汲取——

Lenny Rachitsky: 感谢你。

Garrett Lord: ——你的访谈内容。但我想说的是,你只需要专注做一些有意义、真正能帮助人的事情。我认为在 AI 领域,会有非常多的机会去改善人们学习的方式。我一直很有热情要把 Handshake 打造成一个平台,不仅是一个出色的企业,也是一个真正能帮助解决重要的社会问题的平台。嗯,这就是我想在这里说的。如果有人想要关于如何做到这一点的建议,或者想联系我,我很乐意交流。

Lenny Rachitsky: 好的,所以这是一个关于在 AI 领域创业的建议分享的邀请,对吗?只是确认一下,让大家知道——

Garrett Lord: 对,那就太好了。

Lenny Rachitsky: 好的。我不知道你哪来时间应对成千上万找你的人,但我感谢你的这份慷慨。非常酷。快问快答之前还有什么要补充的吗?

Garrett Lord: 没有了。

快问快答

Lenny Rachitsky: 好的,那么 Garrett,我们到了非常精彩的快问快答环节。有五个问题。准备好了吗?

Garrett Lord: 准备好了。

Lenny Rachitsky: 你最常推荐给别人的两三本书是什么?

Garrett Lord: 我特别喜欢 Peter Thiel 的《从零到一》。我在创业时读了这本书,还看了 Peter Thiel 早年 在斯坦福教的创业课——那时候互联网上关于如何创业的内容远没有现在这么多。我就是觉得他太酷了。还很喜欢《鞋狗》(Shoe Dog),我觉得它就是创业的典范。当然还有《创业维艰》(The Hard Thing About Hard Things),不过这些书都挺常见的。

Lenny Rachitsky: 但也都是经典。Ben Horowitz 要来上播客了,聊《创业维艰》。

Garrett Lord: 太酷了。

Lenny Rachitsky: 对,《创业维艰》。好,你最近看过什么特别喜欢的电影或电视剧吗?我猜你可能没什么时间看这些——

Garrett Lord: 说出来可能会被喷,但我确实刚开始和我太太一起看《权力的游戏》——

Lenny Rachitsky: 第一次看。

Garrett Lord: 对。

Lenny Rachitsky: 好的,不错。

Garrett Lord: 所以我有好多要补的。

Lenny Rachitsky: 为什么会被喷……不,这很好。那些看过的人——

Garrett Lord: 我到目前为止非常喜欢的。

Lenny Rachitsky: 你到现在都很喜欢?好的。那剧挺血腥的,这是唯一的缺点。别在睡前看,不知道你已经看了多少血腥场景了。你最近发现了一款特别喜欢的产品吗?

Garrett Lord: SNOO。那个自动婴儿床 SNOO 真的帮了我们大忙。很喜欢,向 SNOO 团队致敬。

Lenny Rachitsky: 太棒了。我家也有一个 SNOO。不过我们从来没开过机,从头到尾就当个普通摇篮用了。

SNOO 与育儿(续)

Garrett Lord: 是的,大部分时间确实没开过,但有几次哭得厉害就打开了,确实帮了大忙。

人生信条

Lenny Rachitsky: 你有没有特别喜欢的座右铭,经常挂在嘴边或分享给别人的?

Garrett Lord: 我很喜欢那句话——不留遗憾,全力以赴。我在一个勤劳的家庭长大,爸爸为了养家糊口、让我们有好的生活,工作非常辛苦。就是那种拼尽全力的精神,不留任何侥幸。

普林斯顿泳池的故事

Lenny Rachitsky: 好的。最后一个问题,我在为这期播客做功课时研究了你的经历,有一个我特别喜欢的关于你早期拼搏的故事——你当时从一个校园跑到另一个校园,去推销让学校加入 Handshake。有个故事说你在普林斯顿的泳池里洗澡,就为了省钱,因为你根本没有地方住。这事儿是真的吗?能跟大家分享一下吗?

Garrett Lord: 是的,那段日子确实很艰难。我差点在普林斯顿被抓起来。对于我们这些到处跑的创业者来说,我们当时就睡在车里。我们有一辆福特福克斯,跑了大概两三万英里,晚上就停在麦当劳的停车场睡觉,因为那里灯亮,而且那时候 Wi-Fi 信号也好。与其花钱住酒店,想在会议前收拾一下自己的办法就是——每所大学都有泳池,而且泳池几乎总是开放的。我们从来没遇到过不开放的情况,它总是在早上对教职工、学生开放供人游泳健身。而每个泳池都有什么?有淋浴。

所以你可以去这个国家任何一所大学的泳池,免费洗个澡,让自己焕然一新。不过普林斯顿的校园保安对我这个非本校学生来洗澡这件事不太高兴。但我觉得这件事实际上反而帮了我们,因为普林斯顿的校园保安给我们正在推销的职业服务中心主任打了电话,问:“Garrett Lord 是谁?他真的是来给你们职业中心推销软件的吗?“这让跟职业中心的会议一开始就变得非常有活力和令人兴奋,因为对方会说:“你在我们泳池洗了澡?你开车过来的?” “对,我们从密歇根开过来的。” 所以我觉得这展现了一种承诺和投入的程度,让他们感到振奋。

Lenny Rachitsky: 可以想象,现在所有创始人都要开始用这个增长杠杆了——跟校园警察惹点麻烦,好跟学校领导约到更好的会面。太不可思议了。Garrett,这是一个疯狂的、了不起的、令人振奋的故事,就像你正在做的事情和这里的机会一样,以及它发展的速度和所有的优势。如果我是 Handshake 的投资人,我可能会说,“好吧,十年了,发展得不错。” 而现在就像,“哇,天哪。这是从哪冒出来的?” 太了不起了。而且这件事情本身也非常有意义。所以我很高兴你在目前这么忙碌的情况下还抽出了时间。最后两个问题:大家在哪里可以找到你,如果想联系你或者你们在招人的话?以及,听众怎样才能帮到你?

联系方式与招聘

Garrett Lord: 注册 Handshake 吧。如果你想给我发消息,那是最简单的方式。在 Handshake 上找 garrettlord 就行,你也可以在 Twitter 上找到我。我很喜欢 X,是 X 的重度用户。你也可以发邮件到 garrett@joinhandshake.com,注意两个 R,两个 T。至于怎么帮忙——我们现在正在大量招人。我们在纽约、旧金山、伦敦和柏林都有办公室。如果你有朋友对这个方向有热情,请告诉他们;或者你自己想了解更多,也请联系我们。我们很乐意聊聊。招聘是我们目前为满足需求需要解决的头号问题。所以如果你有才华,对 Handshake 感兴趣,想做我们的消费者产品,想做我们的企业端产品,解决有趣的 PLG 问题,或者打造最前沿的消费者社交体验——请联系我们。或者你想做我们的 AI 业务,我们也非常愿意跟你谈。

Lenny Rachitsky: 为了让大家更清楚,你们最需要招什么岗位?是所有岗位都招?还是主要是工程师?

Garrett Lord: 工程师。

Lenny Rachitsky: 工程师,好的。如果你是工程师,想加入当今全球增长最快的 AI 公司之一,机会来了。我们会在节目说明里附上招聘页面的链接。

Garrett Lord: 谢谢。

Lenny Rachitsky: 当然。Garrett,非常感谢你来做客。太精彩了。

Garrett Lord: 当然。

Lenny Rachitsky: 大家再见。

尾声

Lenny Rachitsky: 非常感谢大家的收听。如果你觉得这期节目有价值,可以在 Apple Podcasts、Spotify 或你喜欢的播客应用上订阅。也请考虑给我们评分或写评论,这真的能帮助更多听众发现这个播客。你可以在 Lennyspodcast.com 找到所有往期节目或了解更多关于本节目的信息。下期再见。

术语表

原文中文
ARRARR(年度经常性收入)
ASIASI(通用超级智能)
auto eval自动 eval
data labeling数据标注
DRIDRI(直接负责人)
expert network专家网络
frontier AI model前沿 AI 模型
gross margin毛利率
instructional design教学设计
KPIKPI(关键绩效指标)
lightning round快问快答
LLM大语言模型
matching market匹配市场
moat护城河
multimodal多模态
network effect网络效应
post-training后训练
pre-training预训练
principal engineerprincipal engineer(首席工程师)
product market fit产品市场契合点
reinforcement learning强化学习
rubricrubric(评分标准)
SFTSFT(监督微调)
staff engineerstaff engineer(资深工程师)
step function improvement阶跃式提升
supervised fine-tuning监督微调
swim lanes泳道
synthetic data合成数据
trajectory轨迹
universal basic income全民基本收入
verifiable domains可验证领域

此文档由 AI 分片翻译(translate_long_document)