Cursor的崛起——Lenny播客Michael Truell访谈
摘要
Anysphere联合创始人兼CEO Michael Truell做客Lenny播客,分享AI代码编辑器Cursor从零到3亿美元ARR的崛起历程。访谈涵盖Cursor的起源故事、从CAD自动化转向编程自动化的战略转型、对代码之后世界的构想、自研定制模型的技术决策、团队招聘经验,以及对未来工程师技能演变和AI编码工具市场格局的深度思考。
核心概念及解读
代码之后(Post-Code)——指未来编程不再局限于传统代码书写,而是演变为以自然语言表达逻辑意图的新范式,工程师角色从代码实现者转变为逻辑设计师:
ARR(年经常性收入)——衡量SaaS产品商业表现的核心指标,Cursor在推出20个月后达到1亿美元,两年后达到3亿美元,体现其爆发式增长:
品味(Taste)——在AI辅助编程时代,工程师需要具备的核心软技能,不仅指视觉审美,更指对逻辑架构、产品设计和代码质量的判断力:
定制模型(Custom Models)——Cursor在基础大模型之上自研的专用模型,用于代码补全、语义搜索和细节填充等场景,是产品差异化的关键技术壁垒:
Vibe Coding——一种依赖AI直觉式生成代码的编程方式,Cursor对此持审慎态度,强调在探索AI能力边界的同时仍需人类进行逻辑把控与迭代审查:
- 视频链接:The rise of Cursor: The $300M ARR AI tool that engineers can’t stop using | Michael Truell
- 官方频道:LennysPodcast
讲座介绍
本次访谈邀请了 Anysphere 公司的联合创始人兼 CEO Michael Truell,深入探讨了他领导开发的 AI 代码编辑器 Cursor 的崛起历程。Cursor 作为软件开发领域备受瞩目的工具,在短短两年内实现了 $300 million 的年经常性收入,其快速增长的背后蕴藏着对 AI 时代软件工程变革的深刻洞见。
访谈中,Michael Truell 分享了 Cursor 从最初构想到成功商业化的关键节点,包括早期在自动化领域的探索以及最终聚焦于编程自动化的战略选择。他详细阐述了对“代码之后”世界的构想,探讨了未来编程可能不再局限于传统代码形式,而是演变为一种更侧重逻辑设计与意图表达的新范式。随之而来的是对未来工程师所需技能的讨论,特别是“品味”和逻辑设计能力的重要性将日益凸显。
此外,对话还涉及了 Cursor 在技术层面的决策,例如为何选择构建独立的 IDE 而非插件,以及如何平衡利用大型基础模型与开发自有定制模型。Michael 也分享了在 AI 产品开发和团队建设中遇到的反直觉经验、对市场竞争格局和长期防御性的看法,以及在 AI 技术飞速迭代的环境下如何保持团队专注。对于正在使用或考虑使用 AI 编码工具的工程师和产品团队,Michael 也给出了具体的实践建议。
内容纲要
├── 引言与Cursor概览
│ ├── 嘉宾介绍:Michael Truell,Anysphere CEO
│ ├── Cursor 简介:AI 代码编辑器及其显著增长($300M ARR)
│ └── 核心议题预览:代码之后、技能演变、增长经验等
├── Cursor的愿景:代码之后的世界
│ ├── 定义新的编程范式:意图驱动、更高层次
│ ├── 对比现有未来编程设想(文本编辑 vs. 聊天机器人)
│ └── “代码之后”的具体形态:类自然语言逻辑、人机协作
├── 未来技能的重要性:品味与逻辑设计
│ ├── “品味”的价值提升:超越视觉,关注逻辑
│ ├── 工程师角色的转变:从实现者到逻辑设计师
│ ├── “细心”与“品味”的权重变化
│ └── 对“Vibe Coding”的看法与Cursor的目标
├── Cursor的起源故事与早期发展
│ ├── 灵感来源:Code Pilot 体验与 AI 扩展定律
│ ├── 最初方向的失误:尝试自动化机械工程 (CAD)
│ ├── 转向编程领域的原因:缺乏热情与看到更大潜力
│ └── 教训:在热门领域寻找未被满足的雄心
├── 技术与产品决策
│ ├── 为什么选择构建 IDE:控制力、未来适应性、超越插件
│ ├── 对“人人成为工程经理”的思考:任务分解与迭代审查
│ ├── 如何决定发布时机:快速原型、内部试用、早期反馈驱动
│ ├── 回顾 Cursor 的成功:持续偏执、产品迭代、专注核心
│ ├── 构建 AI 产品的反直觉经验:从不期望到深度依赖自研模型
│ └── Cursor 技术栈内部:基础模型与自研模型(补全、搜索、细节填充)的结合
├── 市场动态与护城河
│ ├── AI 领域的防御性:持续创新优于传统护城河
│ ├── 市场规模与格局预测:远超传统 IDE,可能产生单一巨头
│ └── 对微软 Copilot 的看法:结构性与历史性原因分析
├── 用户建议与使用技巧
│ ├── 培养对模型能力的“品味”
│ ├── 技巧1:分解任务,迭代交互
│ └── 技巧2:在安全区探索模型极限
├── 团队建设与招聘
│ ├── 早期招聘的教训:速度与质量的平衡,画像的调整
│ ├── 招聘核心:寻找特质(好奇心、诚实、心态)
│ └── 面试方法:为期两天的现场工作测试项目
├── 保持专注与未来展望
│ ├── 在 AI 快速发展中保持专注:招聘、文化、经验免疫
│ ├── 对 AI 未来最常见的误解:避免极端,认识长期性与深度
│ ├── 对工程师需求的看法:需求将持续增长,源于成本降低和应用扩展
│ ├── 团队创新能力的培养:反思与学习历史
│ └── 招聘需求:全方位,尤其工程、设计、研究与增长
└── 结语与联系方式
The rise of Cursor: The $300M ARR AI tool that engineers can’t stop using | Michael Truell
- 播客: Lenny’s Podcast
- 订阅人数: 31.9万
- 嘉宾: Michael Truell, Anysphere (Cursor背后公司) 联合创始人兼CEO
- 核心成就: Cursor 在推出仅两年后年经常性收入 (ARR) 达到
$300 million。 - 观看次数: 24,017次观看 (截至2025年5月1日)
您将学到:
- Cursor 从自动化 CAD 到自动化代码的早期转型
- Michael 对“代码之后”的愿景以及编程将如何演变
- 为什么 Cursor 尽管起初并非如此,但最终构建了自己的定制 AI 模型
- Cursor 快速增长的关键经验教训
- 为什么“品味”和逻辑设计将成为比技术编码能力更有价值的工程技能
- 为什么 AI 编码工具的市场比人们意识到的要大得多——以及为什么可能只有一个主导赢家
- Michael 对工程师和产品团队为迎接快速到来的 AI 未来做准备的建议
由以下公司赞助:
- Eppo—运行可靠、有影响力的实验: https://www.geteppo.com/
- Vanta—自动化合规。简化安全: https://vanta.com/lenny
- OneSchema—导入 CSV 数据速度提高 10 倍: https://oneschema.co/lenny
如何找到 Michael Truell:
- X: https://x.com/mntruell
- LinkedIn: /michael-t-5b1bbb122
- Website: https://mntruell.com/
参考资料:
- Cursor: https://www.cursor.com/
- Microsoft Copilot: https://copilot.microsoft.com/
- 神经网络语言模型的扩展定律: https://openai.com/index/scaling-laws…
- MIT: https://www.mit.edu/
- Telegram: https://telegram.org/
- Signal: https://signal.org/
- WhatsApp: https://www.whatsapp.com/
- Devin: https://devin.ai/
- Visual Studio Code: https://code.visualstudio.com/
- Chromium: https://chromium.googlesource.com/chr…
- 探索 ChatGPT (GPT) 封装器——它们是什么以及如何工作: https://learnprompting.org/blog/gpt_w…
- OpenAI 的 CPO 谈 AI 如何改变必备技能、护城河、编码、创业剧本等 | Kevin Weil (OpenAI CPO, 前 Instagram, Twitter): https://www.lennysnewsletter.com/p/ke…
- 创始人背后:Marc Benioff: https://www.lennysnewsletter.com/p/be…
- DALL-E 3: https://openai.com/index/dall-e-3/
- Stable Diffusion 3: https://stability.ai/news/stable-diff…
引言与Cursor概览
Michael: …我们 Cursor 的目标是发明一种新的编程类型,一种非常不同的构建软件的方式。一个“代码之后”的世界,我认为工程师将越来越像逻辑设计师,真的,这将关乎于明确表达你希望事物如何运作的意图。
Lenny: 到目前为止,在构建 Cursor 的过程中,你学到的最反直觉的事情是什么?
Michael: 我们绝对没想到会做任何我们自己的模型开发。而现在,Cursor 中的每一个神奇时刻都以某种方式涉及到一个定制模型。
Lenny: 在担任这个角色之前,有什么是你希望自己早就知道的?
Michael: 很多人你听说招聘太快,我认为我们一开始实际上招聘太慢了。
Lenny: 你们在一年半内就从 $0 增长到 100 million ARR,这是历史性的。是否有一个转折点,事情开始真正起飞?
Michael: 增长一直相当稳定地呈指数级增长。而指数增长一开始在数字很低的时候感觉相当缓慢,一开始并没有真正显示出突飞猛进的感觉。
Lenny: 你认为你们成功的秘诀是什么?
Michael: 我想是…
Lenny: 今天我的嘉宾是 Michael Truell。Michael 是 Anysphere 的联合创始人兼 CEO,Cursor 就是这家公司的产品。如果你一直与世隔绝,还没听说过 Cursor,它是领先的 AI 代码编辑器,并且正处在改变工程师和产品团队构建软件方式的最前沿。它也是有史以来增长最快的产品之一,在推出仅 20 个月后就达到了 $100 million 的年经常性收入(ARR),然后在推出仅两年后达到了 $300 million 的 ARR。
Michael 从事 AI 工作已有 10 年。他在麻省理工学院(MIT)学习计算机科学和数学,在 MIT 和 Google 从事过 AI 研究,并且是技术和商业史的学生。你很快就会看到,Michael 对事物的发展方向以及构建软件的未来有着深刻的思考。我们聊了 Cursor 的起源故事,他对代码之后会发生什么的预测,他从构建 Cursor 中获得的最重要的反直觉经验教训,他对软件工程师未来走向的看法,等等。
Michael 不常上播客。他唯一上过的另一个播客是 Lex Fridman 的,所以能请到 Michael 真的是莫大的荣幸。如果你喜欢这个播客,别忘了在你的播客应用或 YouTube 上订阅和关注。另外,如果你成为我时事通讯的年度订阅者,你将获得 Perplexity、Linear、Superhuman、Notion 和 Granola 的一年免费使用权。在 lennysnewsletter.com 查看,然后点击 bundle。
那么,我为您带来 Michael Truell。
Lenny: 本期节目由 Eppo 赞助。Eppo 是下一代 A/B 测试和功能管理平台,由 Airbnb 和 Snowflake 的前员工为现代增长团队打造。像 Twitch、Miro、ClickUp 和 DraftKings 这样的公司都依赖 Eppo 来支持他们的实验。实验对于推动增长和理解新功能性能越来越重要,而 Eppo 能帮助你提高实验速度,同时以其他商业工具无法做到的方式解锁严谨的深度分析。我在 Airbnb 工作时,最喜欢的一件事就是我们的实验平台,在那里我可以轻松设置实验、排查问题并自行分析性能。Eppo 能做到所有这些,甚至更多,它拥有先进的统计方法,可以帮你将实验时间缩短数周;它有易于使用的用户界面,可以深入探究性能;它还有开箱即用的报告,帮你避免烦人、冗长的分析周期。Eppo 还让你能轻松地与团队分享实验见解,为 A/B 测试的飞轮激发新想法。Eppo 支持各种用例的实验,包括产品、增长、机器学习、变现和电子邮件营销。访问 geteppo.com/lenny 查看 Eppo,将你的实验速度提高 10 倍。网址是 getE-P-P-O.com/lenny。
Lenny: 本期节目由 Vanta 赞助。当涉及到确保贵公司拥有顶级的安全实践时,事情很快就会变得复杂。现在,你可以通过一个单一平台 Vanta 来评估风险、获得客户信任,并自动化 SOC 2、ISO 27001、HIPAA 等合规性。Vanta 市场领先的信任管理平台帮助你持续监控合规性,同时报告和跟踪风险。此外,你可以使用 Vanta AI 完成安全问卷,节省数小时。加入数千家全球公司的行列,使用 Vanta 自动化证据收集、统一风险管理并简化安全审查。访问 vanta.com/lenny 可获得 Vanta 的 $1,000 折扣。网址是 V-A-N-T-A.com/lenny。
Cursor的愿景:代码之后的世界
Lenny: Michael,非常感谢你来到这里。欢迎来到播客。
Michael: 谢谢你。很高兴来到这里。谢谢你邀请我。
Lenny: 我们之前聊天时,你提出了一个非常有趣的说法,即“代码之后会发生什么”的想法。谈谈这个吧,就是你对事物发展方向的愿景,关于从代码可能转向其他东西。
Michael: 我们 Cursor 的目标是发明一种新的编程类型,一种非常不同的构建软件的方式,它被提炼为:你以最简洁的方式向计算机描述你想要的意图,并且真正归结为定义你认为软件应该如何工作以及它应该看起来如何。利用我们今天拥有的技术,并且随着它的成熟,我们认为你可以达到一个境界,在那里你可以发明一种新的构建软件的方法,这种方法是更高层次、更高效,在某些情况下也更容易使用的。
这个过程将是一个逐渐远离今天构建软件样貌的过程。我想将其与我认为的未来软件形态的几种愿景进行对比……我认为在流行意识中有几种愿景,我们至少对它们有一些不同意见。一种是,有一群人认为未来的软件构建将看起来与今天非常相似,这主要意味着文本编辑、正式的编程语言,如 TypeScript、Go、C 和 Rust。还有另一群人则认为你只需要对一个机器人输入指令,让它为你构建一些东西,然后让它修改你正在构建的东西,这有点像聊天机器人、Slackbot 的风格,你在和你的工程部门对话。
我们认为这两种愿景都有问题。我认为在聊天机器人风格的那一端……而且我们认为未来会比这两种都更奇特。聊天机器人风格的问题在于它缺乏很多精确性。如果你想让人们完全控制软件的外观和工作方式,你需要让他们能够以比仅仅在一个脱离整体的文本框中说“改变我的应用程序的这一点”更精确的形式来示意他们想要改变什么。然后,我们认为那个一切不变的世界版本是错误的,因为我们认为技术将会变得越来越好。
所以,一个代码之后的世界,我认为它看起来像这样一个世界:你有一个软件逻辑的表示,它确实看起来更像英语,你写下来……你可以想象成某种形式的(听不清),你可以想象成编程语言向伪代码的演进。你写下了软件的逻辑,你可以在高层次上编辑它,你可以指向它。它不会是难以理解的数百万行代码,而是会更简洁、更容易理解、更容易导航。但是,那个“疯狂的、难以理解的符号”开始向更易于人类阅读和编辑的方向演变的世界,是我们正在努力实现的世界。
Lenny: 这是一个深刻的观点。我想确保人们不会错过你所说的重点,那就是你设想的未来一年左右,当事情开始转变时,人们将逐渐不再需要看到代码,不再需要用 JavaScript 和 Python 等语言进行思考,而会出现一种抽象层,本质上是伪代码,用更接近英语的句子来描述代码应该做什么。
Michael: 是的。我们认为最终会变成那样,而且我们非常坚持认为,这条路径要通过现有的专业工程师,它看起来像是从代码演变而来的。而且它绝对看起来是人类仍然掌控方向盘,人类既对软件的各个方面拥有完全的控制权,并且不会放弃这种控制权。同时,人类也能够非常快速地进行更改,拥有快速的迭代循环,而不是仅仅在后台有一个非常慢、需要数周时间为你完成所有工作的的东西。
未来技能的重要性:品味与逻辑设计
Lenny: 这就引出了一个问题,对于那些目前是工程师,或者正在考虑成为工程师、设计师或产品经理的人来说,在你所说的这个“代码之后”的世界里,你认为哪些技能会变得越来越有价值?
Michael: 我认为“品味”(Taste)将变得越来越有价值。而且我认为,当人们在软件领域思考品味时,他们通常想到的是视觉效果,或者对流畅动画、颜色搭配、UI、UX 等视觉设计方面的品味。视觉方面是定义一个软件的重要部分,但正如之前提到的,我认为定义一个软件的另一半是它的逻辑以及事物如何运作。
我们有很棒的工具来规格化视觉方面的东西,但当你涉及到软件如何工作的逻辑时,目前我们拥有的最佳表示就是代码。你可以用 Figma 来大致示意,你可以通过写笔记来示意,但只有当你有一个实际可工作的原型时才行。所以我认为,工程师将越来越像一个逻辑设计师,真的,这将关乎于明确表达你希望一切究竟如何运作的意图。它将更多地关注“什么”(what),而稍微少一些关注具体如何在底层实现(how)。
我认为品味将变得越来越重要。我认为软件工程的一个方面,虽然我们现在离此还很远,而且网上有很多关于人们如果过于信任 AI 进行工程开发可能遇到的试验和磨难的有趣 meme,比如构建出有明显缺陷和功能问题的应用程序。但我认为我们会达到一个境界,在那里你可以作为软件工程师不必那么小心翼翼,而这在现在是一项极其极其重要的技能。我们将稍微从细心(carefulness)转向更多的品味(taste)。
Lenny: 这让我想到了“凭感觉编码”(vibe coding),当你谈到不必过多考虑细节,只需顺其自然时,你描述的是类似这样的东西吗?
Michael: 我认为这有关联。我认为“凭感觉编码”现在恰恰描述了这种颇具争议的创作状态,即你生成大量代码,但并不真正理解细节。这是一种创作状态,但会带来很多问题,因为不理解底层细节,你很快就会达到一个瓶颈,当你创造的东西足够大以至于无法改变时。所以我认为我们感兴趣的一些想法,比如如何让人们在不真正理解代码的情况下继续控制所有细节?我认为这方面的解决方案与目前正在“凭感觉编码”的人非常相关。我认为目前,我们缺乏让有品味的人(tastemakers)真正完全控制软件的能力。另外,“凭感觉编码”以及让人们的品味真正闪耀出来的问题之一是,你可以创造东西,但很多时候是 AI 做出的决策笨拙且你无法控制。
Lenny: 关于这个话题还有一个问题。你提到了“品味”这个词。当你说品味时,你在想什么?
Michael: 我想的是拥有关于应该构建什么的正确想法。它将越来越关乎于轻松地转换:这就是你想要构建的东西,这就是你希望一切如何运作,这就是你希望它看起来的样子。然后你就能在计算机上实现它,而较少地涉及这种转换层:你和你的团队对想要构建的东西有一个构想,然后你必须非常费力地、劳动密集地将其铺陈成计算机可以执行和解释的格式。我认为,也许在 UI 方面,“品味”有点用词不当,但它就是关乎拥有关于应该构建什么的正确想法。
Cursor的起源故事与早期发展
Lenny: 太棒了。好的。我会回到这些话题,但我想先把我们带回到 Cursor 的开端。我从未听过它的起源故事,我想很多人也不知道这一切是如何开始的。基本上,你们正在构建世界上增长最快的产品之一,它正在改变人们构建产品的方式,改变职业、专业,改变了很多东西。这一切是如何开始的?在早期旅程中有没有什么难忘的时刻?
Michael: Cursor 有点像是一个寻找问题的解决方案开始的,在某种程度上,它很大程度上来自于对未来 10 年人工智能将如何变得更好的反思。有两个决定性的时刻,一个是对使用 Code Pilot 的第一个测试版感到非常兴奋。这是我们第一次使用一个真正非常非常有用的 AI 产品,而且它确实就是有用,而不仅仅是一个空谈的演示性东西。
除了是我们用过的第一个有用的 AI 产品外,Code Pilot 也是我们采用过的最有用的开发工具之一,如果不是最有用的那个的话,这让我们非常兴奋。另一个让我们非常兴奋的时刻是 OpenAI 和其他地方发布的一系列关于扩展定律(scaling laws)的论文,这些论文表明,即使我们没有任何新想法,仅仅通过拉动简单的杠杆,比如扩大模型的规模,以及扩大输入模型的数据量,人工智能也会变得越来越好。
所以在 2021 年底、2022 年初,这让我们对 AI 产品现在成为可能感到兴奋,这项技术将在未来成熟。当我们环顾四周时,感觉有很多人在谈论制造模型,但感觉人们并没有真正选择一个知识工作的领域,并思考随着 AI 变得越来越好,它会是什么样子。这让我们开始了一个想法产生的练习,比如,“随着这项技术变得更加成熟,这些知识工作领域在未来将如何改变?工作的最终状态会是什么样子?我们用来完成这项工作的工具将如何改变?模型需要如何改进以支持工作的变化?一旦扩展和预训练耗尽,你将如何继续推动技术能力?”
Cursor 开始时的失误在于我们实际上研究了……我们有点做了这个宏大的练习,然后决定研究一个我们认为相对没有竞争力、沉闷、无聊,没有人会关注的知识工作领域,因为我们想,“哦,编码很棒,编码肯定会随着这个 AI 改变,但人们已经在做了。”所以一开始有四个月的时间,我们实际上在研究一个非常不同的想法,那就是帮助自动化和增强机械工程,并为机械工程师构建工具。
从一开始就存在问题。我和我的联合创始人,我们不是机械工程师。我们有朋友是机械工程师,但我们对这个领域非常不熟悉。所以从一开始就有点像盲人摸象的问题。还有一些问题,比如你如何真正将现有的模型应用于机械工程并使其有用?我们的结论是,你实际上需要从一开始就开发自己的模型。我们这样做的方式很棘手,互联网上关于不同工具和零件的 3D 模型数据不多,也没有预期构建这些 3D 模型的步骤,而且从拥有这些数据的来源获取它们也是一个棘手过程。
但最终发生的是,我们恢复了理智,我们意识到我们对机械工程并不超级兴奋,这不是我们想投入毕生的事情。我们环顾四周,在编程领域,感觉尽管经过了相当长的一段时间,但变化不大,感觉那些在这个领域工作的人可能与我们有脱节,感觉他们对于未来一切将走向何方,以及所有软件创造将如何通过这些模型被颠覆,并没有足够大的雄心。这就是促使我们走上构建 Cursor 道路的原因。
Lenny: 好的。太有趣了。好的,首先,我喜欢……这通常是你听到的建议,去追求一个无聊的行业,因为那里没人,有机会。有时这确实有效,但我喜欢在这个旅程中,实际情况是,“不,实际上,去追求最热门、最受欢迎的领域,AI 编码,应用构建。”结果成功了。你刚才的表述是,你觉得(当时)可能没有看到足够的雄心,你认为还有更多可以做的事情。所以感觉这是一个有趣的教训。即使某件事看起来,“好吧,太晚了,有 GitHub,Code Pilot 已经有了。”还有其他一些产品。如果你注意到它们只是没有它们本可以有的那么雄心勃勃,或者不如你有雄心,或者你几乎看到了它们方法中的缺陷,那么仍然有很大的机会。这 resonates 吗?
Michael: 这完全 resonates。部分原因在于,你需要有可以发生的跨越式发展(leapfrogs),你需要有你可以做的事情。我认为关于 AI 令人兴奋的是,在很多地方,我认为这在我们的领域仍然非常真实,并且可以谈论我们如何看待以及如何处理这个问题,但我认为天花板真的很高。是的,如果你环顾四周,可能即使你采用任何这些领域中最好的工具,未来几年仍然需要做很多事情。拥有那个空间,拥有那个高天花板,我认为在软件领域中是独一无二的,至少在 AI 领域,它的高度是如此之高。
技术与产品决策
Lenny: 让我们回到 IDE 的问题。所以你们本可以采取几条路线,其他公司也在采取不同的路线。一种是构建一个供工程师在其中工作的 IDE,并为其添加 AI 魔力;另一种是完全是一个 AI 代理(agentic)的开发产品;还有一种是专注于构建一个非常擅长编码的模型,专注于构建最好的编码模型。是什么让你决定并认为 IDE 路径是最好的路线?
为什么选择构建 IDE
Michael: 那些从一开始就只专注于模型的人,他们在研究端到端的自动化编程。我认为他们试图构建的东西与我们非常不同,我们关心的是给予人类对他们最终构建的工具中所有决策的控制权。而我认为那些人非常倾向于思考一个未来,即端到端地,整个事情都由 AI 完成,也许 AI 也做出了所有的决策。所以,第一,有个人的兴趣因素。第二,我认为,我们一直试图对技术今天的现状保持强烈的现实主义态度,对 AI 将在未来几十年如何成熟感到非常非常非常兴奋。但我认为,有时人们……有一种本能,看到 AI 在一个领域做出神奇的事情,然后就有点拟人化这些模型,认为它在这里比聪明人更好,所以它在那里也一定比聪明人更好。
但这些东西有巨大的问题,我们……从一开始,我们的产品开发过程就真正是关于内部试用(dogfooding),每天都深入使用这个工具。我们从不想发布任何对我们自己没用的东西,我们有这样做的优势,因为我们是我们产品的最终用户。我认为这让你对技术目前的现状有一种现实主义的态度,所以这绝对让我们认为我们需要人类来掌控方向盘,AI 不能做所有事情。我们也出于个人原因对给予人类这种控制权感兴趣,所以这就让你远离了仅仅是模型公司,也让你远离了仅仅是这种没有人类控制的端到端的东西。
然后,你如何从可能只是现有编码环境的插件转向 IDE,是基于这样的信念:编程将流经这些模型,编程的活动将在未来几年发生巨大变化。而现有编码环境所具有的可扩展性是如此如此如此有限,所以如果你认为用户界面可能会发生巨大变化,如果你认为编程的形式将发生巨大变化,那么你必然需要控制整个应用程序。
Lenny: 我知道你们现在有一个 IDE,这可能是你认为未来方向的偏见,但我只是好奇,你认为未来很大一部分也会是 AI 工程师,它们只是待在 Slack 里为你做事吗?这是否有一天会融入 Cursor?
Michael: 我认为你会想要能够在所有这些东西之间相当轻松地移动,有时我认为你会想让事情自己运行一段时间,然后我认为你会想要能够把 AI 的工作拉进来,然后非常非常非常快速地处理它,然后也许再让它自己运行。所以这种后台与前台的形式因素,我认为你希望这一切都能在一个地方良好运作。我认为后台的东西,对于一部分编程特别有用,那就是那种很容易用很少的描述就能精确说明你想要什么,以及不用太多描述就能精确说明正确性是什么样的编程任务。Bug 修复就是一个很好的例子,但这绝对不是编程的全部。所以我认为 IDE 是什么会随着时间完全改变,我们采用拥有自己编辑器的方法是基于它将不得不随着时间演变的假设。我认为这将包括,你可以从不同的界面,如 Slack 或你的问题跟踪器或其他任何东西,启动任务,我认为这也将包括你盯着的那块玻璃(界面)将会发生很大变化。我们主要认为 IDE 就是你构建软件的地方。
Lenny: 我觉得人们在谈论代理(agents)和所有这些将为你做所有事情的 AI 工程师时,没有足够讨论的一点是,基本上我们都变成了工程经理,手下有很多不太聪明的下属,你必须做大量的审查、批准和说明。我想听听你对此的看法,以及你是否能做些什么让这变得更容易?因为这听起来真的很难。任何管理过大团队的人都会想,“天哪,所有这些初级人员不断向我汇报,做着质量不高的工作,一遍又一遍。”这简直是,“这是什么样的生活啊。太糟糕了。”
人人都会成为工程经理吗?
Michael: 是的。也许你(听不清)和(听不清)进行一对一会谈。如此多的一对一。
Michael: 是的。所以我们看到的使用 AI 最成功的客户,我认为他们在使用这些东西的某些方式上仍然相当保守。所以我确实认为,今天最成功的客户真正依赖的是像我们的“下一次编辑预测”(next edit prediction)这样的东西,在那里你像平常一样编码,它预测你接下来要做的动作。然后他们也非常依赖于缩小你将要交给机器人的任务范围,对于固定的审查来自代理或整体 AI 的代码所花费的时间百分比,你可以……有两种模式。一种是,你可以花大量时间预先说明事情,AI 去工作,然后你去审查 AI 的工作,然后你就完成了。这就是整个任务。或者你可以把事情真正分解开。所以你可以说明一点,AI 写一些东西,审查,说明一点,AI 写一些东西,审查。自动补全(Autocompletes)完全是这个谱系的末端。我们仍然经常看到,使用这些工具最成功的人目前正在分解任务,并保持事情相当(听不清)。
Lenny: 这听起来没那么糟糕。我很高兴这里有一个解决方案。我想回到你们第一次构建 Cursor 的时候。
他们如何决定是时候发布产品了
Lenny: 到了哪个点你意识到这已经准备好了?什么时候你会觉得,“好吧,我想是时候把它推出去,看看会发生什么”?
Michael: 所以当我们开始构建 Cursor 时,我们对于在发布给世界之前会花费一段时间感到相当偏执。所以一开始,我们实际上……Cursor 的第一个版本是手动编写的。现在我们使用 VS Code 作为基础,就像许多浏览器使用 Chromium 作为基础一样,并以此为基础。一开始,我们没有这样做,而是从头开始构建了 Cursor 的原型,这涉及大量工作。我们必须构建我们自己的……现代代码编辑器包含很多东西,包括对许多不同语言的支持,以及在语言之间移动的导航支持,对事物的错误跟踪支持。还有像集成命令行、使用远程服务器的能力、连接到远程服务器以查看和运行代码的能力。所以我们有点像进行了一场闪电战,非常快速地构建东西,从头开始构建我们自己的编辑器,然后还有 AI 组件。
大约过了五个星期,我们全天候都在这个编辑器上工作,并且扔掉了我们之前的编辑器,开始使用新的编辑器。然后当它达到我们觉得有点用的程度时,我们把它交到其他人手中,进行了一个非常短的测试期。然后我们在第一行代码开始后的几个月内就向世界发布了它,我想大概是三个月。这绝对是一个,“让我们赶紧把它交给人们,并快速地公开构建”的心态。让我们吃惊的是,我们以为我们会为几百个人构建很长一段时间。但从一开始,就立即涌入了大量的兴趣,还有大量的反馈。这非常有帮助,我们从中学习。这实际上也是为什么我们后来转而基于 VS Code 而不是仅仅用这个手动编写的东西。很多这方面的动机来自于最初的用户反馈,然后就一直在公开迭代。
Lenny: 我喜欢你如何低调地描述你们获得的吸引力。我想你们在一年、一年半左右的时间里,年经常性收入(ARR)从 $0 增长到了 100 million,这是历史性的。
回顾 Cursor 的成功
Lenny: 你认为像这样成功的关键是什么?你刚才谈到内部试用(dogfooding)是其中很大一部分。你们在三个月内就把它构建出来了,这太疯狂了。你认为你们成功的秘诀是什么?
Michael: 那三个月版本的质量并不高,所以我认为这是一直以来持续的偏执,即认为这个东西在所有这些方面都可以变得更好。最终目标是真正发明一种非常新的编程形式,涉及到自动化我们今天所知的大量编码工作。无论 Cursor 发展到什么阶段,我们都觉得离那个最终目标还非常非常遥远,总是有很多事情要做。很大程度上不是过度依赖于最初的推动,而是工具的持续演进,以及持续地让工具变得更好。
Lenny: 在那三个月之后,是否有一个转折点,事情开始真正起飞?
Michael: 老实说,一开始感觉相当缓慢,也许这源于我们自己的一些不耐烦。我认为整体的增长速度持续让我们感到惊讶。我认为最令人惊讶的事情之一是,增长一直相当稳定地呈指数级增长,就是持续的月度环比增长,有时会因为我们发布新版本或其他事情而加速。但指数增长一开始在数字很低的时候感觉相当缓慢,所以一开始并没有真正感觉突飞猛进。
Lenny: 对我来说,这听起来像是“建好它,他们就会来”(build it and they will come)真的奏效了。你们只是构建了一个你们自己作为工程师都喜爱的很棒的产品,你们把它推出去,人们就是喜欢它,告诉了他们认识的每个人。
Michael: 它基本上完全是我们团队致力于产品,把产品做好,而不是把时间花在其他可能的事情上。我们确实在很多其他事情上花了很多时间,例如,建立团队非常重要,做像支持轮换(support rotations)这样的事情也非常重要。但是一些人们在早期建立公司时通常会去做的事情,我们确实让那些火烧了很长时间,特别是在销售和营销方面。所以,只是致力于产品,首先构建一个你自己喜欢、你的团队喜欢的产品,然后根据一部分用户的反馈进行调整,这听起来可能很简单,但正如你所知,要做好是很难的。而且有很多不同的方向可以选择,很多不同的产品方向。
我认为专注,以及战略性地选择正确的事情来构建,并有效地排定优先级是很棘手的。我认为这个领域的另一个棘手之处在于,这有点像一种新的产品构建形式,它非常跨学科,因为我们介于普通软件公司和基础模型公司之间,我们在为数百万人开发产品,这方面的要求必须是卓越的,但同时,产品质量的一个重要维度是在有意义的地方越来越多地进行科学研究,越来越多地在模型方面下功夫。所以,把这方面的事情做好也很棘手。总的来说,我想指出的是,也许这些事情听起来规定起来很简单,但要做好它们是困难的,而且有很多不同的方式可以运行。
Lenny: 我很高兴今天 Andrew Luo 能加入我们。Andrew 是 OneSchema 的 CEO,我们的播客赞助商之一。欢迎 Andrew。
Andrew Luo: 谢谢邀请,Lenny。很高兴来到这里。
Lenny: OneSchema 有什么新动向?我知道你们和一些我最喜欢的公司合作,比如 Ramp、(听不清)和 Watershed。我听说你们推出了一个新的数据接收产品,可以自动化团队花费数小时手动导入、映射和集成 CSV 及 Excel 文件的工作?
Andrew Luo: 是的。我们刚刚推出了 OneSchema FileFeeds 的 2.0 版本。我们用 AI 从头开始重建了它。我们看到很多客户找到我们,他们的团队里有数据工程师,但仍然为清理混乱电子表格所需的手动工作而挣扎。FileFeeds 2.0 允许非技术团队仅通过简单的提示就能自动化转换 CSV 和 Excel 文件的过程。我们支持所有最棘手的文件集成,SFTP、S3,甚至电子邮件。
Lenny: 我可以告诉你,如果我的团队必须构建这样的集成,能把这个从我们的路线图上拿掉,转而使用像 OneSchema 这样的东西,那该多好啊。
Andrew Luo: 当然,Lenny。我们听过太多因为哪怕仅仅一条坏记录导致的宕机恐怖故事,无论是在交易、员工文件、采购订单等等。调试这些问题通常就像大海捞针。OneSchema 能阻止任何坏数据进入你的系统,并自动验证你的文件,生成包含所有坏文件中确切问题的错误报告。
Lenny: 我知道导入不正确的数据会给你的客户带来各种痛苦,并迅速失去他们的信任。Andrew,非常感谢你的加入。如果你想了解更多,请访问 oneschema.co。网址是 oneschema.co。
构建 AI 产品的反直觉经验教训
Lenny: 到目前为止,在构建 Cursor、构建 AI 产品的过程中,你学到的最反直觉的事情是什么?
Michael: 我认为对我们来说,一个反直觉的事情,之前稍微提到过,但就是,我们开始时绝对没想到会做任何我们自己的模型开发。正如提到的,当我们进入这个领域时,有些公司从一开始就直接专注于从头开始训练模型。我们之前计算过训练所需的成本,并且知道那不是(听不清)我们能够做到的。而且感觉有点像是把注意力放在了错误的领域,因为已经有很多很棒的模型存在了,为什么要花费所有这些工作来复制其他玩家已经做过的事情。特别是在预训练方面,获取一个一无所知的神经网络,然后教它整个互联网的知识。
所以我们以为我们根本不会做那个,而且从一开始我们就很清楚,现有的模型有很多它们可以为我们做但却没有做的事情,因为没有为它们构建合适的工具。但事实上,我们做了大量的模型开发,在内部,这是我们招聘方面的一个重要焦点,并在那里组建了一支优秀的团队。而且这对我们来说,在产品质量方面也是一个巨大的胜利。到目前为止,Cursor 中的每一个神奇时刻都以某种方式涉及到一个定制模型。所以这绝对是反直觉的、令人惊讶的,而且这是一个渐进的过程,最初有一个训练我们自己模型的用例,在那里使用任何最大的基础模型确实没有意义。那次非常成功,然后转移到另一个效果很好的用例,并从此一直发展。做这种模型开发的一个有帮助的事情是仔细选择你的切入点,不要试图重新发明轮子,不要试图专注于那些最好的基础模型已经非常出色的地方,而是专注于它们的弱点,以及你如何补充它们。
Lenny: 我想这对很多人来说会很惊讶,听说你们有自己的模型。
Cursor 的技术栈内部
Lenny: 当人们谈论 Cursor 和这个领域的所有参与者时,他们会称之为 GPT 封装器(GPT wrappers),它们只是建立在 ChatGPT 或 Sonnet 之上。而你所说的是你们有自己的模型,谈谈幕后的技术栈吧。
Michael: 是的,当然。我们确实在很多不同的方面大量使用了最大的基础模型,它们是将 Cursor 体验带给人们的重要组成部分。我们使用自己模型的地方,有时是为了服务一个基础模型由于成本或速度原因根本无法服务的用例。其中一个例子就是自动补全(autocomplete)方面。对于不编码的人来说,这可能有点难以理解,但代码是一种奇怪的工作形式,有时,你接下来 5、10、20、30 分钟的工作完全可以通过观察你的肩膀来预测。
我会将其与写作进行对比。写作,很多人熟悉 Gmail 的自动补全,以及你在尝试发送短信或电子邮件等时出现的不同形式的自动补全。它们只能提供有限的帮助,因为通常情况下,仅仅通过看你之前写了什么,真的不清楚你接下来要写什么。但在代码中有时,当你编辑代码库的一部分时,你将需要在代码库的其他部分进行更改,而且如何进行更改是完全清晰的。
所以 Cursor 的一个核心部分是这种非常适合的自动补全体验,即预测你接下来要在一系列文件中、文件内多个位置进行的一系列编辑。让模型擅长这个用例,一方面,有速度的要求,那些模型需要非常快,它们需要在 300 毫秒内给你一个补全。还有一个成本因素,我们运行着大量大量的模型,每次击键,我们都需要改变我们对你接下来要做什么的预测。然后,这也是一个非常专业的用例,你需要模型非常擅长,不是补全下一个 token,仅仅是一个通用的技术序列,而是非常擅长自动补全一系列的差异(diffs),观察代码库中发生了什么变化,然后创建接下来将要发生变化的一系列事物,包括删除和添加以及所有这些,我们发现在专门为该任务训练模型方面取得了巨大成功。
所以这是一个不涉及基础模型的地方,有点像我们自己的东西。我们在应用程序中没有很多关于这个的标签或品牌宣传,但它是 Cursor 的一个非常核心的部分。然后另一组我们使用自己模型的地方是帮助像 Sonnet、Gemini 或 GPT 这样的模型,这些辅助模型位于那些大模型的输入端和输出端。在输入端,那些模型在整个代码库中搜索,试图找出代码库中应该展示给这些大模型的部分。你可以把它想象成一个专门为查找代码库相关部分以展示给这些大模型而构建的迷你 Google 搜索。然后在输出端,我们获取这些模型建议的对代码库进行的更改草图(sketches of the changes)。然后我们有模型来填充细节,高层次的思考由最聪明的模型完成,它们花费一些 token 来做这件事,然后这些更小的、专业的、速度极快的模型,结合一些推理技巧,将那些高层次的更改实际转化为完整的代码差异(code diffs)。所以这对于在需要专业任务的地方提升质量非常有帮助,对于提升速度也非常有帮助,速度对我们来说是产品质量如此重要的一个维度。
Lenny: 这太有趣了。我刚在播客上采访了 Kevin Weil,OpenAI 的 CPO,他称之为“模型的集合”(ensemble of models),这和他们工作的方式一样——利用每个模型的最佳特性,并且如你所说,使用更便宜模型带来的成本优势。这些其他模型是基于 Llama 之类的开源模型,你们接入并在此基础上构建的吗?
Michael: 是的。同样,我们试图非常务实地选择我们要做这项工作的地方,我们不想重新发明轮子。所以从现有的最好的预训练模型开始,通常是开源模型,有时也与那些不向世界公开其权重的大型模型提供商合作,因为我们最不关心的是能够逐行阅读那些最终给出特定输出的权重矩阵。我们只关心训练这些东西的能力,进行后训练(post-train)。所以总的来说,是的,开源模型,有时也与闭源提供商合作来调整东西。
市场动态与护城河
Lenny: 这引出了很多 AI 创始人和投资者一直在思考的讨论,
AI 领域的护城河与防御性
Lenny: 也就是 AI 领域的护城河(moats)和防御性(defensibility)。所以感觉其中一个是自定义模型,是这个领域的护城河。你如何看待这个领域的长期防御性,知道还有其他参与者,正如你所说,不断地推出新产品试图抢占你的市场?
Michael: 我认为有一些方法可以建立惯性(inertia)和传统的护城河,但我认为总的来说,我们处在一个领域,我们有责任继续努力构建最好的东西,这个行业中的每个人都是如此。我真的认为天花板是如此之高,以至于无论你建立什么样的壁垒(entrenchment),你都可能被跨越式发展(leapfrogged)超越。我认为这类似于一些可能与过去的普通软件市场、普通企业市场有点不同的市场。我想到的一个是 1999 年底或 90 年代末 2000 年初的搜索引擎市场。我想到的另一个在很多方面与这个市场相似的市场,实际上就是 70 年代、80 年代、90 年代外围计算机(peripheral computer)和小型计算机(mini computers)的发展。
我认为,是的,在那些市场中,天花板都非常高,转换是可能的。你可以通过聪明人时间的增量投入、研发资金的增量投入,在很长一段时间内持续获得价值,你不会耗尽有用的东西去构建。然后在搜索领域尤其如此,计算机领域则不然,增加分发(distribution)也有助于使产品变得更好,因为你可以根据从用户那里获得的数据和反馈来调整算法,调整学习。我认为所有这些动态在我们的市场中也存在。所以我认为,也许对像我们这样的人来说是悲哀的事实,但对世界来说却是惊人的事实是,我认为存在许多跨越式发展的机会,有更多有用的东西需要构建。我们离 5 年、10 年后可以达到的水平还有很长的路要走,我们有责任继续保持这种势头。
Lenny: 所以我听到的是,这听起来更像是一种消费品类的护城河,那就是,持续成为最好的东西,这样人们就会留下来,而不是制造锁定(lock-in)之类的东西,让他们只能……就像 Salesforce 那样,与整个公司签订合同,你必须使用这个产品。
Michael: 是的。我认为需要注意的重要一点是,如果你处在一个很快就会耗尽有用的事情可做的领域,那不是一个好的处境。但如果你处在一个地方,巨大的投资,以及让越来越多优秀的人沿着正确的道路工作可以持续为你带来价值,那么你就可以获得研发的规模经济(economies of scale of R&D),你可以深入地沿着正确的方向研究技术,并达到一个那是可防御的(defensible)状态。但是,是的,它……我认为它有一种类似消费品的倾向,我真的认为这只关乎于构建最好的东西。
Lenny: 你认为未来这个领域会只有一个赢家,还是会是一个存在多个此类产品的世界?
Michael: 我认为这个市场真的非常非常大。你之前问到 IDE 的事情,我认为一些思考这个领域的人的一个误区是,他们看了过去 10 年的 IDE 市场,然后说,“谁在靠编辑器赚钱?”这是一个超级碎片化的领域,每个人都有自己的东西,有自己的配置,有一家公司确实通过制造优秀的编辑器赚钱,但那家公司规模也就那样。然后结论就是,未来也会是那样。
我认为人们忽略的是,在 2010 年代为程序员构建编辑器,你能做的事情是有限的,那家靠编辑器赚钱的公司做的事情是像让代码库导航更容易、做一些错误检查和类型检查、拥有好的调试工具。
这些都非常有用,但我认为你可以为程序员构建的东西集合,我认为你可以为许多不同领域的知识工作者构建的东西集合,可以走得非常远、非常深。我们所有人面临的问题是自动化大量知识工作中的繁琐事务(busy work),并真正改变我们面前的所有知识工作领域,使其更高级、更高效。
所以,说了这么长一段话是为了说,我认为我们所处的市场真的非常非常大。我认为它比过去为开发者构建工具的人们所意识到的要大得多。我认为会有很多不同的解决方案。我认为会有一家公司,是否会是我们还有待确定,但我确实认为会有一家公司构建通用的工具,用来构建世界上几乎所有的软件,那将是一个非常非常具有世代意义的大生意。但我认为会有一些你可以占据的利基市场(niches),为市场的特定细分领域,或者为软件开发生命周期的非常特定的部分做一些事情。但是,当通用编程从仅仅编写正式编程语言转变为某种更高级别的东西时。这就是你购买和使用的应用程序来做那件事。我认为在那里通常会有一个赢家,而且会是一个非常大的生意。
Lenny: 很有趣。沿着这个思路,有趣的是微软实际上最初是这个领域的中心,拥有令人惊叹的产品、惊人的分发渠道,你说 Copilot 是让你突破“哇,这里可能有非常大的机会”的关键。但感觉他们并没有在赢,感觉他们正在落后。你认为那里发生了什么?
Michael: 我认为 Copilot 可能没有达到……迄今为止没有达到一些人对其期望的原因,有一些具体的历史原因,然后我认为还有结构性原因。我认为结构性原因是……需要明确的是,微软,在 Copilot 的案例中,显然是我们工作的巨大灵感来源,总的来说,我认为他们做了很多很棒的事情,我们也是许多微软产品的用户,但我认为这是一个对现有巨头(incumbents)不太友好的市场,因为一个对现有巨头友好的市场可能是那种只有这么多事情可做,很快就会商品化(commoditized),你可以将其与其他产品捆绑销售,并且不同产品之间的投资回报率(ROI)差异很小。在这种情况下,也许购买创新的解决方案没有意义,购买与其它东西捆绑在一起的东西才有意义。
另一个可能对现有巨头特别有帮助的市场是那种……从一开始,你的东西就在一个地方,切换真的真的极其困难,无论好坏。我认为在我们的案例中,你可以试用不同的工具,你可以决定你认为哪个产品更好。所以这对现有巨头不太友好,而对任何你认为将拥有最具创新性产品的人更友好。然后具体的历史原因,据我了解是,开发第一个版本 Copilot 的那群人,总的来说,已经去其他地方做其他事情了。在所有可能参与制作此类产品的不同部门和各方之间进行协调可能有点困难。
用户建议与使用技巧
Lenny: 我想回到 Cursor。我喜欢问每个构建这类工具的人一个问题,如果你能坐在每个第一次使用 Cursor 的新用户旁边,在他们耳边低语几条建议,让他们能更成功、最成功地使用 Cursor,那会是哪一两条建议?
Michael: 我认为现在,而且我们希望在产品层面解决这个问题,要想成功使用 Cursor,很大程度上在于对模型能做什么有一种“品味”(taste),既包括它们能处理的任务复杂度,也包括你需要向模型说明多少事情,但就是对模型的质量、它的差距存在于何处、它能做什么和不能做什么有一种品味。现在,我们在产品中没有很好地教育人们这一点,也许没有给人们一些指导范围(swim lanes),没有给人们一些指导方针。
但要培养这种品味,我会给出两个建议。所以一个是,如前所述,我会更少倾向于,试图一次性告诉模型,“嘿,这正是我希望你做的。”然后看到输出,要么感到失望,要么接受整个大任务的全部内容。相反,我会做的是把事情分解成小块,你基本上可以花费同样多的时间来总体说明事情,但分解得更细。所以你说明一点,得到一点工作成果,你说明一点,得到一点工作成果,而不是做那么多“让我们写一个巨大的东西告诉模型究竟该做什么。”我认为那现在有点像是走向灾难的配方。
所以倾向于分解事情。同时,也许在副业项目上而不是在你的专业工作上这样做更有意义,我会鼓励人们,特别是那些习惯于现有软件构建工作流程的开发者,我会鼓励人们明确地尝试去“碰壁”(fall on their face),通过在一个安全的环境中,比如一个副业项目,保持雄心壮志,来发现这些模型的极限,并尝试四处探索,充分利用 AI。因为很多时候,我们遇到的人还没有给 AI 一个公平的机会,并且低估了它的能力。
所以总的来说,倾向于分解事情,让事情变小,但是为了发现你能在那里做什么的极限,明确地在一个安全的环境中放手一搏(go for broke),并培养一种品味……你可能会在模型没有崩溃的一些地方感到惊讶。
Lenny: 我基本上听到的是,培养一种对模型能做什么、能将一个想法推进多远的直觉,而不是仅仅引导它。我打赌每次有新模型发布时,你都需要重建这种直觉,当它在……我不知道,4.0 版本出来时,你必须再做一次。这大体上对吗?
Michael: 是的。在过去的几年里,它并没有像我认为人们第一次体验到其中一些大模型时那么巨大。这也是我们希望能够为用户更好地解决的一个问题,并减轻他们的负担。但是这些东西中的每一个都有稍微不同的怪癖和不同的个性。
Lenny: 沿着这个思路,人们一直在争论像 Cursor 这样的工具,它们对初级工程师更有帮助,还是对高级工程师更有帮助?它们是让高级工程师效率提高 10 倍?还是让初级工程师更像高级工程师?你认为今天谁从 Cursor 中受益最多?
Michael: 我认为在各个层面都是如此。这两个群体都以很大的方式受益。在相对排名上有点难说。我会说,他们会陷入不同的反模式(anti-patterns)。我们看到的初级工程师有点过于全盘接受,在所有事情上都依赖 AI,而我们还没有达到可以在专业工具上端到端地做到这一点,即在一个长期存在的代码库中与数十、数百人一起工作。然后高级工程师……对很多人来说,并非所有人都如此,实际上我们经常……这些工具被采用的方式之一是,公司内部有开发者体验团队,那些团队通常由经验极其丰富的人员组成,因为他们通常是构建工具以提高组织内其他工程师生产力的人。我们看到了一些非常非常突破边界的……我们看到了一些人站在真正试图尽可能多地采用这项技术的前沿。但总的来说,我会说平均而言,作为一个群体,高级工程师低估了 AI 能为他们做什么,并坚持他们现有的工作流程。所以相对排名有点难,我认为他们陷入了不同的反模式,但他们两者,总的来说,都通过这些工具获得了巨大的好处。
Lenny: 这完全说得通。我喜欢这是光谱的两端,期望太高,期望不够。就像“三只熊”的寓言。
Michael: 是的。是的。好的。是的。也许是那种资深但不是主管级别(staff),正好在中间的。
Lenny: 有趣。好的。只剩几个问题了。
团队建设与招聘
Lenny: 在担任这个角色之前,有什么是你希望自己早就知道的?如果你能回到 Cursor 刚开始时的 Michael 那里,那也不是很久以前,你能给他一些建议,你会告诉他什么?
Michael: 这件棘手的事情在于,感觉很多来之不易的知识是隐性的(tacit),有点难以用语言传达。而生活的可悲事实似乎是,对于人类努力的某些领域,你确实需要摔跟头才能……要么你需要摔跟头才能学到正确的东西,要么你需要在某个在该领域表现卓越的人身边。我们感受到的一个领域就是招聘。我认为我们实际上是……所以我们试图在招聘方面非常有耐心。
对我们来说,无论是出于个人原因,还是我认为实际上对公司的战略而言,拥有一支世界级的工程师和研究人员团队与我们一起开发 Cursor 都将是极其重要的。此外,还需要找到那些具备某种知性好奇心(intellectual curiosity)和实验精神(experimentation)的人,因为我们需要构建如此多的新东西。然后还需要智力上的诚实(intellectual honesty),也许还有微观上的悲观(micro-pessimism)、直率(bluntness),因为在所有的噪音中……尤其是在公司成长、业务增长的过程中,保持头脑清醒我认为也极其重要。
但是,找到合适的人加入公司,也许比其他任何事情都更重要,除了构建产品之外,我们真的真的非常纠结。因此,我们实际上等了很长时间才扩大团队。我认为很多人你听说招聘太快,我认为我们一开始实际上招聘太慢了。我认为这是可以补救的,我认为我们可以做得更好。我们最终采用并对我们非常有效的招聘方法,其实并不新颖,就是去寻找我们认为是真正世界级的人才,并在某些情况下,花费数年时间去招募他们,最终对我们奏效了,但我不认为我们一开始就很擅长。所以我认为在谁是合适的画像(profile)、谁真正适合那个团队、卓越(greatness)是什么样子,以及如何与某人谈论机会,并在他们真的没有在寻找任何东西时让他们兴奋起来这些方面,都有很多来之不易的经验教训。我们花了一些时间才学会如何做好。
Lenny: 对于那些正在招聘的人来说,其中一些经验教训是什么?你错过了什么或者学到了什么?
Michael: 我认为一开始,也许我们实际上有点过于偏向于寻找那些符合刻板印象(archetype)的人,比如名校毕业、非常年轻、在那些名校环境中做过高资历(high credential)的事情。而实际上,我认为……我们很幸运在早期就找到了愿意和我们一起做这件事的优秀人才,他们处于职业生涯的后期。我认为我们一开始可能在有点错误的画像(profile)上花费了大量时间,部分原因是资历(seniority)问题。部分原因也是兴趣和经验的问题,我们雇佣过非常非常非常优秀且非常年轻的人,但他们在某些方面可能看起来与完全符合预期(straight out of central casting)的人略有不同。
另一个教训是,我们确实极大地改进了我们的面试流程,所以现在,我们有一套手动编写的面试问题,然后我们面试的核心……我们面试的核心实际上是,我们让人们来现场待两天,和我们一起做一个项目,一个工作测试项目(work test project)。这效果非常好,我们越来越多地发现这一点。我认为如何了解人们的兴趣所在,并展示我们最好的一面,在他们真的没有在寻找任何东西时让他们了解这个机会,并进行那些对话。在这方面肯定有……随着时间的推移变得更好了。
Lenny: 你有没有一个最喜欢的面试问题?
Michael: 我认为这个为期两天的工作测试,我们原以为它无法扩展到几个人以上,却具有惊人的持久力。它的优点在于,它让某人能够端到端地完成一个像真实项目一样的东西。这不是我们实际使用的作品,它是一个预设的项目列表。但它能让你有两天时间看到一个真实的工作成果,而且它不必非常耗费团队其他人的时间。你可以把你原本会在半天或一天的现场面试中花费的时间,分散到那两天中,给某人足够的时间来做他们的项目,所以这实际上有助于它的扩展性。
它有助于强制执行“你想不想和这个人共事”类型的测试,因为你和这个人相处了两天,和他们一起吃了几顿饭。我们没想到这个方法会保留下来,但它对我们的评估过程非常非常重要,然后对于让人们兴奋起来也很重要,特别是在公司非常早期的阶段。因为在那之前,人们还没有使用产品,也不知道它。当产品相对不那么好时,你唯一拥有的就是一支某些人觉得特别并想与之共处的团队。而这两天会给我们一个机会,让这个人认识我们,并在某些情况下,希望说服他们愿意加入我们。这个是出乎意料的。不完全是一个面试问题,但有点像一个前置的面试。
Lenny: 终极面试问题。所以非常清楚地说明你在描述什么,你给他们一个任务,比如,“在我们实际的代码库中构建这个功能,与团队一起编码并发布它。”大致是这样吗?
Michael: 是的。所以我们不使用知识产权(IP),不是端到端发布,但它就像一个模拟的……通常在我们的代码库中,“这是一个真实的迷你两天项目。你将端到端地完成它。”很大程度上是让他们独立完成,也有协作。然后我们是一个相当注重在场(imprisoned)的公司,在几乎所有情况下,这实际上就是和我们一起坐在办公室里。
Lenny: 你一直说这已经扩展到今天,所以你们现在规模有多大?
Michael: 所以我们即将达到 60 人。
Lenny: 对于这个规模和影响力来说,算是小的。我以为会比这大得多。
Michael: 是的。而且我设想最大的比例是工程师?
Michael: 是的。需要明确的是,我们未来工作的一个重要部分是建立一个更大、更优秀的团队,能够继续改进产品,以及我们为客户提供的服务。所以不打算长期保持这么小的规模,希望不会如此。但是这个数字小的部分原因是,公司内部工程、研究和设计的比例非常高,所以很多软件公司当他们大约有 40 名工程师时,总人数会超过 100 人,因为有很多运营工作,而且通常他们从一开始就非常非常以销售为主导,那是非常劳动密集型的。而在这里,我们是从一个非常精简、产品驱动的地方开始的,我们现在服务于很多我们的市场客户,并且已经建立了那部分,但还有更多工作要做。
保持专注与未来展望
Lenny: 我想问你一个问题,AI 领域发生了这么多事情,每天都有新东西发布……
在 AI 快速发展中保持专注
Lenny: 有些时事通讯,很多时事通讯,它们的全部功能就是告诉你每天 AI 领域发生了什么。运营一家处于这个领域中心、炙手可热的公司,你如何保持专注,以及你如何帮助你的团队保持专注、埋头苦干,只管构建而不被所有这些闪亮的东西分心?
Michael: 我认为招聘是其中很大一部分,如果你找到了心态正确的人。所有这些都应该加星号说明,我认为我们在那里做得不错,我认为我们可能也可以在那里做得更好,这是我们作为一家公司可能应该更多讨论的事情。但我认为招聘具有正确倾向的人,那些不太关注外部认可,更关注构建真正伟大的东西,更关注做真正高质量工作的人,以及那些通常头脑冷静的人,也许高潮不是很高,低谷也不是很低。我认为招聘可以帮助你克服很多困难,我认为这实际上是整个公司的一个经验教训,那就是对于任何……你需要流程,你需要层级结构,你需要很多东西,但是对于你引入公司的任何一种组织工具,你希望从该工具获得的结果也……你可以通过招聘具有你希望从该组织事物中得到的正确行为的人来走得很远。
具体的例子是,我们能够暂时不需要太多的工程流程,我认为我们需要多一点流程,但对于我们的规模来说,流程不多,这是通过招聘我认为真正优秀的人来实现的。一是招聘头脑冷静的人。我认为二是经常谈论它。我认为三是希望以身作则。对我们个人而言,我们从 2021 年、2022 年开始就在专业地做这件事,并一直致力于 AI,我们刚刚经历了各种技术和想法的来来去去的大变迁……如果你把自己传送到 2021 年底、2022 年初,那是 GPT-3 的时代,Instruct GPT 还不存在,没有 DALL-E,没有 Stable Diffusion。然后我们经历了所有这些图像技术的出现、ChatGPT 及其崛起、GPT-4、所有这些新模型、所有这些不同的模态、所有的视频东西,而其中只有非常少的一部分真正影响到业务。
所以我认为我们有点像建立了一点免疫系统,并且知道当一个事件发生时,它是否真的会对我们产生影响。这种动态,即存在大量大量的讨论,但也许只有少数事情真正重要,我认为在过去十年的人工智能发展中得到了体现,学术界有如此多的关于深度学习的论文,如此多的关于 AI 的论文,然后令人惊奇的是,实际上有很多……AI 的很多进展可以归因于一些非常简单、优雅且一直存在的想法,而绝大多数被提出的想法并没有持久力,也没有产生太大影响。所以这种动态在深度学习作为一个整体领域的发展中有点类似。
Lenny: 最后一个问题。你认为人们对于 AI 的发展方向、构建方式以及世界将如何改变,仍然最不理解或者没有完全掌握的是什么?
最终思考与对有抱负的 AI 创新者的建议
Michael: 人们仍然有点过于关注光谱的两端,要么是认为一切都会发生得非常快,要么是认为这全是夸夸其谈、炒作和江湖骗术,而我认为我们正处在一个将产生极其深远影响的技术转变之中。我认为它的影响将超过互联网,我认为它将超过自计算机问世以来我们所见过的任何技术转变。我认为这需要一段时间,我认为这将是一个持续数十年的事情,我认为许多不同的群体将在推动其发展方面发挥重要作用。
要达到一个计算机能为我们做得越来越多、越来越多的世界,需要攻克所有这些独立的问题,并在这些问题上取得进展,其中一些是在科学层面,让这些模型理解不同类型的数据,变得更快、更便宜、更智能,符合我们关心的模态,在现实世界中采取行动。还有一部分是关于我们将如何与它们合作,以及人类在计算机上实际应该看到和控制的体验是什么,以及如何与这些东西一起工作。
但我认为这需要几十年。我认为将会有很多令人惊叹的工作要做。我也认为,我认为将在这里特别重要的一个群体模式,不是自卖自夸,但我认为是致力于自动化和增强特定知识工作领域的公司,它既构建其底层技术,整合来自提供商的最佳部分,有时内部开发,然后也构建该领域的产品体验。我认为做这件事的人,以及……我们正在尝试在软件领域做这件事,在其他领域做这件事的人,我认为那些人将是真正、真正、真正具有深远影响的。不仅仅是对用户看到的最终价值而言,而且我认为当他们达到规模时,他们对于推动技术进步也将非常重要,因为我认为他们将能够构建……他们中最成功的将能够构建非常非常大的业务。所以,很兴奋看到其他类似公司在其他领域的崛起。
Lenny: 我知道你们在招聘。对于那些感兴趣的人,“嘿,我想去这里工作,构建这类东西。”你们现在在寻找什么样的职位?有没有特别想尽快填补的角色?如果人们好奇,他们应该知道什么?
Michael: 这个团队需要做的事情太多了,以至于我们还没有能力去做。首先,是全方位的通用需求,所以如果你觉得我们没有某个职位的空缺,也许你应该联系我们,实际情况可能并非如此。也许我们实际上可以向你学习,并决定我们需要一些我们尚未意识到的东西。但总的来说,我认为我们今年要做的两件最重要的事情是拥有该领域最好的产品,然后发展它。我们有点处于抢占地盘(land grab)的模式,世界上几乎每个人要么没有使用像我们这样的工具,要么他们使用的工具可能发展得较慢。所以发展 Cursor 也是一个大目标,我想说,尤其是一直在寻找那些……优秀的工程师、设计师、研究人员,然后还有整个业务方面的同事。
Lenny: 既然你谈到工程师,我忍不住要问这个问题,就是关于“AI 将编写我们所有的代码”的问题。但每个人仍在疯狂招聘工程师。所有的基础模型公司,都有那么多空缺职位。
Michael: 是的。我们并没有到处宣扬人们可以学习编码。
Lenny: 你认为工程职位会有一个开始放缓的转折点吗?我知道这是个大问题,但只是……你认为工程师在所有这些公司中会越来越被需要,还是你认为在某个时候,会有所有这些 Cursor 代理为我们运行构建?
Michael: 再次强调,我们的观点是,存在一个漫长而混乱的中间阶段,不会直接跳到你退后一步,要求所有事情都为你完成,然后拥有你的工程部门。我们非常希望从今天的编程方式演变而来,我们希望人类掌控方向盘,我们认为即使在最终状态下,给予人们对一切的控制权也是非常重要的,你需要专业人士来做这件事,并决定软件应该是什么样子。
所以我认为,是的,工程师绝对是需要的。我认为工程师将能够做得更多。我认为对软件的需求是非常持久的,这不是最新颖的观点,但我认为想想构建那些非常简单、易于说明的东西是多么昂贵和劳动密集,或者在外人看来是这样,而现在做那些事情是多么困难,这有点疯狂。所有现在存在的东西,都是由我们现在的成本和需求所证明是合理的,如果你能将成本降低(听不清),我认为你将拥有大量大量大量我们可以在计算机上做的更多事情,更多的工具。我曾感受过这一点,我早期的一份工作实际上是在一家生物技术公司工作,为他们构建内部工具,现成的工具非常糟糕,根本不适合他们的用例。然后我构建的内部工具,那里肯定有大量的需求,可以构建的东西,远远超过我在那里工作期间能够构建的东西。
在计算机上工作的物理原理是如此之好,你基本上应该能够移动所有东西,做你想做的一切。现在仍然有太多的摩擦,我认为对软件的需求比我们今天用制造简单生产力软件如同拍一部大片一样的成本所能构建的要多得多。所以我认为在很远的未来,是的,实际上对工程师的需求会更多。
Lenny: 有没有什么是我们没有涵盖到而你想提及的?有没有最后一点智慧想留给听众?你也可以说没有,因为我们已经谈了很多了。
Michael: 我们经常思考如何建立一个团队,既能创造新东西,又能继续改进你现有的东西。我认为如果我们想要成功,IDE 将不得不发生巨大变化,(听不清)看起来将不得不在未来发生巨大变化。如果你环顾四周,我们尊敬的公司,肯定有一些公司持续真正驾驭了多轮跨越式发展的浪潮,并持续真正推动前沿。但它们也有点罕见,这是一件很难做到的事情。所以部分原因就是思考这件事,并试图在我们状态好的时候反思它,从第一性原理的角度出发,部分原因也是试图去研究过去在这方面卓越的例子,这也是我们经常思考的事情。
Lenny: 是的。是的。在我们开始录制之前,你身后有很多书,我说,“那边那本是什么?”那是一本关于某个很有影响力但在很多方面我从未听说过的老计算机公司历史的书。我认为这很能说明你,很多这种创新来自于研究过去,研究历史,哪些有效,哪些无效。好的。
Lenny: 如果人们想联系你,也许申请职位,他们可以在哪里找到你?你说可能有些职位他们甚至不知道,他们去哪里找,然后听众如何能帮助到你?
Michael: 是的。如果人们对从事这些工作感兴趣,我很乐意交流,他们可以找到……如果他们访问 cursor.com,他们既可以找到产品,也可以找到联系我们的方式。
Lenny: 简单。Michael,非常感谢你来到这里。这次访谈太棒了。
Michael: 非常愉快。谢谢你。
Lenny: 再见,各位。非常感谢您的收听。如果您觉得这次访谈有价值,您可以在 Apple Podcasts、Spotify 或您喜欢的播客应用程序上订阅本节目。另外,请考虑给我们评分或留下评论,因为这真的有助于其他听众找到这个播客。您可以在 lennyspodcast.com 上找到所有往期节目或了解更多关于本节目的信息。下期节目再见。
要点回顾
引言与Cursor概览
- Cursor的目标是发明一种新的编程类型,一种截然不同的构建软件的方式,一个“代码之后”的世界。
- 工程师将越来越像逻辑设计师,重点在于明确表达你希望事物如何运作的意图。
- Michael Truell是Anysphere的联合创始人兼CEO,该公司开发了Cursor。
- Cursor是增长最快的AI代码编辑器,在推出仅两年后年经常性收入(ARR)达到
$300 million。 - Michael Truell在AI领域有10年经验,在MIT学习计算机科学和数学,在MIT和Google做过AI研究。
- Cursor增长迅速,在启动后20个月内ARR达到
$100 million,两年内达到$300 million。 - Michael提到增长是相当持续的指数级增长,指数增长初期数字很低时感觉相当慢。
Cursor的愿景:代码之后的世界
- Cursor的目标是发明一种新的编程类型,一种非常不同的构建软件的方式。
- 这种方式被提炼为:以最简洁的方式向计算机描述你的意图。
- 重点在于定义软件应该如何工作以及它应该看起来如何。
- 随着技术成熟,可以创造出一种更高级、更高效,有时也更易用的构建软件的新方法。
- 这将是一个逐渐远离当前软件构建方式的过程。
- 对比两种流行的未来软件构建愿景:
- 一种认为未来构建软件将与现在非常相似(文本编辑,TypeScript, Go, C, Rust等正式编程语言)。
- 另一种认为将通过与机器人对话来构建和修改软件(类似聊天机器人、Slackbot风格)。
- Cursor认为两种愿景都有问题:
- 聊天机器人风格缺乏精确性,人类需要更精确的方式来指示变更。
- 认为一切不变的观点是错误的,因为技术将变得越来越好。
- “代码之后”的世界的设想:
- 软件逻辑的表示形式看起来更像英语或伪代码的演进。
- 可以在高层次上编辑逻辑,内容更简洁、易于理解和导航。
- 复杂难懂的符号将演变为更易于人类阅读和编辑的形式。
- 人类仍然处于主导地位,对软件的各个方面拥有完全控制权。
- 人类能够快速进行更改,拥有快速的迭代循环。
未来技能的重要性:品味与逻辑设计
- “品味”(Taste)将变得越来越有价值。
- 软件领域的品味不仅指视觉效果(UI/UX、动画、颜色),也包括逻辑和工作方式。
- 目前逻辑的最佳表示是代码,未来工程将更像“逻辑设计”。
- 工程师将更专注于指定意图(“什么”),而不是具体的实现方式(“如何”)。
- “细心”(carefulness)这一当前极其重要的技能,可能会变得不那么重要,重心向“品味”转移。
- “Vibe coding”(凭感觉编码)与此相关,但目前这种方式有争议,因为它可能导致不理解底层细节,难以修改。Cursor的目标是让有品味的人在不深入理解代码的情况下也能完全控制软件。
- 对“品味”的解释:拥有关于应该构建什么的正确想法,能够轻松地将想法(工作方式、外观)转化为计算机上的产品,减少转换层的繁琐工作。
Cursor的起源故事与早期发展
- Cursor最初是“一个寻找问题的解决方案”,源于对未来10年AI如何发展的思考。
- 两个决定性时刻:
- 使用Code Pilot第一个测试版感到非常兴奋,这是第一个真正有用的AI产品,也是最有用的开发工具之一。
- OpenAI等机构发布的关于扩展定律(scaling laws)的论文表明,即使没有新想法,仅通过扩大模型和数据规模,AI也会变得更好。
- 2021年底/2022年初,意识到AI产品成为可能,技术将持续成熟。
- 当时感觉很多人在谈论制造模型,但很少有人专注于某个知识工作领域并思考AI将如何改变它。
- 最初的误区:选择了一个认为相对缺乏竞争、枯燥的领域——自动化和增强机械工程(CAD工具)。
- 原因是认为编码领域虽好,但已被关注。
- 遇到的问题:创始人不是机械工程师,不熟悉领域;难以将现有模型应用于机械工程;需要从头开发模型,缺乏3D模型数据。
- 最终转向:意识到对机械工程缺乏热情,且编程领域尽管有时间推移,变化不大,现有参与者可能不够有雄心。感觉软件创造的整个过程都将通过这些模型被颠覆。
- 教训:即使在看似拥挤的领域,如果现有参与者不够有雄心或方法有缺陷,仍然存在巨大机会,尤其是在AI这样天花板很高的领域。
技术与产品决策
- 选择构建IDE的原因:
- 相信编程将流经这些模型,编程行为将在未来几年发生巨大变化。
- 现有编码环境的扩展性非常有限,如果UI和编程形式要大改,必须控制整个应用程序。
- 对比其他路径:纯模型公司或端到端自动化(Cursor关心人类控制,后者可能由AI做所有决策)。
- 对当前AI技术能力的现实主义态度(通过密切的内部测试/dogfooding),认为人类需要处于主导地位。
- IDE被视为构建软件的地方,它本身也会随时间演变。
- 关于“人人成为工程经理”的担忧:
- 目前最成功的AI使用方式仍然相对保守。
- 成功的用户倾向于依赖如“下一次编辑预测”(next edit prediction)这类功能,或将任务分解交给AI。
- 两种模式:一次性详细说明让AI完成 -> 审查;分解任务:说明一点 -> AI写一点 -> 审查。后者(如自动补全)目前更成功。
- 决定何时发布产品:
- 最初担心闭门造车太久。
- 第一个版本是手动编写的(非基于VS Code),从零开始构建编辑器(包括语言支持、导航、错误跟踪、命令行、远程服务器连接等)。
- 大约5周后,团队全职使用自研编辑器并弃用旧编辑器。
- 当觉得有点用时,进行了短暂的beta测试。
- 从第一行代码开始大约3个月后向世界发布。
- 初衷是快速发布并公开构建。
- 出乎意料的是发布后立即引起大量兴趣和反馈。
- 基于早期用户反馈,切换到基于VS Code。
- Cursor成功的秘诀:
- 持续的“偏执”,认为产品可以做得更好。
- 专注于最终目标:发明一种全新的编程形式。
- 工具的持续演进和改进。
- 内部测试(Dogfooding)。
- 专注于产品本身,而非早期过分投入销售和营销。
- 战略性地选择构建内容和有效排定优先级。
- 关于构建AI产品的反直觉教训:
- 最初并未期望进行任何自有模型开发。
- 如今,Cursor中“每一个神奇时刻都以某种方式涉及自定义模型”。
- 模型开发已成为内部的重要焦点和招聘重点。
- 模型开发是产品质量提升的重要途径。
- 采取了逐步推进的方式,从一个非常适合自研模型的用例开始,逐步扩展。
- 成功的关键是仔细选择应用场景,不重复造轮子,专注于大型基础模型的弱点或补充它们。
- Cursor的技术栈内部:
- 大量使用大型基础模型(如GPT、Sonnet、Gemini)。
- 自有模型用于:
- 服务基础模型无法满足的场景(成本或速度原因),例如自动补全(需要在300毫秒内预测跨文件的代码变更diffs)。
- 辅助大型基础模型:
- 输入端:使用模型在代码库中搜索,为大模型找到相关上下文(类似迷你Google搜索)。
- 输出端:采用大模型的高层思路(sketches of changes),然后用更小、专业、快速的模型结合推理技巧填充细节,生成完整的代码diffs。
- 自有模型通常基于开源模型(如Llama)进行后训练(post-train),有时也与闭源提供商合作进行微调。
市场动态与护城河
- AI领域的护城河与防御性:
- 自定义模型是其中一个方面。
- 主要观点:在这个领域,持续构建最好的产品是关键,因为技术天花板很高,很容易被跨越式发展超越。
- 市场类似:90年代末/21世纪初的搜索引擎市场,70-90年代的计算机发展。特点是天花板高,可以通过研发投入持续获得价值,分发(用户数据反馈)有助于改进产品。
- 更像是消费品市场的逻辑:持续提供最佳产品,而非依赖锁定。
- 如果能通过规模化研发持续产生价值,就能形成研发的规模经济,这本身是可防御的。
- 市场规模与格局:
- 市场非常巨大,远超过去十年的传统IDE市场。
- 原因是AI不仅仅是改进编辑器,而是改变了编程这一知识工作的本质。
- AI有望自动化大量知识工作中的繁琐事务,使工作更高级、更高效。
- 预测:可能会有一个主要的通用工具胜出者,构建世界上几乎所有的软件,这将是一个世代级的大生意。
- 但也存在利基市场,服务特定细分市场或软件开发生命周期的特定部分。
- 关于微软Copilot的看法:
- 结构性原因:市场对现有巨头不太友好,因为创新回报差异大且切换工具相对容易,捆绑策略效果有限。
- 具体历史原因:初代Copilot团队成员大多已离开;协调微软内部不同部门可能存在困难。
用户建议与使用技巧
- 成功的关键是培养对模型能力的“品味”:理解它们能处理的任务复杂度、需要多少说明、以及它们的局限性。(Cursor希望在产品层面改进引导)
- 建议1: 将任务分解成小块,进行迭代式的“说明-获取工作-说明-获取工作”,而不是一次性写一个巨大的指令让模型完成整个大任务。
- 建议2: 在安全的环境(如个人项目)中有意识地进行雄心勃勃的尝试,探索模型的极限,可能会惊讶于模型在某些方面的能力,避免低估AI。
- 每次模型更新(如GPT-4发布)后,可能需要重新校准这种“直觉”。
- 对不同经验水平工程师的影响:
- 对初级和高级工程师都有很大帮助。
- 初级工程师可能过度依赖AI。
- 高级工程师可能低估AI的能力,固守现有工作流程。
团队建设与招聘
- 很多实战知识是隐性的,难以言传。
- 招聘至关重要,早期招聘速度过慢。重点是寻找世界级、有好奇心、智力诚实、心态平和的人才。
- 招聘教训:
- 最初过于偏向名校背景的年轻人,后来发现经验丰富的后期职业人士中也有优秀人才。关键在于个体特质而非刻板印象。
- 发展了一套定制的面试流程,核心是为期两天的现场工作测试项目(work test project),让候选人在真实代码库(模拟项目)中与团队一起工作。这被证明非常有效且能扩展。
- 团队规模: 录制时约60人,工程师和研究人员比例非常高。计划继续增长。早期是精简、产品驱动的模式。
保持专注与未来展望
- 在AI快速发展中保持专注的方法:
- 招聘具有正确心态的人(内在驱动、心态平和)。
- 经常讨论此问题,以身作则。
- 经历多次AI技术浪潮后建立“免疫系统”,辨别真正重要的变化。
- 认识到大量噪音中只有少数事物真正重要(类比深度学习领域少数核心思想的持久力)。
- 对AI未来的误解:
- 避免极端看法(一夜成功 vs 全是炒作)。
- 这是一个将持续数十年的、极其重要的技术转变,比互联网更具影响力。
- 需要解决许多独立问题(科学层面:模型能力、成本、速度、多模态;应用层面:人机交互体验)。
- 特定领域自动化公司的重要性:
- 像Cursor这样专注于特定知识工作领域(如软件开发)的公司将非常重要。
- 它们不仅构建技术(集成最佳外部技术,有时自研),还构建产品体验。
- 这些公司不仅为用户创造价值,规模化后也将推动技术进步。
- 对工程师需求的看法:
- 工程师的需求很可能会增加。
- 当前软件开发成本高昂,限制了许多潜在应用的开发。
- AI降低开发成本后,将释放对软件的巨大潜在需求(更多工具、自动化)。
- 即使在未来,也需要专业人士来控制和设计软件。
- 团队创新能力:
- 如何建立一个既能改进现有产品又能创造新事物的团队,是一个持续思考的问题。
- 研究历史上那些成功驾驭多次技术浪潮并持续创新的公司案例。
- 招聘需求:
- 全方位需要人才,尤其是在产品(工程、设计、研究)和增长方面。
- 欢迎对该领域感兴趣的人联系(cursor.com)。