谷歌AI的历史与未来:桑达尔·皮查伊对谈
访谈概述
本期对谈(设定于2026年4月)由Stripe联合创始人约翰·科里森(John Collison)和知名科技投资人埃拉德·吉尔(Elad Gil)共同主持,嘉宾为谷歌兼Alphabet CEO桑达尔·皮查伊(Sundar Pichai)。
在访谈中,桑达尔回顾了谷歌在AI领域的早期探索(包括Transformer架构和TPU的诞生),并探讨了谷歌如何在2025年扭转外界的悲观情绪,重新在AI竞赛中占据主动。他深入解析了谷歌高达1800亿美元的资本支出(CapEx)计划,并指出2026年是AI算力的“供应链紧缺年”,核心瓶颈在于存储芯片和电力供应。此外,他还分享了谷歌内部的资本配置逻辑(如对Waymo的持续投资)、对于量子计算和“太空数据中心”等长期前沿科技的押注,以及谷歌内部正如何通过AI代理(Agent)重塑企业工作流与工程文化。
专用词语翻译列表
| 英文专用词汇 | 中文翻译/释义 | 备注 |
|---|---|---|
| Transformer | Transformer架构 | 谷歌发明的一种深度学习核心模型架构 |
| TPU (Tensor Processing Unit) | 张量处理单元 | 谷歌专门为AI加速定制的芯片 |
| CapEx (Capital Expenditure) | 资本支出 | 企业用于购买或升级实体资产的资金 |
| RLHF | 基于人类反馈的强化学习 | 让AI输出更符合人类偏好的微调技术 |
| AGI-pilled | AGI狂热信徒 / 盲信AGI | 网络俚语,指极其坚信通用人工智能即将到来的人 |
| Zero-day | 零日漏洞 | 软件发布前未被发现的严重安全漏洞 |
| GDM (Google DeepMind) | 谷歌DeepMind | 谷歌旗下的顶级AI研究部门 |
| GCP (Google Cloud Platform) | 谷歌云平台 | 谷歌提供的云计算服务 |
| Agentic / Agent | 代理化 / AI代理 | 能自主执行多步骤复杂任务的AI系统 |
| SOTA (State-of-the-art) | 业界最先进水平 | 指当前技术领域内最顶尖的表现 |
| Dogfooding | 内部测试 / “吃自己的狗粮” | 科技行业术语,指公司员工日常使用自家的产品 |
| ROIC | 投资资本回报率 | 衡量企业利用资本创造利润效率的指标 |
访谈正文
旁白 / 约翰·科里森:桑达尔·皮查伊担任谷歌CEO刚刚满十周年。如今的Alphabet不仅是全球最大的科技公司之一,更是这场AI竞赛的领导者,他们计划在2026年投入高达1800亿美元的资本支出。干杯。
谷歌与AI的历史
埃拉德·吉尔:当人们谈论谷歌和AI时,经常被提起的一段历史是:Transformer架构是在谷歌发明的,但最终将其产品化并推向大众的却主要是谷歌之外的公司(比如ChatGPT及类似产品)。你现在如何反思这段经历?我觉得这其实很值得探讨。
桑达尔·皮查伊:这其中存在一些误解。Transformer的诞生其实是在我们拥有大量TPU的背景下产生的,而且在某种程度上,它是为了解决特定的产品需求。当时团队在思考如何提升翻译的质量。就拿TPU来说吧,当初我们的语音识别技术已经很好了,但突然之间你需要把它提供给20亿用户使用时,我们没有足够的芯片。如何解决如此庞大的推理算力需求?这才是背景。
埃拉德·吉尔:这我以前还真不知道。
桑达尔·皮查伊:Transformer确实出自我们的研究团队,但其研发导向是为了解决实际的产品问题。而且Transformer诞生后立刻就被投入使用了。比如在搜索引擎中应用的BERT和MUM模型——人们大大低估了它们的作用,因为我们对搜索质量的衡量有着极高的标准。在那段时期,谷歌搜索质量之所以能实现质的飞跃、领先所有人,正是因为应用了BERT和MUM。我们发明了Transformer,并立即将其应用于搜索业务,以提升对语言、网页和用户查询的理解能力,并不断迭代出更好的模型。
同时,我们也开始在内部将其产品化。当时有团队在开发一个名为LaMDA的项目。显然,我们并不是第一个将其公开发布的。但我认为,不能简单地说这仅仅是个研究项目,或者说我们没有将其引向产品化。
埃拉德·吉尔:我理解你的意思。你们做了这项研究,然后按照预期在产品中应用并看到了巨大的投资回报(ROI)。虽然你们没有发明基于此衍生的所有产品形式,但这也是正常的。
桑达尔·皮查伊:我还可以进一步说,我们其实在内部早就构想出了类似ChatGPT的产品,也就是LaMDA。如果你还记得,我们内部甚至有一位工程师认为它具有意识(注:指Blake Lemoine事件)。你可以把他当时在内部对话的那个系统,看作是ChatGPT的早期版本。我们甚至在另一个“平行宇宙”里早就准备好了它的产品版本,也许谷歌在九个月后或其他某个时间点就会发布。事实上,在2022年的Google I/O大会上,我们就发布了名为“AI Test Kitchen”的应用,那里面用的就是LaMDA。但我们当时对它进行了限制,因为在内部,我们还没有一个经过全面RLHF(基于人类反馈的强化学习)微调的端到端版本。
我当时看到的早期版本在某种程度上更具毒性(生成不当内容)。在那个时候,我们根本不可能把它推向公众。作为一家有着极高搜索质量标准的跨国公司,我们对什么是可接受的产品质量门槛定得更高。但这并不意味着我们不知道该如何把它产品化。
另外我也想指出,即使是OpenAI发布产品,他们大概也是在提前几个月才与微软达成了合作。现在回过头看,一切似乎顺理成章,但在当时并非如此显而易见。我觉得他们在GitHub代码辅助编写方面也很幸运地看到了产品潜力。也许我们当时错过了一些信号。在代码编写方面,你看到的性能跃升可能比纯语言模型上的表现更加具有连贯性。如果你用它来写代码,从GPT-2到GPT-3再到后来的GPT-4,这种能力的跃升可能更加显著。
总的来说,要回答你最初的问题,这不仅仅是“从研究到产品”转化的问题,而是有很多其他因素。
埃拉德·吉尔:我记得和一些参与开发ChatGPT的人聊过,他们是在感恩节那一周上线的。当时的发布甚至有点低调。他们并没有觉得“这是一个惊天动地的大动作,将成为我们未来的重要部分”。它的爆火显然是一个惊喜。我觉得那是一个很酷的测试案例,非常有趣。但我的体会是,如果你身处消费者互联网行业,你总会遇到这种意外惊喜。
桑达尔·皮查伊:当我们在谷歌推出Google视频搜索时,YouTube突然横空出世了,最终我们收购了YouTube。或者想象一下在Facebook内部,突然看到Instagram爆火。没有人会在车库里一觉醒来就直接造出一台更好的iPhone,那不可能发生。但消费级互联网的玩法就是这样。通常是三个人坐在一起构建原型,然后向市场抛出几百万个想法。我无意贬低任何人的成就,只是想说,在这个行业里,你总会遇到这样的时刻。你必须意识到这一点,并在内心接受它。
速度与搜索
约翰·科里森:当思考2026年的AI竞赛时,让我印象深刻的一点是,谷歌长期以来一直将“速度”作为其寻求差异化的核心。早期的谷歌搜索非常快,而且会在结果页面炫耀般地显示搜索耗时;后来的Gmail相比当时的竞品也是主打快;Chrome浏览器更是如此。而现在,我因为不同需求使用各种AI服务,但我发现运行在TPU上的Gemini速度实在太快了。我很好奇,这在多大程度上是你们明确的产品策略?还是说背后的考量更复杂?
桑达尔·皮查伊:我一直将速度(在这里我们称之为低延迟)视为一款伟大产品的核心标志之一。而且,低延迟几乎总是能反映出这款产品在底层技术架构上做得非常扎实。当然,还有另一种速度也很重要,那就是交付、迭代和发布周期的速度。两者都很重要。
但说到产品延迟,想要追求低延迟说起来容易,可你总在不断添加新功能,产品能力的边界在不断扩展。如何在这两者之间取得平衡?这就变得复杂了。
举个搜索团队的例子,他们现在的各个子团队都有精确到毫秒级别的“延迟预算(Latency Budget)”。假设你发布了一项优化,削减了3毫秒的延迟,你可以获得1.5毫秒的额外延迟预算奖励,而剩下的1.5毫秒则作为速度提升回馈给用户。根据你所负责的功能模块,有的团队可能会拿到30毫秒的预算,有的可能只有10毫秒。你可以使用这笔预算来加新功能,但要面临严格的审查。这就是我们对速度的重视程度。
约翰·科里森:为了给大家提供个参考,人类感知延迟的阈值大概是在几百毫秒的较低区间对吧?
桑达尔·皮查伊:没错。我上次查看仪表盘和各项指标时,我们在过去五年里实际上把搜索延迟又降低了30%。想想看,这五年里产品的功能性发生了多么巨大的进步。这就是为什么在Gemini中,我们深刻地思考如何在能力与速度之间取得平衡。比如Flash模型,它能达到Pro模型大概90%的能力,但速度却快得多,服务效率也更高,而这正是我们软硬件垂直整合带来的优势。
埃拉德·吉尔:你如何看待搜索引擎的未来?因为现在很多人把聊天(Chat)视为一种新的界面。显然,Gemini已经被整合进去,或者说搜索已经将Gemini或AI生成的结果融合到了谷歌的体验中。但很多人也在讨论“代理化工作流(agentic flows)”,认为未来每个人都会有一个私人AI代理。你不用再输入查询词,它会直接去帮你做事。比如不用再搜索旅游攻略,它会直接帮你规划好行程。你认为搜索的未来是什么?它会是一个分发机制吗?是一种未来的新产品形态?还是人类与世界互动的N种方式之一?
桑达尔·皮查伊:我觉得随着每一次技术变迁,搜索能做的事情都会变多。我们必须吸收这些新能力,不断拓展产品边界。如果是移动互联网时代,产品演进得非常快。当你从纽约地铁走出来时,你不是想看网页,你是想去某个地方,那你该怎么找到路?用户的期望在不断变化,而你也得同步前进。
如果展望未来,许多原本单纯为了获取信息的查询,在搜索中将变得具有“代理属性(agentic)”。你不仅在搜索,你是在完成任务,你会有多个任务线程在后台同时运行。10年后搜索还会存在吗?
埃拉德·吉尔:或者它会演变成别的东西?
桑达尔·皮查伊:它会不断演进。搜索可能会变成一个“代理管理器”,你在其中处理很多事情。在某种程度上,我现在就在使用我们内部的Antigravity(抗重力)工具,你有一堆AI代理在帮你做事。我能预见搜索引擎将会执行其中部分功能,帮你搞定一堆事情。
埃拉德·吉尔:我觉得你问题的核心在于,如果你把搜索定义为一个不超过一行的提示词,然后返回一堆排名不同的结果,而不是直接告诉你正确答案。你的问题是,这种产品形态还会存在吗?但今天在搜索的AI模式下,人们已经在进行深度的研究型查询了。那可能不太符合你刚才说的定义,但人们已经适应了。我认为用户未来会在搜索里执行长时间运行的任务。
桑达尔·皮查伊:是的。它可以是异步执行的。我们所有的生命都始于单细胞生物,而现在我们有了如此复杂的生命形态。问题就像是,那些早期的形态或范式最终会消失吗?曾经的搜索引擎变成了AI代理,你未来的交互界面也是AI代理。也许在N年之后,搜索框已经不再存在于设备中,毕竟设备的形态也会发生改变,输入/输出(I/O)方式也会彻底改变。
我认为如果你硬要去思考10年后的事情,可能会让自己陷入思维瘫痪。但我们很幸运能处于这样一个时代:你只需要思考未来一年的事情,而这一年内的进步曲线就足够陡峭了。光是驾驭这条曲线本身就令人兴奋。在过去,你可能需要坐下来展望五年后的发展,但现在,模型在一年后就会截然不同。
我认为搜索会演变,这是一个不断扩张的时刻。我觉得很多人低估了这一点,这绝不是一个零和博弈。人们能够创造的价值也将呈指数级增长。一旦你这样看待问题,情况就明朗了。过去YouTube崛起后,TikTok和Instagram也发展得很好;亚马逊崛起后,谷歌和Facebook同样表现优异。我们总是低估这些生态共同增长的潜力。如果你把它视为零和博弈,那确实会显得困难重重。只有当你不去创新,产品停止演进时,它才会变成零和博弈;但只要你站在技术前沿,一切都是共赢的。
我们同时在推进搜索和Gemini。它们在某些方面会有重叠,在某些方面也会产生深刻的分化。我认为同时拥有两者并积极拥抱它们是件好事。
谷歌的AI绝地反击
约翰·科里森:当我们谈论搜索及其走向时,我回想起差不多一年前,也就是2025年的春夏季,外界对谷歌的普遍情绪是非常负面的。当时的主流观点是“谷歌搜索完蛋了,他们将面临巨大的麻烦。核心商业模式受到了攻击”等等。当时谷歌的股价大概在每股150美元左右。但现在,人们意识到那种想法太可笑了。
谷歌在整个技术栈上都拥有布局——无论是应用层、大模型、TPU,还是Waymo、YouTube等各种很酷的投资。作为知情情绪的代理指标,你认为去年的投资者们到底误解了什么?因为显然当时存在某种巨大的误判。
桑达尔·皮查伊:当时的市场情绪显然是非常内视的。但对我来说,在那一刻我清楚地感觉到:“奥弗顿之窗(公众认知)已经转变了。”而我觉得我们公司正是为这一刻而生的。我们在技术上的垂直整合不是偶然的。我们当时已经迭代到了第七代TPU。我记得可能是在2016年的Google I/O大会上,我们就发布了TPU并谈到了我们正在建设AI数据中心。那可是2016年。
公司一直是以“AI优先”的方式在运营,我们早就深刻内化了这种转变。对我来说,尽管我们在前沿的大语言模型(LLM)上处于落后,但我们在内部拥有所有的能力,我们只需要极强的执行力来迎接这个时刻。
但令人兴奋的是,当我从全栈的角度来看时,我们有顶尖的研究团队,有强大的基础设施团队,有所有的平台。我们一直在各种业务中进行有针对性的投资。突然之间,我感觉到:“哇,我们拥有了这一项通用技术,它可以加速我们所有的业务。”从搜索到YouTube,从云计算到Waymo,一切都依赖于这项技术的进步。这是一种极具杠杆效应的推进方式。我理解这一点。
回到我们早前的讨论,我根本不认为这是一个零和博弈的时刻。我觉得所有东西的规模都会扩大10倍,市场将为其他人提供足够的空间。但作为一家公司,我们必须提升执行力。这正是我当时更加关注的重点。
约翰·科里森:后来有没有哪个具体的节点向外界证明了“哦,谷歌搞定这件事了”?是Gemini 3改变了人们的想法吗?我不太记得具体的时间线了。
桑达尔·皮查伊:真正让人们看到我们实力的模型可能大概是Gemini 2.5,尤其是我们在多模态方面达到了行业最前沿。这要归功于Google DeepMind团队。我认为我们前期付出了更多的固定成本,但我们从第一天起就将Gemini设计为原生多模态。这也是我们开始展现优势的领域。比如在端侧模型(Nano级别)上的表现,你能看到所有能力被整合在一起。
但你看,这是一个极具活力的技术前沿。目前大概有两到三个顶尖实验室在非常激烈地互相竞争。在任何一个月,我们可能都会觉得:“哦,太棒了,我们这步走得很好。”然后紧接着又会发现:“哦糟糕,我们还有几件事落后了。”我认为几个月后局势又会发生动态变化。正如你所料,前沿领域的竞争异常激烈。我就是这么看待这个过程的。
埃拉德·吉尔:这很有意思,因为当我和其他实验室(非谷歌)的研究人员交流时,他们经常提到的一点是:他们觉得其他几家顶尖实验室和谷歌团队的区别在于,谷歌并没有那么“狂热地信奉AGI(AGI-pilled)”。换句话说,他们认为谷歌内部没那么坚信AGI马上就会到来以及带来的技术奇点加速。显然,谷歌的人对这个话题有极其深入的思考。首先,你认为这个观察是真的吗?其次,你认为这是否会影响人们对未来的构想,从而影响他们正在构建的产品?
桑达尔·皮查伊:你看,我们已经把资本支出(CapEx)从大约300亿美元飙升到了1800亿美元附近——这可是真金白银。如果你不对未来发展曲线有某种极致的信仰,你是不会下这么大注的。
我认为这在很大程度上只是语义表达的差异。也许是因为我们是一家规模庞大的公司,拥有众多产品,在多个层面上触达了数十亿用户,所以我们在谈论AI时的措辞可能会有所不同。
我觉得我们的创始人们就是“AGI信徒”。大家认为谷歌不理解AGI是什么,或者认为Demis、Jeff Dean和团队不理解,这太荒谬了。要知道在某个时期,Demis、Jeff、Ilya、Dario(Anthropic创始人)全都在谷歌!
约翰·科里森:我喜欢这个反击。“喂,你们过去20年到底有没有在关注行业啊?”这确实说不通。
桑达尔·皮查伊:我认为有些差异可能源于公司属性。如果你是一家更年轻的公司,或者是一家纯粹的科研实验室,也许总部设在旧金山,很多这种小属性可能会在对外沟通时产生差异。但我不认为在根基层面上,大家对技术曲线的预判或对技术的内化认知存在分歧。
事实上,即使在公司内部,我们也有这样一群人,生活在最前沿。我们启动各种AI代理,看它们能做什么,看着它们掌握新技能、完成任务,然后回顾三个月前它们的能力,再对比现在。我们在内部深切地体验着这种指数级增长。
约翰·科里森:我觉得你们俩说得都对。但我之前在X上看到一条推文,有人说:“要解释硅谷现在到底发生了什么,你必须明白,每一位科技高管现在都患有严重的‘AI精神分裂症(AI psychosis)’,花大量时间写代码、跟AI聊天之类的。”我觉得这个视角很搞笑,但也并非全无道理。我很好奇,在近期的发展中,你个人有没有感受到那种“AGI即将到来”的时刻?或者说,你现在的“AI症状”有多深?
桑达尔·皮查伊:我第一次真切感受到AGI可能性的时刻是在2012年,当时Jeff Dean展示了早期版本的Google Brain——也就是神经网络识别出一只猫的时候。还有,当时我和拉里·佩奇一起去参加了DARPA(美国国防部高级研究计划局)自动驾驶挑战赛。我记得可能是2014年,看着那些自动驾驶汽车在行驶。还有Demis展示早期模型具备我们称之为“想象力”的功能时。
这样的时刻有很多,所以技术的进步是显而易见的。至于现在亲身体验并获得直观感受……我觉得最接近的时刻是,当你在写代码时给它分配了一个极其复杂的任务,你甚至都不需要打开IDE开发环境,只在某个AI代理管理器的界面里,看着它自动把事情做完,你会惊叹它到底有多强大。你可以称之为“感受到AGI”的时刻。
最近我自己做了一个小业余项目。运行了一会儿之后,我突然想:“哎,我都没注意它到底用的是什么编程语言?”那成了一个我在系统运行起来后才需要去问AI的细节问题。这感觉就像魔法一样。绝对有这样的时刻。
曲线的斜率确实让人吃惊。你在那么多维度上提升它,未来的进步空间显然不可限量。
约翰·科里森:当你谈到直观感受时,我觉得对于科技公司来说非常重要的一点(也是每个CEO都在思考的),就是如何保持与产品体验和普通用户的连接。因为科技产品太抽象了,你不能只通过团队的报告、PPT和电子表格来管理。
DoorDash的Tony Xu曾说,他现在还会亲自去送外卖,以保持对业务的敏感度。在Stripe,我们每周的全员大会上都有一个固定环节叫“巡视店铺(walk the store)”,大家一起点开控制面板,看看为什么会有那个弹窗?是不是太让人困惑了?以此确保我们都在实际使用自己的产品。
我很好奇你是怎么做的?除了每天使用Gmail等应用外,在谷歌你如何确保自己依然连接着最真实的产品体验?
桑达尔·皮查伊:我是在深度吃自己的“狗粮(Dogfooding)”,直接使用内部的开发版本。我会专门留出时间去深度体验,那种专注的时间非常有帮助。
就在两周前,我在健身房拉伸时,拿着手机用了Gemini Live(语音对话)。我心想,接下来的30分钟我要全程就某一个话题跟它聊天。你必须去做这些事。有些功能很好用,有些也会让你抓狂,但你会学到很多。我强迫自己以这种“极客用户”的模式去使用它,从而保持连接。
推特(X)也很有帮助,因为你能在上面得到最直接的反馈。有人会说“谢谢你修复了Google日历的问题,太棒了”,我说“其实还有几个地方得修”。“太感谢你的反馈了”。是的,X能让我直接看到原始的评论,我会亲自关注。
我还想告诉你另一件很有帮助的事。针对刚才讨论的,我会在我们内部版本的Antigravity中直接查询:“嘿,我们刚刚发布了这个功能,大家怎么看?告诉我大家讨论得最多、最糟糕的五个槽点,和最棒的五个亮点。”它就会汇总给我。我的生活变得更轻松了吗?是的。在过去,我得花多得多的时间去四处了解情况,现在有一个AI代理在帮我做这件事。这也是一种直观的体验——我甚至在学习如何利用这些工具。我正在适应这个未来。
埃拉德·吉尔:你刚才提到,这不是零和博弈,大家看到了巨大的生产力提升。回顾过去很多技术周期,无论是互联网、移动互联网还是SaaS,它们都需要一段时间才能真正体现在GDP数据中。而在AI的背景下,我们看到大规模的数据中心建设正在直接拉动GDP增长。你如何展望未来3年、4年或5年的情况?你认为美国经济会因为AI而变得更庞大吗?如果会,会大多少?
桑达尔·皮查伊:你看,如果这些投资要获得合理的回报,它必须在某个地方创造价值。之前红杉资本有人写过文章,比较了当前的资本支出和产生回报所需的收入,大概需要10倍于投资的收益才能持平。从那一刻起,各种数据都在增长。最终,这一切必须在商业逻辑上自洽。
但我要明确一点,我们现在面临的是供应受限(supply-constrained)。我们看到了所有业务领域对算力的巨大需求。我毫不怀疑这是一个极其庞大的市场和机遇。
约翰·科里森:我的一个疑问是,我觉得很多人低估了一些事情。比如,大家经常讨论软件工程的预算,然后比较花在Token(AI算力)上的钱和工程师的薪水。但在某种程度上,这个市场长期以来极其缺乏优秀的软件工程师。一旦你突然增加了AI这种“供给”,整个市场的规模可能会扩大10倍。换句话说,我认为软件工程和编程的市场比任何人想象的都要大得多。直接拿Token预算去对标工程师薪水是一个错误的衡量标准。我其实认为这会带动很多领域的增长。我并不是怀疑资本支出和最终产出不匹配,我只是好奇你认为这能带来多大的经济增长?
桑达尔·皮查伊:我明白。回顾互联网时代,其实GDP的增长并不能完全反映我们从互联网中真切感受到的所有价值。如果没有互联网,你的GDP增长可能是负的,还有大量的消费者剩余价值没有被计入。预测未来总是困难的。
但我确实认为社会在各个层面都存在自然的“阻尼机制(dampening mechanisms)”。最明显的例子就是:算力建设的曲线,与我们提升模型能力的曲线,并不完全同步。你在基础设施上已经遇到了物理约束。其次,你如何将这项技术安全地扩散到社会中?
就像我们在Waymo上做的那样。你可以把Waymo做得比人类驾驶员更安全,但你在推广速度上依然必须非常谨慎。有时你必须思考:如何负责任地将它融入社会?所有这些层面都存在制约。美国经济的规模已经比10年前大得多了。即使AI只能让它的增长率再提升半个百分点,那也是极其巨大的贡献。我预期事情会朝着这个方向发展。
物理瓶颈的约束
(中间包含一段Stripe植入广告)
埃拉德·吉尔:你提到了供给受限(supply constraints),我认为这是定义2026年的一个非常有趣的特征。你刚才说资本支出(CapEx)大概是1800亿美元?
桑达尔·皮查伊:我们说过大概在1750亿到1850亿美元之间。
埃拉德·吉尔:好的,差不多1800亿。让我觉得有意思的是,就算谷歌现在想砸4000亿美元进去,你也花不掉。因为没有足够的内存,没有足够的电力,还有各种零部件缺失。
桑达尔·皮查伊:没错,你甚至找不到那么多急需的电工。
埃拉德·吉尔:我想听听你对目前各种瓶颈的总体看法。
桑达尔·皮查伊:在某种层面上,你得追溯到最核心的硅晶圆产能(wafer capacity)上。这些都是最深层的物理现实。我认为晶圆投片量是一个根本的制约因素。相对而言,我认为电力和能源是更容易解决的问题。
获取建设许可并在当前的监管环境中推进,可能会是一个制约因素,这决定了你能做事情的速度。即使像得克萨斯、内华达或蒙大拿这些支持经济增长的州有很多土地,可能也依然不够。我认为美国需要在这方面取得巨大进步,我们真的需要学会以更快的速度建设基础设施。
你几乎必须转换思维,去思考在物理世界里如何能将建设速度提升10倍。我会把这看作一个制约因素。而且由于数据中心的暂停建设令等问题,阻力可能会越来越大。并不是少数几个人决定“我们要建快点”就能建快的。
所以我认为核心瓶颈在于:晶圆投片量、项目审批速度和执行力。当然,我也看到政府方面正在做很多出色的工作。大家都意识到必须更好地推进这些事情。接下来就是供应链中的关键零部件,比如内存芯片。短期内我们在这方面严重受限,所有人都在应对这个问题。
无论你对AGI多么狂热,所有经营公司的人都必须面对这个误差带:你到底能多看好?你能承受多少利润空间?因为世界上总有你无法控制的外部因素可能会出问题。大家都在做这种调整。这些就是我看到的限制。
埃拉德·吉尔:你认为内存是最大的制约因素吗?
桑达尔·皮查伊:内存绝对是目前最关键的组件之一。
埃拉德·吉尔:你说这是短期的。你觉得人们会很快增加供应,高昂的价格会自动解决这个问题吗?
桑达尔·皮查伊:头部的内存芯片公司不可能在一夜之间大幅提升产能。所以你在短期内必须面对这些限制,但随着时间推移,情况会逐渐缓解。我确实预计这会产生制约,但同时也会倒逼大量创新。我们会努力让这些系统的效率提升30倍。所有这些都会同时发生。
埃拉德·吉尔:这会巩固巨头的寡头垄断格局吗?如果你关注大模型的发展趋势,很大一部分提升将来自模型的“自我改进(self-improvement)”——模型将能够自己编写越来越多的代码,自己做更多的数据标注。现在这基本上是一个“抢椅子”的游戏,谁现在拥有算力,谁就能赢。因为如果你看整个行业的算力规模,每个人的算力基本都受到行业总产能的限制,你无形中就给某一家公司能领先其他人多远设定了上限。你觉得这种说法对吗?
桑达尔·皮查伊:把这作为一种分析框架是有道理的。但我正好从刚发布Gemma 4的经历来说——这是一个非常优秀的开源模型。虽然中国的模型也非常棒,但在中国之外,它是一个出色的开源选择。Gemma 4在能力上与前沿模型的差距既巨大,但在时间跨度上又没那么大。要知道,Gemma 4是基于Gemini 3的架构打造的。
这是一件非常诡异的事情。你谈论的只是一组权重文件,它甚至能装进一个U盘里。这确实很神奇,它不像造一枚SpaceX火箭那么复杂。我总是对此感到震惊:你运行一个庞大的数据中心好几个月,耗费无数资源,最后输出的却是一个扁平的文件。就像一个Word文档一样,这就是你的模型。这太不可思议了。
正是因为这门技术有这些独特的属性,让我不禁对传统的商业护城河框架产生怀疑,我们在思考:“到底该如何评估它?”但我认为至少在推理(Inference)端,你刚才的说法是一个非常合理的分析方式。
我也认为每个人都在试图弄清楚如何利用资本的激励机制来突破这些物理限制。正如你所说,世界上的内存产能就那么多,再强的资本激励也没法立刻解决2026或2027年的内存短缺。也许在这个阶段,你会看到模型之间产生更多的分化。但你要记住,这也必须与晶圆产能的增加、数据中心的审批进度相平衡。这种制约可能并不像表面上看起来那么严重。
约翰·科里森:这就像是霍尔木兹海峡被封锁一样。不管油价多高,如果你每天从系统中抽走2000万桶石油,你就必须摧毁2000万桶的每日需求。内存也是类似的情况,最终有些人就是买不到他们想要的内存。
桑达尔·皮查伊:而且系统中还有其他限制,比如安全问题。这些强大的模型绝对能够轻易击破目前市面上的绝大多数常规软件。也许现在已经发生了,我们坐在这里聊天的时候都不一定知道。
埃拉德·吉尔:你真的认为能击破所有软件吗?像SSH这种协议,人们已经试图破解很久了。你指的是大型平台还是多少个零日漏洞(Zero-days)?
桑达尔·皮查伊:是的,我指的是常规软件和大型平台中的零日漏洞。这是系统中你无法避开的现实约束。
约翰·科里森:有人告诉我,零日漏洞在黑市上的价格正在下降,因为AI导致漏洞的供应量增加了。我觉得这是一个非常有趣的黑市经济指标。
桑达尔·皮查伊:我一点也不惊讶。这项技术将如何实质性地扩散到社会中?它的隐患是什么?系统可能会受到冲击。话虽如此,我真诚地相信未来还有巨大的上行空间。
而且某些限制也许是有益的。正如我所说,限制能激发创造力,它会强迫技术进入一个压缩周期,让效率变得更高。它也可能迫使我们进行原本不会发生的重要讨论。仅就我提到的安全问题而言,我们未来需要更多全球范围的协同,而这在目前是没有的。不能忽视这些挑战。
资本配置与长线押注
埃拉德·吉尔:与此相关的,谷歌在自研和投资方面拥有令人惊叹的资产组合。在股权投资方面,你们持有相当数量的SpaceX股份、大概10%的Anthropic股份,还拥有绝大部分的Waymo股权。而在内部,你们开发了大量令人惊叹的技术:AI领域的Transformer架构、TPU硬件,当然还有Waymo的自动驾驶系统,以及最近刚刚发布重磅进展的量子计算(Quantum)。还有什么人们应该知道、被低估或者未来将产生巨大影响的“隐藏宝石”吗?
桑达尔·皮查伊:我们一直在持续推进一些长远项目。这些项目在刚公布时,往往显得有些边缘甚至荒谬。比如我们目前正处于早期阶段构想的“太空数据中心”。回到刚才关于“限制激发创造力”的话题,如果将眼光放到20年后,你打算把这些耗电巨大的数据中心建在哪里?这是个极具挑战性的问题。
这些就是我们今天思考的项目,就像我们在2010年思考Waymo一样。量子计算本身也是这类项目之一。我们正以一种极其坚定的方式在推进,我对此感到非常兴奋。
埃拉德·吉尔:你认为量子计算将在哪些领域产生最大的影响?目前大家主要谈论分子建模和密码学(抗量子密码学)。但在分子建模方面,深度学习模型似乎在某些场景下表现得非常出色,毕竟你们通过AlphaFold开创了这个领域。你认为量子计算的突破口在哪?
桑达尔·皮查伊:在抽象层面上,我感觉量子计算最适合用来越来越精确地“模拟自然”。因为自然界本质上是遵循量子规律的,你需要量子系统才能更好地模拟它。虽然我们也许能通过经典计算的压缩和抽象化技术以出人意料的方式达到目标,但我从根本上认为量子计算在这方面拥有独特优势。
比如直到今天,我们仍然无法完全理解用于合成肥料的哈伯法(Haber process)中的复杂机制。模拟天气、模拟物理现实等,这些领域量子计算都将大有作为。技术史告诉我们,当你把某项技术做到真正可用并具备规模时,建立在其上的创造力就会找到无尽的应用场景。我常举的例子是:移动手机加上GPS,最终孕育了Uber。当初研发手机的人绝对预测不到这是平台转移的最终产物。我对量子计算的众多潜在应用充满信心。
约翰·科里森:抱歉打断一下,除了量子计算和太空数据中心,还有哪些你在谷歌比较偏爱的远期项目?
桑达尔·皮查伊:GDM(Google DeepMind)团队正在深度思考机器人技术。坦白说,机器人在谷歌曾经是个我们涉足过早的领域。事实证明,AI才是10到15年前很多机器人设想中缺失的关键拼图。但现在,Gemini的机器人模型在空间推理等方面已经达到了SOTA(业界最先进水平)。以一种颇具讽刺意味的方式,我们现在正非常坚定地与波士顿动力(Boston Dynamics)、Agile以及其他几家公司重新开展合作。当然,市面上也有非常了不起的初创企业。
我们还在大力投资无人机送货项目Wing。我们正在扩大Wing的规模,在一段合理的时间内,预计将有4000万美国人能够使用Wing的服务。我不是在说几年之后的事。当你从事这些长线项目时,关键在于有条不紊的复利式推进。
Isomorphic项目也非常令人兴奋。我们专注于利用AI模型针对性地改进药物发现中的所有可能步骤,从而以高得多的概率推动药物进入三期临床试验。这不仅局限于分子设计,而是着眼于更广泛的生物模型,我认为这是我见过的最聪明的路径。
约翰·科里森:我很好奇,谷歌内部到底是如何进行资本配置(Capital allocation)的?
我想说的是,优秀的资本配置意味着你要深刻理解资本的机会成本,并将业务产生的现金投入到最高效、最有价值的地方。在商学院的经典案例里,如果你是波音公司,手头有一笔现金,你可以选择竞标下一个国防合同,投入一定研发资金,预期收益率是16%;你也可以开发一款全新的商用客机,预期收益率是19%。理性的选择是19%的那个。
但在谷歌,各个项目之间的异质性极高。你们可以给YouTube团队更多资金,让他们改进推荐算法,从而增加用户停留时间和变现收入;你们也可以给Waymo团队更多资金,让他们加快商业化落地速度;或者你们投资一种可能在五年后才会带来回报的新型AI架构。当你在比较如此不同性质、回报曲线也完全不同的项目时,你到底如何判断哪一个是资本的“最优用途”?
埃拉德·吉尔:这个问题太有“约翰风格”了,直接抛出一个ROIC(投资资本回报率)分析。
桑达尔·皮查伊:这是个很好的问题。讽刺的是,我现在对这个问题的感受比以往任何时候都深,主要因为TPU的分配。因为现在连Waymo都需要大量TPU进行计算。这种算力瓶颈让资本分配的问题变得异常紧迫。
顺便说一句,在我处理的所有事务中,我非常期待AI能尽快成为我的顾问,为这项任务提供输入建议。一旦我们能整合并打通所有的数据流,我觉得目前的模型已经具备这个能力了。
从历史上看,我认为谷歌的一个优势在于,我们常常在技术周期的极早期就做出决定。这源于我们对深层技术的执着。刚才埃拉德问及那些长期项目,其实在这个早期阶段做决策相对容易,因为初始资金数额并不大。但随着时间的推移,你必须保持长期的承诺,确保在深层技术上不断取得进展。
比如量子计算,我们如何评估它?我们要看团队能否在设定的时间线内达到我们对逻辑量子比特错误率和稳定性的阈值要求。我认为我们的一大优势,或者说我们一直坚持的原则,就是以非常深入的方式进行早期技术下注。这一直对我们帮助很大。
你必须凭直觉评估事物5到10年后的长期价值、总可寻址市场(TAM),假设一个疯狂的增长曲线,然后再倒推这些决定是否合理。我们对TPU的持续投资就是一个很好的证明。Waymo也是一个极佳的例子。两三年前,当全世界对自动驾驶感到悲观、其他同行都在退缩时,我们反而增加了对Waymo的投资。现在它的体验简直充满了魔力,只要有机会,我现在每天都坐Waymo上下班。
约翰·科里森:确实,Waymo是一个很好的例子。谷歌经常砍掉一些项目,比如Loon(高空气球网络)。你会说“这个项目不奏效,我们不投了”。但对于Waymo,尽管从令人惊艳的演示到真正推向市场的商业服务经历了漫长的道路,你们却没有失去信心。到底是什么让你决定砍掉Loon却保留Waymo的?这是一个定性决策还是定量决策?
桑达尔·皮查伊:我觉得很大程度上是定量的。你去看Waymo底层的自动驾驶软件技术,看看它在安全性和可靠性曲线上的进展。它是一个长周期的任务,你设定安全目标,追踪实际表现与预期曲线的贴合度。我认为Waymo团队非常卓越。虽然可能会经历停滞期,但那种时候你必须信任团队的能力,相信他们能突破瓶颈。你在深层技术层面评估事物的能力越强,做出的决定往往就越好。
埃拉德·吉尔:我听过一种关于Waymo的讨论。自动驾驶过去依赖于手工编写的启发式规则,比如遇到某种边缘情况汽车该如何反应。但几年前,随着Transformer浪潮的兴起,Waymo全面转向了端到端的深度学习,从而迎来了巨大的突破。你认为如果Waymo是五年前才创立的,凭借现在的技术突破,它能达到今天这种研发了15年才有的水平吗?
桑达尔·皮查伊:我们刚才聊到了机器人。如果有人在过去三年内开始做机器人项目,按理说他们会取得更快的进展。但我认为Waymo是一个极其复杂的集成系统。这有点像台积电(TSMC)或者SpaceX的火箭发射,它涉及非常复杂的系统集成。时间的沉淀和工艺打磨在这里至关重要。不过话说回来,我确实认为端到端的深度学习方法将在这个领域产生不可思议的加速作用。对Alphabet来说,一直坚持投资这个团队无疑是巨大的优势。
约翰·科里森:还有两个资本配置的问题。第一,你是否认为谷歌历史上有点过于保守、扛杆率太低了?鉴于谷歌有着充裕的净现金,且优质的创意多到做不完,而核心业务也在持续稳定增长,回报率远超资本成本。回首过去,谷歌是否本该更加进取一些?比如承担一些杠杆去投入新项目,或者进行更多的少数股权投资(虽然你们在这方面已经是顶尖的了)?
桑达尔·皮查伊:这是一个好问题。比如,如果Waymo能更早达到某种成熟度,我肯定会更早地注入大量资本。在某种程度上,你必须成为资本的优秀管理者。如果你看好ROIC,你会想把每一分钱都投进去;但对于闲置资本,我们也会谨慎行事,这也是为什么我们投资了Stripe、SpaceX和Anthropic等公司。我们认为这体现了对资本的良好管理。
现在随着AI浪潮的到来,有了更多可以高效部署资本的机会,所以我们正在加大投入。但对于过去的项目,我不认为是因为缺钱导致它们走得慢。以Waymo为例,它有其自然发展的节奏。在安全性上,我们把安全放在首位,所以拔苗助长也是不对的。但只要我们对某个项目感到兴奋并确立了信念,我们一直愿意投入资金看它开花结果。
约翰·科里森:历史上在科技公司,绝大部分研发支出都花在了员工的薪水上。员工人数是一个被严格控制的指标。除非你做一些计算量极大的项目,否则技术成本相比人力成本根本不值一提。
但现在由于TPU的分配,世界已经变了。在谷歌内部,预算规划现在是如何运作的?你们是不是在给项目分配资源时,不仅给编制(Headcount),还要给“TPU预算”?在季度或年度复盘时,这是如何操作的?
桑达尔·皮查伊:其实我们一直都有算力预算。但现在,面对机器学习的需求(我们大量使用TPU和GPU),我们同时极度关注人员规划和算力规划。算力有时宽裕,有时紧张,但现在是处于极度短缺的状态。
你现在必须花大量时间去处理这个问题。至少对我自己来说,我每周会专门花一小时,在非常细微的颗粒度上去思考算力分配。我知道每个项目和每个团队正在使用的算力单元,我会盯着这些数据并进行评估。我觉得目前来说,这是极其重要的一项工作。因为在很多情况下,稀缺资源就是算力,你必须确保谷歌宝贵的计算资源花在最值得的创新上。
埃拉德·吉尔:在谷歌云(GCP)的背景下你如何看待这个问题?因为你们还需要把算力分配给外部客户。在系统受限的情况下,你们如何平衡外部客户和内部自用之间的算力分配?
桑达尔·皮查伊:我们通过前瞻性的规划来解决。云计算团队会提前制定计划,并确保能满足内部和外部的需求。在规划的同时,我们也会向客户做出长期承诺。我们在合同里对客户作出的任何承诺都是神圣不可侵犯的。虽然在当前受限的环境下,云团队肯定觉得算力不够,但这基本上是通过提前统筹规划来解决的。
约翰·科里森:说到谷歌云,我有一个攒了很久的产品需求,我知道你一直期待这个环节。
桑达尔·皮查伊:你明明可以在推特上发给我的(笑)。
约翰·科里森:GCP的MCP(模型上下文协议)做得太棒了。你们让AI可以非常顺畅地通过编程方式与谷歌云交互,基本开放了除了核心权限控制外的所有功能。说实话,谷歌云功能太庞杂了,以前登录进去得建组织、项目,然后再在一堆服务里找需要的功能,体验确实有些复杂。但现在,有了AI这个懂所有API文档的管家,直接用自然语言吩咐“去给我加上这个谷歌云功能”,体验就非常惊艳。这解决了界面过于庞大的问题。
桑达尔·皮查伊:确实,AI作为编排层,可以把所有散落的数据和功能整合起来。以往为了让企业CEO看到统一的数据,需要搞极其庞大的ERP整合项目。现在AI能以对终端用户最直观的方式完成这一切,这点非常令人欣喜。产品的表面积越大,这带来的收益就越明显。在这方面我们确实可以做得更好。
埃拉德·吉尔:我的产品建议是:像Claude这样的产品找到了很好的产品市场契合度(PMF),让消费者能体验到带记忆状态(stateful)的AI。比如你可以跟它说“每天早上把感兴趣的新闻汇总发给我”。但目前主流的AI应用似乎还不支持这种持续性(persistence)。这会在未来实现吗?
桑达尔·皮查伊:我觉得这是方向。你想给用户一种能力,让他们能以安全、可靠的方式运行长时间、持续性的任务。这需要彻底理顺身份认证、访问权限等基础设施问题。但这绝对是未来,是AI代理化的未来。把这个能力普及给普通消费者是非常激动人心的前沿方向。在未来,消费者交互界面的底层将会是完整的编程模型,具备各种工具、持久运行能力,并能在云端或本地安全执行。
约翰·科里森:我的另一个产品诉求是……我不知道你有没有这种体会,反正对我来说,在Google Docs(文档)里搜索文件,比在Gmail里搜索难太多了。通常在邮件里我能记住几个独特的关键词。但我如果想找“2026年预算”的幻灯片,因为这几个词在Stripe内部的PPT里太常见了,我永远也找不到那个最准确的文件。皮查伊先生也有这个烦恼吗?
桑达尔·皮查伊:不知为何,我并没有像你描述的那样感受到强烈的困扰,但当你描述出来时,我完全能共情。我知道这段采访播出后我该去找哪个团队谈话了。我们绝对可以把这做得好得多。在接下来的几个月里,随着AI更深度地整合进Google Docs等服务,你将看到搜索体验的显著提升。之前大家只是把AI简单加进产品里,接下来我们要解决的是如何在全局上下文中进行缓存和真正调用。这方面还有很大进步空间。
谷歌的工作方式
埃拉德·吉尔:我投资或接触的很多公司,甚至是最近刚成立的初创公司,都在因为AI大幅改变他们的工作流、工程实践,甚至是团队里需不需要设计师的观念。谷歌也在重新审视这些吗?你们的工作流发生了巨大的转变吗?
桑达尔·皮查伊:你可以把它想象成同心圆。在谷歌内部,有些团队的转变非常深刻。对我来说,2026年的一大任务就是如何将这种工作方式扩散到更多团队。之前我们没法大范围推广,因为有些流程不够稳定。但今年我感觉曲线在发生急剧变化。
我看到像GDM和一些软件工程(SWE)团队真的改变了工作流。他们在使用内部代号叫“Jet Ski”的工具(也就是Antigravity)。他们生活在AI代理管理器的世界里,在用全新的方式工作。就在上周,我们把这套工具推广给了搜索团队。在大企业里,推动新技术普及所需的变革管理(Change Management),比小公司要难得多。小公司可以一夜之间全员切换。
埃拉德·吉尔:我认为在工业界普及AI还面临几个问题。我们现在面临“智能过剩”——AI在抽象层面上非常强大。但企业内部对智能的实际利用率存在落差。
问题包括:第一,成为一个能写出好提示词(Prompt)的工程师需要时间;第二,还有特定于公司(比如特定于Stripe)的知识提示;第三,共享AI生成的代码库很难,因为代码重写频率极高,“爆炸半径”很大,协作变难了;最后,在工程团队之外,非技术人员如何获取数据是个大问题。如果你问代理“全球每天有多少人问‘这笔交易的状态如何’?”,这种信息需要重写整个公司的权限引擎才能让代理安全地回答。此外,工程师、产品经理、设计师等角色的界限也模糊了。你认为如何才能真正让智能得到大规模采用?
桑达尔·皮查伊:Gemini企业服务团队和Antigravity团队现在确确实实就在解决你说的这些问题。这正是我们产品的路线图。我们在内部使用中也遇到了这些壁垒,然后努力克服它们。
比如谷歌的SRE(站点可靠性工程)团队在使用中突然发现,有些环节可以创建自动化的AI工作流。但当你掌握了这些技能后,如何将其集中化?如何让模型和其他人都能共享使用?身份认证和权限控制是极其困难的问题。还有安全层面的考量,运行这些服务一旦出错,代价是极高的。
我们正处于承担这些固定成本的阶段。但我相信,一旦我们解决并打磨好这些问题,将其推出给外部客户,你会看到人们的生产力实现一次巨大的跃升。
约翰·科里森:谷歌每年会有几次正式的业务重新预测(re-forecast)。在Stripe,我们每年设定预算,然后有三次重新预测。这就相当于一个将业务状态输入函数并得出更新数字的过程。你能想象完全由AI代理在没有人类干预的情况下完成这项预测吗?你认为谷歌在哪个季度能实现首次全代理化的财务预测?
桑达尔·皮查伊:我绝对认为在某些领域,2027年将是一个关键的拐点。做这些预测的人,其工作流将彻底改变。也许有一段时间你会用传统方法进行复核,但终究会迎来全面切换的交叉点。我预计2027年这类转变会发生得很深刻。针对埃拉德刚才关于非技术部门的问题,年轻的初创公司确实拥有“AI原生团队”的优势。而对我们来说,必须艰难地驱动这种内部转型。
约翰·科里森:最后一个问题。我们在谷歌经常谈论那些从小处起步的项目,比如Transformer最初并不是谷歌的主推项目。现在谷歌内部有什么从小处起步,却让你感到非常兴奋的小项目吗?
桑达尔·皮查伊:这可能会让人意外。当我们决定做“太空数据中心”时,它最初就是一个非常小的团队,只有几个人拿着少量的预算去攻克第一个里程碑。我认为从小处起步很重要,哪怕是一个宏大的想法。
还有一个例子。就在昨天,有人跟我详细解释了他们在模型后训练(post-training)阶段的一项小改进。我听完心想:“哇,这将在性能上带来一次非常漂亮的跃升。”这就是我们当前所处时刻的魔力。至于那个具体的技术细节我就不透露了,相信未来某一天我们会发表相关论文的。这些微小但能带来巨大跃升的进展,让我无比兴奋。
约翰·科里森:太空数据中心和新的机器学习技术。非常棒的回答。桑达尔,谢谢你。
桑达尔·皮查伊:这是我的荣幸,谢谢。保重。