概述与简介
本文是知名播客主持人Lex Fridman与NVIDIA(英伟达)联合创始人兼首席执行官黄仁勋(Jensen Huang)的一场深度对话。在这场长达两个多小时的访谈中,黄仁勋详细阐述了英伟达如何从早期的芯片级加速器公司,蜕变为引领全球AI算力革命的系统级“极端协同设计”(Extreme Co-design)巨头。
黄仁勋在对谈中分享了公司内部独特的管理哲学:为了保持组织的敏捷与创新,他直接管理着60位高管,且从不进行传统的一对一汇报,而是通过全员参与的“推演”(Reasoning)过程来统一共识。访谈深入探讨了推动AI行业前行的缩放定律(Scaling Laws)、算力与能源的瓶颈挑战、智能体(Agentic AI)带来的技术拐点,以及英伟达如何通过CUDA生态构筑不可逾越的护城河。此外,他还分享了与埃隆·马斯克(Elon Musk)在超级计算机建设上的共鸣、对中美科技竞争的观察,以及与台积电(TSMC)长达数十年的深厚合作。
在技术之外,黄仁勋也展现了他作为领袖的坚韧与人文思考。他坦诚地分享了自己面对极度压力与失败时的化解之道,探讨了人工智能与人类本质的区别,并对人类的未来抱有极致的浪漫与乐观主义。本文不仅是一部关于英伟达发展史的微缩档案,更是理解AI时代未来走向的重要参考。
Lex Fridman 接下来的对话嘉宾是英伟达(NVIDIA)的首席执行官黄仁勋(Jensen Huang),他领导着人类文明史上最重要、最具影响力的公司之一。
英伟达是推动AI革命的引擎,其巨大的成功在很大程度上可以直接归功于黄仁勋的纯粹意志力,以及他作为领导者、工程师和创新者所做出的诸多明智押注与决策。
这里是Lex Fridman播客。亲爱的朋友们,现在为您请出黄仁勋。
Lex Fridman 你将英伟达推向了AI的新纪元,使其超越了对芯片级设计的关注,现在转向了机架级(rack scale)设计。我想可以公允地说,长期以来,英伟达的制胜之道在于制造尽可能最好的GPU(你们现在依然如此),但现在你已经将这扩展到了对GPU、CPU、内存、网络、存储、电源冷却、软件、机架本身、你们宣布的计算集群(pod),甚至整个数据中心的极端协同设计(extreme co-design)。让我们来谈谈极端协同设计。在包含如此多复杂组件和设计变量的情况下,协同设计系统最困难的部分是什么?
黄仁勋 谢谢你提出这个问题。
首先,我们需要极端协同设计的原因在于,我们要解决的问题已经大到无法装进一台计算机里由单个GPU来加速了。
你想要解决的问题是,你希望计算速度的提升能超越你增加的计算机数量。你增加了10,000台计算机,但你希望速度能提高一百万倍。突然之间,你必须把算法拿出来,对其进行拆解、重构,你必须对流水线进行分片(shard),对数据进行分片,对模型进行分片。现在,当你以这种方式分布式处理问题时——不仅仅是扩大问题规模,而是分配问题——所有环节都会成为瓶颈。这就是阿姆达尔定律(Amdahl’s Law)的问题:你对某件事的加速效果,取决于它在总工作负载中所占的比例。如果计算占了问题的50%,我把计算速度无限提高(比如提高一百万倍),我也只能把总工作负载的速度提高两倍。
现在突然之间,你不仅要分配计算任务,还必须想办法对流水线进行分片。
你还必须解决网络互联的问题,因为你把所有的计算机都连接在了一起。
所以,在我们目前所做的规模下,进行分布式计算时,CPU是个问题,GPU是个问题,网络是个问题,交换机是个问题。在所有这些计算机之间分配工作负载也是个问题。
这完全是一个极其复杂的计算机科学问题。因此,我们必须动用所有的技术手段。否则,我们要么只能线性扩展,要么只能依赖摩尔定律(Moore’s Law)的提升,但由于登纳德缩放定律(Dennard scaling)已经失效,摩尔定律基本上已经放缓了。
Lex Fridman 我相信这其中肯定有权衡。而且你们涉及了完全不同的学科领域。我肯定你们在这些领域——高带宽内存、网络和NVLink、网卡(NIC)、你们正在做的光通信和铜缆通信、供电、散热等等——都有各自的专家。我的意思是,每个领域都有世界级的专家。你是怎么把他们聚在一个房间里弄清楚这些的?
黄仁勋 这就是为什么我的直属高管团队那么庞大。
Lex Fridman 这个过程是什么样的——你能带我了解一下专家和通才共同协作的过程吗?当你们知道必须把一系列的东西塞进一个机架时,你们是如何把它们组合在一起的?把所有这些设计在一起的过程是怎样的?
黄仁勋 这分为三个问题。第一个问题是:什么是极端协同设计?
就是我们在整个软件堆栈上进行优化,从架构到芯片,到系统,到系统软件,再到算法,再到应用。这是一层。第二层是你我刚刚讨论过的,它超越了CPU、GPU、网络芯片、向上扩展(scale-up)交换机和向外扩展(scale-out)交换机。
当然,你还必须把供电和散热等因素包括进去,因为所有这些计算机都极其耗电。它们做了大量的工作,能源效率很高,但总体加起来仍然消耗了巨大的电量。这就是第一个问题,它是什么。
第二个问题是,为什么需要它?我们刚才已经讨论了原因。你希望分配工作负载,以便获得的收益能超越单纯增加计算机数量带来的收益。
第三个问题是,它是如何运作的?你是怎么做到的?
这也是这家公司的一种奇迹。当你设计一台计算机时,你必须有计算机的操作系统。当你设计一家公司时,你首先应该思考你想让这家公司产出什么。我看到很多公司的组织架构图,它们看起来都一样。
汉堡包式的组织架构图,软件公司的架构图,汽车公司的架构图。它们看起来都一样。
这对我来说毫无意义。公司的目标、公司的存在就是为了成为一台机器、一种机制、一个能产生输出的系统。而这个输出就是我们想要创造的产品。
这其实也是一种设计,公司的架构应该反映它所处的环境。它几乎是在间接告诉你应该如何设置组织架构。我的直接下属有60人。
我不跟他们做一对一汇报(one-on-ones),因为这不可能。如果你还要完成实际工作,你不可能有60个下属还挨个去一对一……
Lex Fridman 所以你仍然有60个直接汇报的下属。跨越了各种不同的领域?
黄仁勋 比那还多,是的。
Lex Fridman 比那还多。大多数大牛至少有一只脚是踏在工程领域的吧。
黄仁勋 几乎所有人都是。
有内存专家,有CPU专家,有光学专家。所有人……
Lex Fridman 这太不可思议了。
黄仁勋 是的,GPU和架构、算法、设计……
Lex Fridman 所以,你一直关注着整个堆栈,而且你必须就整个堆栈的设计进行激烈的讨论?
黄仁勋 而且没有任何对话是只有一个人参与的。这就是我不做一对一汇报的原因。我们提出一个问题,然后我们所有人一起去攻克它。因为我们在进行极端的协同设计。
实际上,整个公司一直都在进行极端协同设计。
Lex Fridman 所以,即使你们在讨论一个特定的组件,比如冷却或网络,所有人也都在旁听?
黄仁勋 是的,完全正确。
Lex Fridman 而且他们可以提出意见:“这不适合电力分配的设计。这不适合——”
黄仁勋 完全正确。
Lex Fridman “……这不适合内存。这不适合那个。”
黄仁勋 没错。谁想不听就可以不听。你明白我的意思吧?
这样做的原因是,管理团队里的人知道什么时候该集中注意力。如果这是一件他们本来可以贡献意见却没贡献的事,我会点名批评他们的。所以大家会说,“嘿,快来,我们一起加入讨论。”
Lex Fridman 正如你提到的,英伟达是一家适应环境的公司。
所以,你能指出在哪个时间点环境发生了变化,并开始在暗中转变——从早期的游戏GPU,到后来的深度学习革命,再到我们现在开始把它视为一个“AI工厂”?英伟达是做什么的?它生产AI,让我们建一个制造AI的工厂吧。
黄仁勋 我可以系统地为你推演一下这个过程。
我们最初是一家加速器(accelerator)公司。
但加速器的问题在于应用领域太窄了。
它的好处是能为特定的任务进行难以置信的优化。任何领域的专家都有这个优势。但过度专业化的问题在于,你的市场触达面会变窄,但这本身也没问题。真正的问题是,市场规模也决定了你的研发能力(R&D capacity)。而你的研发能力最终决定了你在计算领域可能产生的影响力。所以,当我们最初作为一种非常具体的加速器起步时,我们一直知道这只是我们的第一步。我们必须找到一种方法成为“加速计算”(accelerated computing)。但问题是,当你成为一家计算公司时,它又太通用了,这就削弱了你的专业性。我故意把这两个本来存在根本冲突的词连在一起。我们成为一家计算公司的程度越高,我们作为专家的能力就越弱。我们越是专业,进行通用计算的能力就越小。
我故意把这两个词连在一起,意思是公司必须找到一条非常狭窄的路径,一步一步地扩大我们计算的视野,但同时又不能放弃我们所拥有的最重要的专业化能力。好的,那么我们超越纯加速器迈出的第一步是,我们发明了可编程像素着色器(programmable pixel shader)。
这是走向可编程性的第一步。这是我们在计算世界征途上的第一步。我们做的第二件事是,在着色器中加入了FP32(单精度浮点运算)。这个兼容IEEE标准的FP32是一个向计算方向迈出的巨大步伐。这也是为什么所有从事流处理器(stream processors)和其他类型数据流处理器研究的人发现了我们。他们说,“嘿,突然之间,我们或许可以使用这个计算密集度极高、并且现在兼容IEEE标准的GPU了。”
“我可以把我以前在CPU上写的软件,拿到GPU上试着运行。”
这促使我们把C语言放在FP32之上,我们称之为Cg。Cg这条路最终把我们引向了CUDA。CUDA是一步一步发展起来的。把CUDA放到GeForce(消费级显卡)上,这是一个非常非常艰难的战略决策,因为它消耗了公司极大的利润,我们当时几乎负担不起。但我们还是这么做了,因为我们想成为一家计算公司。一家计算公司必须要有一个计算架构。而一个计算架构必须在我们制造的所有芯片上兼容。
Lex Fridman 你能带我回顾一下那个决策过程吗?把CUDA放到GeForce上,当时负担不起?你能解释一下这个决定吗?为什么大胆地决定无论如何都要这么做?
黄仁勋 这是一个好问题。我会说那是第一个几乎带来生存威胁的战略决策。
Lex Fridman 对那些不了解这段历史的人来说(剧透一下),这最终被证明是企业史上做出的最无比辉煌的决策之一。CUDA最终成为了在这个AI基础设施世界进行计算的不可思议的基础。
黄仁勋 谢谢。
Lex Fridman 只是为了交代一下背景。结果证明这是一个很好的决定。
黄仁勋 是的,结果证明那是个好决定。当时的经过是这样的。我们发明了CUDA这个东西,它扩大了我们的加速器可以加速的应用范围。问题是,我们如何吸引开发者来使用CUDA?
因为一个计算平台的核心就是开发者。开发者不会仅仅因为一个计算平台能运行一些有趣的东西就跑过来。他们来到一个计算平台,是因为它的装机量(install base)很大。
因为任何开发者都想开发能触达大量用户的软件。所以,装机量实际上是一个架构中最重要的一环。这个架构可能会招致无数批评。比如,没有哪个架构比x86受到的批评更多了……大家觉得它算不上一个优雅的架构,但它却是当今的定义性架构。这给你提供了一个例子:事实上,有许多RISC(精简指令集)架构,由世界上最顶尖的计算机科学家设计得非常完美、优雅,但大多都失败了。所以我给了你两个例子,一个是优雅的,另一个是几乎谈不上美感的,然而x86却存活了下来。原因就是……
Lex Fridman 装机量就是一切。
黄仁勋 装机量决定了一个架构。其他一切都是次要的,好吗?当时还有其他架构。
CUDA出来了,OpenCL也在这里。还有几个竞争的架构。但我们做出的正确决定是,我们说,“嘿,听着,归根结底这关乎装机量,我们能把一种新的计算架构推向世界的最好方法是什么?”
在那个时候,GeForce已经取得了成功。我们每年已经能卖出数以千万计的GeForce GPU。我们说,“我们应该把CUDA放到GeForce上,把它放进每一台PC里,不管客户用不用它,以此作为培养我们装机量的起点。”
与此同时,我们去吸引开发者,我们走进大学,写书、开课,把CUDA推广到各个角落。最终人们发现了它……
当时PC是主要的计算工具。还没有云端计算,我们可以把一台超级计算机交到学校里每个研究员、每个科学家、每个工程学院的人手中……
或者说交到每个学生手中,最终奇迹就会发生。
问题是,CUDA极大地增加了我们那款作为消费级产品的GPU的成本。这成本高得惊人,彻底吞噬了公司所有的毛利润。
所以在当时,公司的市值大概是……我不知道,当时大概是80亿美元?大概60亿、70亿美元之类的。
在我们推出CUDA之后,我意识到它会增加极大的成本,但这是我们坚信的东西。
结果我们的市值跌到了大约15亿美元。我们在谷底待了很长一段时间,然后一步步慢慢爬回来。但我们在GeForce上保留了CUDA。我总是说,英伟达是GeForce建立起来的帝国,因为正是GeForce把CUDA带给了每一个人。研究人员、科学家,他们在GeForce上发现了CUDA,因为他们中很多人都是游戏玩家。很多人本来也会自己组装PC。在大学实验室里,很多人使用PC组件自己搭建计算集群。所以,这就是我们起步的方式。
Lex Fridman 然后这就成为了深度学习革命的平台和基础。
黄仁勋 这也是另一个极具前瞻性的伟大观察。是的。
Lex Fridman 在那个生死存亡的时刻,你还记得那些会议是什么样的吗?当决定作为一家公司要押上一切风险时,那些讨论是怎样的?
黄仁勋 我必须向董事会清楚地说明我们想做什么,而且管理团队也知道我们的毛利率会被摧毁。
所以你可以想象这样一种情况:GeForce承担了CUDA的成本压力,但没有游戏玩家会欣赏这一点,也没有游戏玩家会为此买单。他们只愿意付一定的价格,不在乎你的成本是多少。因此,我们把成本增加了50%,这消耗了……而且我们本来是一家只有35%毛利率的公司,所以这真的是一个非常艰难的决定。但是你可以想象,有一天这项技术会进入工作站,会进入超级计算机,在这些细分市场里,我们或许能获取更高的利润。
所以你可以通过推演说服自己去承受这些代价。但这仍然花了十年时间。
Lex Fridman 但这更多是与董事会的对话并说服他们。但在你个人的心理层面,随着英伟达不断做出预测未来的大胆押注,且在某种程度上特别是在现在,你们正在定义未来。
所以,我几乎是在寻求一种智慧:你是如何能够做出这些决定,让一家公司实现这样的飞跃的?
黄仁勋 首先,我的许多决策源于强烈的好奇心。
在某个时刻,存在着一种推理系统能够让我信服,让我清楚地看到这种结果一定会发生。这件事一定会发生。
所以我在心里相信它,而当我在心里相信它时,你也知道那是怎样的状态:你具象化了一个未来,而那个未来是如此令人信服,它不可能不发生。
这期间会有很多痛苦,但你必须相信你所相信的。
Lex Fridman 所以你设想未来,然后本质上从工程学的角度,将其具象化为现实?
黄仁勋 是的。你通过推演来思考如何到达那里。你推演为什么它必须存在。大家都在公司里一起推演。管理团队会推演,我周围所有的人……
我们花大量时间去推演。接下来的部分可能属于技巧层面。你知道,在管理学中,通常领导层保持沉默,或者他们了解到一些事情后发表一个宣言:“这是新的一年,不知怎么的,到明年年底我们要有一个全新的计划。我们要往这个方向进行大规模裁员,往那个方向进行大规模架构调整,发布新的使命宣言……发布新标识”等等之类的。
我从来不这样处理事情。当我了解到某件事,并且它开始影响我的思考方式时,我会非常清楚地让我周围的每个人知道,“这很有趣。
这会带来改变。这会影响那个事物。”
我一步一步地推演事情。通常,我已经做出了决定,但我会抓住每一个可能的机会——外部信息、新的见解、新的发现、新的工程突破、实现的新里程碑,我利用这些机会去塑造其他每个人的信念系统。我确实每天都在这么做。
我和我的董事会这么做,和我的管理团队这么做,和我的员工这么做。我试图塑造他们的信念系统,这样当有一天我说:“嘿,我们收购Mellanox吧”,对所有人来说这绝对是理所当然的事情。
在某一天我说,“嘿各位,我们全力投入深度学习吧”,让我告诉你原因。我其实已经在此前向公司内部的各个组织铺好了砖。每个组织、每个人可能已经听过了所有部分。
整个公司自然是听到了其中的片段。
而在我宣布的那一天,其实大家已经接受了它的很多部分。
在很多方面,当我宣布这些事情时,我能想象员工们其实在想:“黄仁勋,你怎么才说啊?”
事实上,我已经花了一段时间塑造他们的信念系统了,对于领导层来说,有时这看起来像是在背后领导,但实际上你一直在塑造他们……直到我宣布的那天,获得了100%的认同。这就是你想要的。你希望带所有人一起前进。否则,我们宣布关于深度学习的事情,大家会觉得“你在说什么?”。你宣布我们要全力投入某个事物,你的管理团队、董事会、员工、客户可能会觉得,“这是从哪儿冒出来的?这太疯狂了。”
如果你回头看看GTC大会的历史主题演讲(GTC effect),你也会发现,我一直在塑造行业内合作伙伴的信念系统,我也用它来塑造我们自己员工的信念系统。所以到我宣布某个事情时,比如我们刚宣布了Grok(注:口误或原音如此,可能指代新发布的工具或硬件概念),实际上在此之前我已经花了两年半的时间在讨论这些铺垫工作。
你回头看就会惊呼,“天哪,他们已经讨论这个长达两年半了。”所以我一直在一步步打好基础,这样当时机成熟我宣布它时,每个人都会说,“你怎么花了这么久?”
Lex Fridman 但这不仅限于公司内部。你实际上在塑造全球创新的大格局。通过将这些理念公之于众,你真真切切地具象化了现实。
黄仁勋 我们不制造计算机。事实上我们也不建云计算。我们其实是一家计算平台公司。这很奇妙,没有人能直接从我们这里买到最终成品。我们进行垂直设计、垂直整合以优化系统,但在每一层级我们又把整个平台开放,以便被集成到其他公司的产品、服务、云、超级计算机和OEM计算机中。所以令人惊奇的是,如果我没有先说服他们,我就无法开展我的工作。因此,GTC大会很大程度上是为了具象化一个未来,以至于等我们的产品准备好时,他们会说,“你怎么花了这么久才做出来?”
Lex Fridman 是的。长期以来你一直坚信“缩放定律”(Scaling Laws),广义上的缩放定律。你现在仍然相信缩放定律吗?
黄仁勋 是的,当然。我们现在有了更多的缩放定律。
Lex Fridman 我想你已经概述了其中的四个:预训练、后训练、测试时(推理时)以及智能体规模扩展(agentic scaling)。当你展望深远的未来和近期的未来时,你认为哪些阻碍(blockers)是你最担心的、让你夜不能寐并且必须克服才能继续扩展的?
黄仁勋 我们可以回顾一下人们过去认为是阻碍的那些事情。
最开始,第一个……预训练阶段的缩放定律。人们理所当然地认为,我们拥有的高质量数据量将限制我们所能达到的智能水平。那个缩放定律是非常重要的:模型越大,相应更多的数据就能产生更聪明的AI。这就是预训练。Ilya Sutskever曾说过类似“我们的数据用完了”或“预训练结束了”这样的话。行业当时恐慌了,觉得这是AI的终点。当然,这显然是不对的。我们将继续扩大用于训练的数据量。这些数据中有很大一部分可能是合成数据(synthetic),这也曾让人感到困惑。人们没有意识到,他们有点忘了我们用来教导彼此、互相传递信息的大部分数据,其实都是合成的。
它是合成的,因为它并非天然存在于大自然中。
是你创造了它。我消费了它。我修改、补充、重新生成它,然后其他人再消费它。所以我们现在已经达到了一个水平,AI能够获取基础事实(ground truth),并对其进行增强……
强化它,综合生成海量的数据。因此后训练(post-training)阶段的数据量将继续成倍增加。我们使用的人类生成的数据会越来越少。
我们用于训练模型的数据量将继续扩展,直到我们不再受限于数据……
训练不再受限于数据,而是受限于算力(compute)。因为大部分数据是合成的。接下来的阶段是测试时(test time inference)。我还记得人们告诉我,“推理?哦,那很简单。预训练才难呢。”人们谈论的是庞大的系统。他们认为推理一定很容易。所以推理芯片只会是很小的芯片,不像英伟达的芯片。英伟达的太复杂、太昂贵了。他们认为未来推理会是最大的市场,而且它很简单,我们可以将其商品化(commoditize),每个人都能造自己的推理芯片。这对我来说一直是不符合逻辑的,因为推理其实就是“思考”(thinking),我认为思考是很难的。思考比阅读难得多。
预训练仅仅是记忆和泛化,在关系中寻找模式。
你在阅读、不断阅读,而思考、推理、解决问题,则是面对未探索的新体验,将其分解并拆解为可以解决的片段。然后我们要么通过第一性原理去推理,要么通过以往的经验、过去的例子去解决。或者只是探索、搜索、尝试不同的东西。测试时扩展(推理)的整个过程,其实就是关于思考。它关于推理、规划、搜索……既然如此,它怎么可能是轻算力的呢?在这方面我们绝对是正确的。测试时的扩展是极其耗费算力的。
接下来的问题是,好吧,现在我们处于推理和测试时的扩展阶段,那之后是什么呢?
显然,我们现在已经创造了一个“代理人”(agentic person),这个代理人拥有我们已经开发出的大语言模型。但在测试期间,这个智能体系统会去进行研究、访问数据库、使用各种工具。它做的最重要的一件事是,衍生和孵化出一大堆子智能体(sub-agents)。这意味着我们现在正在组建庞大的团队。
为英伟达雇佣更多的员工,比单纯扩展我个人的能力要容易得多。
所以下一个缩放定律就是智能体扩展定律(agentic scaling law)。它有点像是在成倍地复制AI。
倍增AI,我们可以随心所欲地快速孵化出更多的智能体。
所以,我提出了四个缩放定律。
当我们使用智能体系统时,它们会产生更多的数据,创造大量的经验。对于其中一些,我们会说:“哇,这真的很好,我们应该把它记住。”
然后这些数据集会一路反馈回到预训练中。
我们将其记忆并泛化。接着我们对其进行微调,再回到后训练中。随后在测试时做进一步增强,并通过智能体系统推向整个行业。所以这个循环、这个周期会不断继续下去。归根结底就是一件事:智能的扩展将依赖于算力的扩展。
Lex Fridman 但这其中有一个棘手的问题,你必须去预判和预测。那就是其中一些组件需要不同类型的硬件才能真正达到最优效果。所以你必须预测AI的创新会走向何方。例如,混合专家模型(MoE)的稀疏性(sparsity)。
对于硬件,你不可能在一周之内说变就变。你必须提前预测它未来的样子。这种工作非常艰巨且可怕,对吧?
黄仁勋 说得太对了。
Lex Fridman 对于硬件的决策,你不可能随时掉头……
黄仁勋 举个例子。这些AI模型架构大约每六个月就会被发明出一次新的。而系统架构和硬件架构大约每三年才更新一次。
所以你需要预测两三年后可能发生的事情。
你可以通过几种方式做到这一点。首先,我们自己可以在内部进行研究,这就是为什么我们有基础研究、应用研究团队。
我们创建自己的模型。因此,这构成了我们所说的协同设计的一部分——我们自身就有第一手的实践经验。
同时,我们也是世界上唯一一家几乎与全球所有AI公司合作的AI公司。
因此,我们在尽最大努力,去感知人们目前正面临的挑战是什么。
Lex Fridman 所以你在倾听整个行业、各大AI实验室里的“低语”和风向。
黄仁勋 没错。你必须倾听并向每个人学习。
最后一点是,要拥有一个灵活的架构,能够随风而动、灵活适应。CUDA的优点之一就是,它一方面是一个令人难以置信的加速器,另一方面它又非常灵活。
所以这种平衡——令人难以置信的专业化(否则我们无法比CPU快)与通用性(以便我们能够适应不断变化的算法)之间的绝佳平衡,非常非常重要。这就是为什么CUDA一方面如此具有韧性,同时我们还能不断增强它。我们现在已经出到了CUDA 13.2。我们架构进化的速度之快,使我们能够跟上现代算法的步伐。
举个例子……当混合专家模型(MoE)问世时,那就是为什么我们推出了NVLink 72而不是NVLink 8。
我们现在可以把一个拥有4万亿、10万亿参数的完整模型放进一个计算域(computing domain)中,就好像它在单个GPU上运行一样。
大家可能没注意到,但我说过:如果你看看Grace Blackwell机架的架构,它完全是为了做一件事而设计的——处理大语言模型(LLM)。
突然之间,一年过去了,你现在看到的是Vera Rubin机架。
它配备了存储加速器。它拥有名为Vera的令人难以置信的新型CPU。
它有Vera Rubin和NVLink 72来运行LLM。它还有被称为Rock的新型附加机架。
所以这个整个机架系统与前一个完全不同,它里面装满了这些新组件。原因是,上一个系统是设计用来运行MoE大语言模型推理的。而这一个是为了运行智能体,智能体需要调用工具……
Lex Fridman 很显然,这个系统的设计必须在Claude Code、Codex、OpenClaw(注:疑为开源智能体项目如OpenDevin或OpenHands的口误)等工具出现之前就已经完成了。所以你基本上是在预测未来。
那这是怎么做到的?是来自于倾听风向,还是来自于理解所有最前沿技术的本质?
黄仁勋 不,比这简单。你只需要去推演(reason)。首先,你进行逻辑推演。
无论发生什么情况,那个大语言模型要想成为一个“数字员工”——让我们就用这个比喻——要让LLM成为数字员工,它需要做什么?
它必须能够访问基础事实。这就是我们的文件系统。它必须能够做研究。它并不全知全能。我不想等到这个AI变成了无所不知、掌握过去现在和未来的“全能神”之后才让它发挥作用。既然如此,我还不如让它去自己做研究。
很显然,如果它想帮我,它就得用我的工具。
很多人会说,“你知道,AI会彻底摧毁软件。我们不再需要软件了。我们甚至不再需要工具了。”这太荒谬了。我们来做个思想实验。
你可以坐在那儿,品一杯威士忌,思考所有这些事情,一切都会变得非常清晰。就像,如果我要在未来10年内创造出你能想象到的最神奇的智能体,假设它是一个人形机器人。如果这个人形机器人被创造出来,更有可能的情况是它走进我家,使用我现有的工具来完成它需要做的工作?还是说,它的手在某种情况下变成了一把10磅重的锤子,在另一种情况下变成了一把手术刀,而为了烧开水,它的手指能发射微波?或者是它直接用微波炉更合理?第一次走到微波炉前时,它可能不知道怎么用。但没关系。它连着互联网。它阅读微波炉的说明书,看完后瞬间成为专家。它就使用它。我认为我刚才描述的,实际上几乎涵盖了今天OpenClaw的所有特性。
它会使用工具,它会访问文件,它会做研究。它拥有I/O子系统。当你以这种方式进行推演后,你会说:“天哪,这对计算未来的影响太深远了。”原因在于,我认为我们刚刚重新发明了计算机。
然后你现在会问:“我们什么时候推演出那个的?我们什么时候推演出OpenClaw这种模式的?”如果你看看我在GTC大会上用过的OpenClaw图解,你会在两年前找到它。毫不夸张,两年前在GTC上,我谈论的智能体系统完全反映了今天的OpenClaw。
当然,许多事情的汇聚必须发生。首先,我们需要Claude、GPT等所有这些模型达到一定的能力水平。因此,它们的创新、突破和持续进步非常重要。
然后当然,必须有人创建一个足够强大、足够完整的开源项目,以便我们大家都可以将其投入使用。我认为OpenClaw对智能体系统所做的贡献,就像ChatGPT对生成式系统所做的贡献一样。我只是认为这是一件非常重要的事情。
Lex Fridman 是的,这是一个非常特别的时刻。我不太确定为什么它吸引了全球这么多的关注,但它确实做到了,甚至超过了Claude Code、Codex等。
黄仁勋 因为消费者可以接触到它。
Lex Fridman 当然,是的。但很多时候这也是一种氛围(vibes)。
之前我和Peter(可能指某位相关开发者或行业人士)做过一期播客,他是个很棒的人。所以一部分原因也在于代表这些事物的那些人。
黄仁勋 毫无疑问。
Lex Fridman 一部分是模因(memes),因为我们都在试图弄懂它。
当你拥有如此强大的技术,你如何交出你的数据让它们去做有用的事情,这其中有非常严肃和复杂的安全担忧。与此相关的也有很多可怕的事情。
我们,作为一种文明,作为个体人类和整体文明,正在试图弄清楚如何找到正确的平衡。
黄仁勋 是的,我们立刻就投入了这方面的工作,并派遣了一批安全专家。
我们做了一个叫OpenShell的项目。它已经被集成到了OpenClaw中。
Lex Fridman 英伟达还推出了NemoClaw。
黄仁勋 是的,完全正确。
Lex Fridman 它们的安装非常简单,并确保了安全性。
黄仁勋 我们赋予你三项权利中的两项。智能体系统可以访问敏感信息,它可以执行代码,它还可以与外部通信。在任何时候,如果你只赋予它这三项能力中的两项,而不是全部三项,我们就能保证安全。
除了这三选二的能力外,我们还根据企业赋予的任何权限为你提供访问控制。
然后我们将它与所有这些企业已经拥有的策略引擎连接起来。
所以我们将尽最大努力帮助OpenClaw变得更好。
Lex Fridman 你雄辩地解释了在历史上那些我们认为会成为阻碍的问题,最终我们是如何克服它们的。但现在展望未来,既然很明显智能体将无处不在,你认为现在的阻碍可能会是什么?我们显然需要大量的算力。那么限制规模扩展的阻碍将是什么呢?
黄仁勋 电力是一个令人担忧的问题,但不是唯一的问题。这就是为什么我们如此努力推进极端协同设计的原因,以便我们每年都能将每瓦每秒的Token生成量(tokens per second per watt)提升几个数量级。在过去10年里,摩尔定律大约能让计算进步100倍。而我们在过去10年里将计算能力提升并扩展了一百万倍。所以我们将通过极端协同设计继续这样做。能效,即每瓦性能(perf per watt),直接影响着公司的收入,影响着工厂的收入。我们将把能效推向极限,以便尽可能快地降低Token的成本。你看,我们的计算机价格在上涨,但我们的Token生成效率提升得快得多,所以Token的实际成本在下降。它正以每年一个数量级的速度下降。
Lex Fridman 所以电力,这是一个有趣的切入点。绕过电力限制的方法之一,就是通过提高“每瓦每秒Token数”,让它变得越来越高效。当然,还有一个问题是如何获得更多电力。
黄仁勋 我们也应该获得更多电力。
Lex Fridman 这非常复杂。你谈到过小型模块化核电站(SMR)。关于能源有各种各样的想法。AI供应链的瓶颈有多少让你夜不能寐?比如ASML(阿斯麦)的极紫外(EUV)光刻机,台积电的CoWoS等先进封装,以及SK海力士的高带宽内存(HBM)?
黄仁勋 一直都在操心,我们也一直在解决这些问题。历史上没有任何一家公司能够在我们这样的增长规模下,还在不断加速这种增长。这是不可思议的。
这甚至让人很难理解。
在整个人工智能计算领域,我们的份额还在增加。所以上下游供应链对我们来说非常重要。
我花了很多时间让我合作的所有CEO了解,是什么样的动态因素将导致这种增长继续甚至加速。这就是为什么在我主题演讲的右侧,坐着几乎整个IT上游行业的CEO和几乎整个下游基础设施行业的CEO。
有好几百位CEO。
我想以前从来没有任何一个主题演讲会有几百位CEO出席。部分原因在于,我在向他们讲述我们当前的业务状况。
我告诉他们近期未来的增长驱动力,以及正在发生的事情。我也描述了我们接下来要去哪里,这样他们就能利用这些信息和当前的动态来决定他们要如何投资。所以我像告知我的员工一样告知他们。
当然,之后我还会亲自去拜访他们,确保“嘿,听着,我希望你们知道这个季度、明年、后年,这些事情将会发生。”
如果你看看DRAM(动态随机存取存储器)行业的CEO们,之前世界上第一大DRAM用于数据中心CPU的是DDR内存。
大约三年前,我成功说服了几位CEO,尽管当时HBM(高带宽内存)的使用还非常少,而且几乎只有超级计算机才用,但这将成为未来数据中心的主流内存。起初这听起来很荒谬,但几位CEO相信了我,决定投资制造HBM内存。另一种放进数据中心显得相当奇怪的内存,是我们手机上使用的低功耗内存(LPDDR)。我们希望他们对这些内存进行改造,用于数据中心的超级计算机。他们说:“手机内存用在超级计算机上?”
我向他们解释了原因。现在看看这两种内存,LPDDR5和HBM4。需求量简直不可思议。所有这三家内存公司都创下了历史纪录年份,而这些都是有45年历史的公司。所以,这是我工作的一部分,去告知、塑造和启发。
Lex Fridman 所以你不仅仅是在具象化未来、启发英伟达内部的工程师,你还在具象化未来的供应链。所以你和台积电、ASML都在进行对话。
黄仁勋 上游,下游。
Lex Fridman 上游和下游。这正是关键所在。
黄仁勋 通用电气(GE)、卡特彼勒(Caterpillar)。是的,这属于我们的下游。
Lex Fridman 整个链条。我的意思是,这真的……
在整个半导体行业中发生了那么多极其困难的工程,供应链如此错综复杂,涉及的组件数不胜数,让人觉得有些可怕,但不知何故它确实运转良好。
黄仁勋 没错,深奥的科学。深度的工程设计,不可思议的制造工艺。我们大部分的制造已经由机器人完成,但我们仍有几百家供应商,他们提供的技术进入了我们包含130万到150万个组件的机架。每个机架有一百三、五十万个组件。在Vera Rubin机架上,有200家供应商。
Lex Fridman 有趣的是,你并没有把它列入让你夜不能寐的阻碍清单里。
黄仁勋 但我正在做一切必要的事情来……
Lex Fridman 好吧。
黄仁勋 ……对吧,看到了吗?我能安然入睡是因为我已经把它划掉了。我说,好吧,我要去睡了,我想,让我们来推演一下。对我们来说什么是重要的?
因为好吧,我们来推演一下。因为我们将系统架构从你记得的最初的DGX-I改成了NVLink-72机架级计算……这意味着什么?这对软件意味着什么?这对工程意味着什么?对我们的设计和测试方式意味着什么?这对供应链意味着什么?其中意味着的一件事是,我们把以往在数据中心进行的超级计算机集成工作,前置到了供应链中的超级计算机制造阶段。如果你这样做,你也必须意识到……如果你的数据中心总规模,假设你希望拥有50吉瓦(GW)并发运行的超级计算机,而且在供应链中制造这50吉瓦的超级计算机需要一周时间,那么每周在供应链中,超级计算机本身就需要1吉瓦的电力。所以我们将需要供应链增加电力的容量,以便在我发货之前,在供应链中对这些超级计算机进行构建和测试。
NVLink-72真的是在供应链里建造超级计算机,然后以每个机架两三吨的重量发货。
过去,它们都是作为零部件运来,我们再在数据中心里组装它们。但这现在是不可能了,因为NVLink-72的密度太高了。
所以这就是一个例子。我会飞到供应链所在的地区,去见我的合作伙伴说,“嘿,猜猜怎么着。这是我们以前制造DGX的方式,现在我们要用这种新方式来制造。这会好得多,因为我们在推理上需要它们。”推理市场正在来临。推理的拐点正在来临。这将是一个巨大的市场。
所以我首先向他们解释正在发生什么,为什么会发生,然后我要求他们每个人投入数十亿美元的资本投资。由于他们信任我,我也非常尊重他们,我给他们充分的机会来质疑我,我花时间向人们解释事情,我用第一性原理来推演。我画出图表并进行推理。当我跟他们谈完时,他们知道该怎么做了。
Lex Fridman 所以很多时候这关乎关系,关乎建立对未来的共同愿景。
但你担心某些瓶颈吗?我是说,供应链中最大的瓶颈是什么?你担心ASML的EUV设备吗?你担心台积电的CoWoS封装技术扩大产能的速度吗?就像你说的,你们不仅增长极快,还在加速增长。所以感觉供应链里的每个人都必须扩大规模。而那些当然是瓶颈。你在和他们探讨如何更快地扩大产能吗?你担心吗?
黄仁勋 不担心。
Lex Fridman 好的。
黄仁勋 因为我已经告诉了他们我的需求。他们明白了我的需求。他们也告诉我他们打算怎么做,而且我相信他们将要做的事。
Lex Fridman 很有趣。听到这个很高兴。那我们稍微在能源问题上停留一下。对于如何解决能源问题,你有什么期望?
黄仁勋 有一个领域,Lex,我很乐意在此讨论并把这个信息传递出去。你知道,我们的电网是为了“最坏情况”设计的,而且还留有一定的余量。但在99%的时间里,我们根本达不到最坏情况。因为最坏情况往往只发生在冬天的几天、夏天的几天以及极端天气里。大部分时间我们根本达不到那个水平,我们可能只在峰值负荷的60%左右运行。所以99%的时间里,我们的电网有剩余电力,这些电力就那样闲置着,但它们必须随时待命,以防万一。当需要的时候,医院必须有电,社会基础设施必须运转,机场必须运转等等。
所以我有一个疑问:我们能否让他们明白这一点,并制定合同协议、设计计算机架构系统和数据中心,使得当社会基础设施需要最大电力时,数据中心可以少用点电。
这种情况本来也非常罕见。在那个时候,我们既可以启用自己这一小部分的备用发电机,或者干脆让计算机把工作负载转移到其他地方,或者让计算机运行得慢一点。我们可以降低性能,减少电力消耗,并容忍稍长的响应延迟。所以我认为,这样使用计算机、建设数据中心,而不是期望100%的正常运行时间(Uptime)……
还有那些要求极其严格的合同,这给电网造成了很大的压力,因为他们现在不得不在峰值的基础上再增加容量。我只想使用他们闲置的多余电力。
它就在那里闲置着。
Lex Fridman 这一点确实没有被充分讨论。那么是什么阻碍了这件事?是监管?还是官僚作风?
黄仁勋 我认为这是一个三方共同的问题。它始于终端客户。终端客户对数据中心提出了永远不能宕机的要求。所以终端客户期望的是完美。
为了实现这种完美,你需要备用发电机和电网电力供应商的结合,来兑现完美的承诺。所以每个人都必须做到“六个九”(99.9999%的可用性)。
首先,我们应该确保所有的客户,包括CEO和客户们意识到他们到底在要求什么。我打赌数据中心运营团队里有些人和CEO是脱节的。我猜CEO都不知道这事。我会去和所有的CEO谈谈。CEO们可能根本没有关注他们签署的合同。每个人当然都想签一份最好的合同。他们去找云服务提供商(CSP),谈判的双方……我现在就能想象出那个场景。
他们在谈判这种多年期合同。双方都想要最完美的合同。结果,CSP随后也不得不去找电力公用事业公司,要求“六个九”的保障。所以我认为第一件事就是,确保终端客户和CEO意识到他们要求的代价是什么。
第二件事是,我们必须建立能够“优雅降级”(gracefully degrade)的数据中心。如果电力公司或电网告诉我们,“听着,我们不得不把你们的用电量降到80%”,我们会说,“这完全没问题。”
我们只要把工作负载转移一下就好了。我们会确保数据永远不会丢失,但我们可以降低计算速率并减少能源消耗。服务质量会稍微下降一点。对于关键的工作负载,我立刻把它转移到其他地方,这样我就没有问题了。比如转移到某个目前仍有100%正常运行能力的数据中心去。
Lex Fridman 在数据中心实现电力的智能动态分配,这是一个多难的工程问题?
黄仁勋 只要你能明确指定需求,你就能把它工程化。你说得很漂亮。
只要它在第一性原理上符合物理定律,我认为我们就没问题。
Lex Fridman 你刚才提到的第三件事是什么?
黄仁勋 第二件事是数据中心。第三件事是,我们需要电力公用事业公司也认识到这是一个机会。而不是说,“听着,我需要五年时间才能增加我的电网容量。”如果你愿意接受这种非100%保证级别的电力,我可以在下个月就为你提供,而且是这个价格。
所以,如果公用事业公司也提供更多分级的电力交付承诺,我认为每个人都会想清楚该怎么利用它。
现在的电网中浪费实在太多了,我们应该去解决它。
Lex Fridman 你高度赞扬了埃隆·马斯克(Elon Musk)和xAI在孟菲斯取得的成就——他们在创纪录的时间里,仅仅用了四个月就建成了Colossus超级计算机。目前它已有20万块GPU,而且还在快速增长。关于他的方法,有没有什么是你可以向其他数据中心建设者解释并提供启示的?他对待工程、对待整个建设管理流程的态度?
黄仁勋 首先,埃隆在许多不同的领域都钻研得很深。然而他同时也是一个出色的系统思考者。
所以他能够跨越多个学科进行思考,他显然会推动事物的极限,质疑一切:第一,这是必要的吗?第二,非得这么做吗?第三,非得花这么长时间吗?
他有能力质疑一切,直到把一切都精简到不能再减的最低限度。但同时,产品必要的功能仍然保留。他有着你能想象到的极致的极简主义,并且是在系统层面上做到这一点。另外,我非常欣赏的一点是,他会亲临一线。他会出现在行动的核心现场。
他就是会去那里。如果有问题,他会去现场说:“把问题指给我看。”当你把所有这些结合在一起时,你就能克服很多以前“我们一直都是这么做的”思维惯性。
比如“我还在等他们回复”。每个人都有很多借口。最后一件事是,当你个人以如此强烈的紧迫感采取行动时,它会促使其他所有人也带着紧迫感采取行动。每个供应商都有很多客户在跟进,每个供应商都有很多项目在进行,而他能做到让自己的项目成为其他所有人眼中的绝对最高优先级。他通过亲自示范做到了这一点。
Lex Fridman 我参加过几次那样的会议。看着真的很有趣,因为确实没有足够多的人会去问:“这能做得更快一点吗?怎么做?为什么非得花这么长时间?”
然后这往往就变成了一个工程问题。而且我认为,当你真正获得了第一手的真相……我记得有一次我和他在一起,他真的完整地走遍了如何把线缆插进机架的整个流程。他和一位在现场做这项工作的工程师一起,试图理解这个过程是怎样的,这样就能减少出错的可能。从拼装数据中心的每一项具体任务中建立起直觉……
你马上就能在微观细节和宏观系统的尺度上,感知到低效出在哪里,从而让它变得越来越高效。
加上你拥有巨大的话语权,可以说:“让我们用完全不同的方式来做,扫除所有可能的障碍。”
黄仁勋 完全正确。就是这样。
Lex Fridman 在英伟达采取“极端系统协同设计”的方法中,你觉得和埃隆对待系统工程的方法有相似之处吗?
黄仁勋 首先,协同设计就是一个终极的系统工程问题。所以我们对待工作的方法,首先就是从这个角度出发的。
我们做的另一件事——这是一种哲学、一种思想、一种心态,我想,或者说是一种方法。我从30年前就开始了,它被称为“光速原则”(the speed of light)。光速不仅仅指速度。光速是我的一个简写,意思是物理学能做到的极限是什么。
所以我们所做的每一件事,都会与“光速”(物理极限)进行对比。内存速度、数学计算速度、功耗、成本、时间、精力、人员数量、制造周期时间。
当你考虑延迟与吞吐量时,当你考虑成本与吞吐量、成本与容量时,你会分别针对光速(物理极限)来测试所有这些不同的约束条件,看如何达到这每一个单独的极限。然后当你综合考虑时,你知道必须做出妥协,因为一个实现极低延迟的系统,和一个实现极高吞吐量的系统,在架构上有着根本的不同。
但你想知道,实现高吞吐量系统的光速极限是多少,实现低延迟系统的光速极限又是多少?
然后当你思考整个系统时,你就可以进行权衡取舍。所以我强迫每个人在做任何事情之前,都要去思考第一性原理、思考极限——物理极限。我们用它来测试一切。所以这是一种很好的思维框架。
我不喜欢另一种方法,也就是“持续改进”(continuous improvement)。
持续改进的问题在于……
首先,你应该从第一性原理出发,以光速思维去设计某个东西,只受物理定律的限制。在此之后,你当然可以随着时间的推移去改进它。但我不喜欢面对一个问题时,有人说,“嘿,我们现在做这件事需要74天。”
“现在需要74天,我们可以为你改进到72天完成。”
我宁愿把它全部推倒归零……
然后说,“首先,你给我解释一下为什么一开始需要74天。
让我们来看看今天什么是可能的。如果我要完全从头开始建,需要多长时间?”
通常,你会很惊讶,结果可能只要6天。
那么剩下的那68天(74减6)可能是经过充分论证的妥协、成本的降低以及各种各样的其他因素。但至少你知道它们分别是什么。
既然你知道6天是可能的,那么从74天降到6天的对话,就会变得出人意料地有效。
Lex Fridman 在你们处理的极其复杂的系统中,简单性有时是一个好的启发式指标吗?我的意思是……
你发布的Vera Rubin计算集群简直令人难以置信。我们在讨论7个芯片、7种芯片类型、5个专用的机架类型、40个机架、1.2千万亿个晶体管、近20,000个英伟达芯片裸片、超过1,100个Rubin GPU,60 exaflops的算力,以及每秒10 PB的扩展带宽。
那还只是一个……
黄仁勋 那只是一个集群(pod)。
Lex Fridman 那仅仅是一个集群。
所以你还有……即使单单是NVL 72机架本身,就有130万个组件,1300个芯片,4000条线缆塞进一个19英寸宽的机架里。
黄仁勋 而且Lex,我们大概每周需要生产大约200个这样的集群,这就让你有个直观的概念了。
Lex Fridman 面对如此庞杂的组件数量,我想“简单”是不可能的,但在努力设计事物时,你们会追求这个指标吗?
黄仁勋 我最常用的一句话是,我们需要事物“尽可能简单,但又必须足够复杂以满足需求”。所以问题是,那些复杂性都是必要的吗?我们应该对此进行检验。我们要去挑战这一点。在通过必要性检验之后,任何多余的东西都是毫无意义的。
Lex Fridman 但这仍然让人觉得不可思议。整个半导体行业都是如此,但英伟达正在做的,是历史上最伟大的工程之一。这些系统真的是名副其实的工程奇迹。
黄仁勋 这是世界上制造过的最复杂的计算机。
Lex Fridman 工程团队,真的是……虽然这不是在比赛,但如果有一个工程团队的奥运会,台积电当然在做不可思议的工程,还有ASML在各个尺度上也是,但英伟达绝对是他们的强劲对手。简直不可思议,令人难以置信的团队。
黄仁勋 这可以说是每一个单项运动的金牌得主,全都聚集在这里了。
Lex Fridman 而且他们必须协同工作。而且直接向你汇报汇报。这太棒了。你最近去了中国。所以问问你关于中国的问题很有意思。中国在建立其科技产业方面取得了难以置信的成功。根据你的理解,中国是如何在过去10年里建立了这么多令人惊叹的世界级公司、世界级工程团队,以及生产出如此多不可思议的产品的科技生态系统的?
黄仁勋 有很多原因。首先,让我们从一些事实开始。世界上50%的AI研究人员是中国人(大概是这个数字),而且他们大部分仍在中国。我们这里也有很多,但在中国依然有令人惊叹的研究人员。
他们的科技产业在极其正确的时间崛起了。
在移动互联网和云计算时代,他们贡献力量的方式是软件。这是一个数学和科学基础极其扎实的国家,孩子们受过非常良好的教育。他们的科技产业是在软件时代建立起来的。他们对现代软件非常熟悉。
中国并不是一个单一的、铁板一块的经济体。它有许多省份和城市,市长们都在相互竞争。这就是为什么有那么多的电动车(EV)公司。这就是为什么有那么多的AI公司。这就是为什么你能想到的每一类公司,他们都会涌现出一批。结果就是,他们内部有着极其疯狂的竞争。
而最终留存下来的,就是令人难以置信的公司。
他们还有一种社会文化,那就是家庭第一,朋友第二,公司第三。所以,他们之间来回交流的数量……他们实际上几乎一直处于开源状态。
所以,他们对开源贡献更多是合情合理的,因为他们可能在想:“我们在保护什么呢?”你知道,我的工程师,他的兄弟在那家公司,他的朋友在另一家公司,而且他们都是同学。你知道,“同学”这个概念。一日同学,终生兄弟。所以他们分享知识的速度非常、非常快。
因此没有必要把技术藏着掖着。不如直接把它开源。于是开源社区进一步放大、加速了创新的过程。所以你获得了这个组合:出色的人才,由于开源和朋友间天性带来的快速创新,以及极其疯狂的竞争。在公司之间激烈角逐后,脱颖而出的就是不可思议的东西。所以这是当今世界上创新最快的国家。刚才我说的每一件事,从孩子们是如何成长、他们接受了优质教育、父母希望他们在学校表现优异,到他们的文化基因,这些都是这个国家的基本盘。而他们恰好在技术经历指数级爆发的时代抓住了机遇。
Lex Fridman 而且从文化上讲,当一名工程师是一件很酷的事。这与你提到的所有要素都紧密相连。
黄仁勋 这是一个“建造者(builder)”的民族。
Lex Fridman 是一个建造者的民族。
黄仁勋 是的,一个建造者的民族。我们国家的领导人不可思议,但他们大多是律师。因为我们国家为了保障大家的安全、法治和治理。而他们国家是在一穷二白中建设起来的。所以他们大多数的领导人是令人惊叹的工程师。一些最聪明的大脑。
Lex Fridman 稍微扯远一点,因为你提到了开源,我必须在这里提一下Perplexity,你一直很喜欢它。
黄仁勋 我很喜欢,是的。
Lex Fridman 也感谢你们发布了开源的Nemotron 3 Super(注:可能指Nemotron-4 340B等开源模型),你也可以在Perplexity里面使用它来查资料。这是一个1200亿参数的开源权重MoE模型。你对开源的愿景是什么?你提到了中国,像DeepSeek和MiniMax等公司,都在真正推动开源AI运动。而英伟达也在接近SOTA(当前最佳水平)的开源大语言模型中引领道路。你在这方面的愿景是什么?
黄仁勋 首先,如果我们想要成为一家伟大的AI计算公司,我们必须了解AI模型是如何演进的。我喜欢Nemotron 3(注:原音如此)的一点是,它不仅是一个纯粹的Transformer模型,它是Transformer和SSM(状态空间模型)的结合。我们在开发渐进式GAN(生成对抗网络)时就很早就涉足了,这随后一步步演变为了扩散模型(Diffusion)。所以,我们在模型架构和不同领域进行基础研究这一事实,使我们能够洞察未来模型需要什么样的计算系统。所以这是我们极端协同设计策略的一部分。
其次,我认为我们理智地认识到,一方面,我们希望作为产品提供世界级的模型,而且它们应该是专有的闭源模型。另一方面,我们也希望AI能够渗透到每个行业、每个国家、每个研究人员和每个学生中。如果一切都是专有闭源的,那么进行研究、在它之上、周围或结合它进行创新就会很困难。所以,开源对于许多行业加入AI革命来说是根本必要的。
英伟达拥有这样的规模,我们也有足够的动机去构建并持续构建这些AI模型。所以因此,我们应该这样做。我们可以开放,我们可以激活每一个行业、每一个研究人员、每一个国家去加入AI革命。
第三个原因,是认识到AI不仅仅是语言。这些AI可能会使用基于其他信息模态训练的工具、模型和子智能体。也许是生物学、化学,或者是物理定律,或者是流体力学和热力学,并不是所有的东西都是语言结构。因此,必须要有人去确保天气预测、生物学AI、物理AI等所有这些领域能够被推向极限,推向科学的最前沿。
我们不造车,但我们想确保每一家汽车公司都能获得伟大的模型。我们不研发新药,但我希望确保礼来(Lilly)拥有世界上最好的生物学AI系统,这样他们就可以用它来发现药物。
由于这三个基本原因:认识到AI不仅是语言,认识到AI非常广泛;我们希望让每个人都参与到AI世界中;以及出于AI软硬件协同设计的需求。
Lex Fridman 我必须再次说,谢谢你们开源,真正开源了Nemotron 3,并且……
黄仁勋 我很感激你能这么说。我们开源了模型,开源了权重,开源了数据,开源了我们是如何创建它的。是的,这相当了不起。
Lex Fridman 这真的不可思议。你最初来自台湾,并且与台积电有着密切的关系。所以我不得不问,台积电我认为也是一家极具传奇色彩的公司。无论是其工程团队,还是他们在半导体领域所做的令人惊叹的工程工作。你是如何理解台积电的文化和他们的方法的?这解释了他们是如何能够在涉及半导体的方方面面取得这种独一无二、无与伦比的成功的?
黄仁勋 首先,外界对台积电最深的误解就是,认为他们的“技术”就是他们的全部。以为他们不知怎么就拥有了一种非常棒的晶体管,如果有人拿出了另一种更好的晶体管,游戏就结束了。
不仅是技术本身——当然,我指的不仅仅是晶体管,还有金属化系统、封装、3D封装、硅光子学,以及他们拥有的所有其他技术。这些技术确实是让这家公司与众不同的原因。
但他们还有一种非凡的能力。那就是当全球数百家公司的需求不断动态变化时——产量上升、下降、增加、减少、推迟、提前、不同客户之间切换、晶圆开始生产、停止生产、紧急投片等等——他们能够去调度、编排这世上最复杂的动态需求。面对这种瞬息万变的复杂世界,他们不知为何总能运行着一家高吞吐量、高良率、成本极佳且提供卓越客户服务的工厂。
他们非常认真地对待自己的工作,认真对待他们的承诺。他们知道自己在帮助你运营你的公司。当承诺晶圆什么时候交货,晶圆就会准时出现,这样你就能顺利运营你的公司。因此,他们的系统,他们的制造系统,我认为完全是一个奇迹。
第二件事是他们的文化。这种文化一方面极其注重技术,不断推进技术;同时另一方面又极其以客户服务为导向。很多公司非常注重客户服务,但他们并没有最顶尖的技术;也有很多公司处于技术的最前沿,但他们并不是最好的客户服务导向型公司。不知为何,台积电在这两者之间取得了完美的平衡,并且在两方面都是世界级的。
可能第三件事,也是我最看重他们的一项技术,就是他们创造了一种叫做“信任”的无形资产。我信任他们,敢把我的公司托付在他们之上。这是一件非常重大的事情。
Lex Fridman 当你说信任时,我的意思是,你们建立了一种非常密切的关系,这种信任是建立在多年的业绩基础上的,但这其中也涉及到人与人之间的关系。
黄仁勋 三十年来,我不知道我们通过他们做了几百几千亿美元的业务,而我们甚至没有签过合同。这太棒了。
Lex Fridman 太惊人了。有一个故事……说在2013年,台积电创始人张忠谋曾给你提供成为台积电CEO的机会。而你说你已经有工作了。这个故事是真的吗?
黄仁勋 故事是真的。我没有敷衍他。我深感荣幸。当然我也知道,现在我也依然知道,台积电是历史上最具影响力的公司之一。而张忠谋是我一生中遇到过的最受尊敬的高管,也是我在商业和私交上最好的朋友之一。
他能向我提出这个邀请,我感到非常谦卑,也非常荣幸。但是,我在这里所做的工作非常重要,而且我在脑海中已经看到了英伟达将成为什么样的公司,以及我们能够产生的影响。这是一项极其重要的工作。而且,让这件事成为现实是我唯一的责任。所以我拒绝了。不是因为那不是一个难以置信的邀请。那是一个不可思议的邀请,但我实在无法接受。
Lex Fridman 我认为英伟达和台积电都是人类文明史上最伟大的两家公司。管理这两家公司中的任何一家,我敢肯定都是极其复杂的工作,并且需要你全身心投入。不仅仅是在CEO层面,在每一个层级,每个人都必须真正“全押(all in)”,才能完成这种复杂性。
黄仁勋 是的。毫无疑问。所以现在我能同时帮助这两家公司了。
Lex Fridman 完全正确。英伟达现在是世界上最有价值的公司。我不得不问,正如科技界人士所说的,英伟达最大的“护城河”是什么?你们拥有的能够保护你们免受竞争的优势是什么?
黄仁勋 我们作为一家公司最重要的资产,是我们计算平台的装机量(install base)。我们今天最重要的一点是CUDA的装机量。
20年前,当然没有所谓的装机量。如果今天有人想出了一个叫GUDA或TUDA的东西,那也无济于事。原因在于,这从来不仅仅关乎技术。当然,技术本身具有不可思议的前瞻性。但这更关乎公司致力于此、坚持不懈、不断扩大其影响范围。让CUDA成功的不是三个人,而是43,000名员工。以及数百万信任我们、相信我们会继续打造CUDA 1、2、3、13的开发者,他们决定将自己如山般的软件移植并致力于建立在我们的平台之上。所以装机量是最首要、最重要的优势。
当你把这个装机量与我们在现在这种规模下的执行速度结合起来时——历史上从未有任何公司制造过这种复杂程度的系统,绝对没有。而且每年更新一次更是天方夜谭。
那种速度与装机量结合在一起。从开发者的角度来看,如果我支持CUDA,明天它就会变得好10倍,我平均只需要等六个月。不仅如此,如果我在CUDA上开发,我就能触达几亿用户和计算机。我能进入每一朵云,进入每一家计算机公司,进入每一个行业,进入每一个国家。
所以,如果我创建一个开源包并首先把它放在CUDA上,我能同时获得这两个好处。而且,我100%信任英伟达会让CUDA继续存在,并维护它、改进它,只要他们还在,就会一直优化库。
这一点你可以绝对放心。这最后一部分就是“信任”。你把所有这些东西放在一起,如果我今天是一个开发者,我会首先锁定CUDA。我会最多地针对CUDA进行开发。
这就是我认为归根结底,这是我们最重要的核心优势。第二个优势是我们的生态系统。
事实上,我们将这个极其复杂的系统进行了垂直整合,但我们又水平地将其整合到每一家公司的计算机中。
我们在谷歌云,在亚马逊AWS,在微软Azure。我们现在正在疯狂地扩大AWS的规模。我们在CoreWeave和Nscale等新公司中。我们在礼来(Lilly)的超级计算机中。我们在企业的计算机中。我们在无线基站的边缘计算中。我的意思是,这太疯狂了。一个架构存在于所有这些不同的系统中。我们在汽车里,在机器人里,在卫星里,在太空中。所以当你拥有这一个统一的架构,并且生态系统如此广泛,它基本上覆盖了世界上每一个行业。
Lex Fridman 那CUDA的装机量未来将如何演变,以AI工厂作为护城河?你认为未来的英伟达可能全是关于AI工厂的吗?
黄仁勋 对我们来说,计算的基本单位曾经是GPU。后来变成了一台计算机,然后变成了一个计算集群。现在,它是一个完整的AI工厂。当我看到计算机时,当我看英伟达制造的东西时,在过去,我会脑海里浮现出一块芯片。
当年我宣布新一代产品时,比如“女士们先生们,今天我们发布安培(Ampere)”,我会举起那块芯片。
那是我当时对自己所做之事的“心智模型”(mental model)。今天,我不会再……单纯举起一块芯片,虽然看起来有点可爱。但那很可爱,却不再是我正在做的事情的心智模型了。我心智中的模型是这个连接到电网、拥有发电设备的几千兆瓦的巨型怪物。它有冷却系统和不可思议的庞大网络系统。有一万人在这里试图安装它,数百名网络工程师在里面工作,背后有成千上万的工程师在努力让它启动。
你知道,启动这样一座工厂,绝不是某个人按个开关说“好了,它开了”。这需要成千上万人的共同努力才能让它运转起来。
Lex Fridman 所以在心理层面,你实际上……当你思考单个计算单位时,你现在每晚睡觉前脑海里想的真的是一大批机架的集合,是计算集群,而不是单个芯片?
黄仁勋 是整个基础设施。我希望我的下一次跨越是,当我思考制造计算机时,它将是行星级的(planetary scale)。那会是下一个维度。
Lex Fridman 那你怎么看待埃隆·马斯克提到的太空概念?在太空进行计算,以解决能源扩展上的一些难题。
黄仁勋 散热问题可不容易解决。
Lex Fridman 散热,是的,这涉及大量的工程复杂性。所以,英伟达也宣布了你们已经开始考虑这个问题。
黄仁勋 是的,我们已经在太空了。英伟达的GPU是太空中首批GPU之一。
我都不知道,这太有趣了……如果早知道我可能早就宣布了。我们已经在太空了。在我们的某一块GPU上,还画着一个小宇航员的图案呢。
但我们确实已经在太空了。那里是进行大量图像处理的理想之地。
因为那些卫星拥有分辨率极高的成像系统,它们现在正持续不断地扫描地球。你需要厘米级的连续成像,这样你基本上就能拥有世界上一切事物的实时遥测数据。你不想把那么多PB级的数据传回地球。你必须在边缘(太空)就地进行AI处理,丢弃所有不需要的、之前看过的、没发生变化的东西,只保留你需要的内容。所以AI必须在边缘运行。
显然,如果我们把它们放在两极,我们就有24/7全天候的太阳能。但是,太空中没有热传导,没有热对流。所以你几乎只能靠热辐射。但太空很大,我想我们只需在外面放上巨大的散热器就行了。
Lex Fridman 你觉得这个想法有多疯狂?这是5年、10年还是20年后的事?我们在讨论AI扩展的阻碍因素。
黄仁勋 我更务实。我首先会去寻找我下一个能抓住的机会点在哪里。同时,我也在培育太空的项目。所以我派工程师去解决这个问题。我们开始了解很多。我们如何处理辐射?如何处理性能衰退?我们如何处理缺陷的持续测试和验证?我们如何处理冗余设计?我们如何优雅地降级运行,等等。至于软件呢?你如何考虑太空中的软件、冗余和性能?你要让计算机永远不会崩溃,只会变慢。所以我们可以提前开始进行大量的工程探索。但在此期间,我最喜欢的答案还是消除地球上的浪费。我们有那么多闲置的电力,我想尽快利用它们。
Lex Fridman 是的,地球上有很多触手可及的果实,我们可以利用它们来进行AI扩展。
(Lex在此处穿插了对赞助商的口播广告,根据要求翻译略过)
Lex Fridman 你认为英伟达未来某天市值可能达到10万亿美元吗?
或者我换个问法:要让这一点成为现实,未来的世界会是什么样子?
黄仁勋 我认为英伟达的增长是极有可能的,在我的脑海中也是不可避免的。让我解释一下为什么。我们已经是历史上最大的计算机公司了。单单这一点就应该让人问一句,为什么?
原因,当然是两个根本的技术原因。第一个原因是,计算已经从基于信息检索(retrieval-based)的系统转变了。以前,几乎所有东西都是一个文件……我们预先写好一些东西,预先录制一些东西,我们画一些东西,放在网络上,存在文件里。我们使用推荐系统或某种智能过滤器,来为你找出要检索的内容。所以我们是一个“人类预先录制、文件检索”的系统。这很大程度上就是传统计算机的定义。
而现在,AI计算机具有上下文感知能力,这意味着它必须实时处理和生成Token。在这个新世界中,我们将需要比旧世界多得多的处理能力。在旧世界我们需要大量的存储。在这个新世界我们需要大量的计算。所以,这是第一部分。我们彻底改变了计算以及计算的方式。唯一会导致倒退的情况是,这种在有新的洞察基础之上实时生成具有上下文和情境感知信息的计算密集型方法,最终被证明无效。如果在过去研究深度学习的10年、15年中的任何一个时刻,我得出结论:“你知道吗?这行不通。我认为这是一条死胡同。”或者“它无法扩大规模,无法解决这种模态问题,无法在这种应用中使用。”那么当然,我的看法会完全不同。但我认为过去五年给了我比之前十年更多的信心。
第二个想法是,过去计算机很大程度上是一个存储系统,像一个仓库。我们现在正在建造工厂。仓库赚不了多少钱。而工厂与公司的收入直接相关。所以,计算机不仅改变了运作方式,它在世界上的用途也变了。它不再只是一台计算机,它是一座工厂。
它是一座用于创造收入的工厂。我们现在不仅看到这座工厂在生成人们想要消费的产品、商品,我们还看到这些商品是如此有趣、如此有价值,对如此多的受众有用,以至于Token本身开始像iPhone一样细分了。
你有免费的Token,有高级(Premium)的Token,中间还有好几个档次的Token。
由于事实证明智能是一种可扩展的产品,有一些极高智能的产品、Token可以用于专业领域,人们愿意为此付费。有人愿意为每一百万个Token支付1000美元的想法就在眼前。这不再是“如果”的问题,只是时间问题。所以现在我们看到,这座工厂生产的商品实际上是有价值的,是能产生收入和利润的。
现在的问题是,世界需要多少座这样的工厂?世界需要多少个Token?社会愿意为这些Token支付多少钱?如果生产力得到如此显著的提升,世界经济会发生什么?我们将发现新药、新产品、新服务吗?
当你把这些综合起来看时,我绝对确信全球的GDP增速将会加快。
我绝对确信,GDP中用于计算的百分比将比过去高出100倍。因为它不再是一个存储单元。它是一个产品生成单元。
所以当你在那个背景下来看待这个问题,然后你倒推回来看,英伟达是做什么的,我们在这种新的经济学、新的产业中能获得多大收益并解决多少问题时,我认为我们将变得大得多得多。
然后对我来说剩下的问题就是,英伟达有可能在不久的将来成为一家收入达到3万亿美元的公司吗?答案当然是肯定的。原因在于,它不受任何物理极限的限制。我没看到任何东西表明“天哪,3万亿美元是不可能的。”而事实上,英伟达供应链的负担是由200家公司分担的。
我们在整个生态系统合作伙伴的支持下向外扩展,问题是我们有足够的能量去这样做吗?我们肯定会有能量去这样做的。所以所有这些结合起来,10万亿那只是一个数字。
我还记得,英伟达第一次营收超过10亿美元时,让我想起了一位CEO曾告诉我:“黄仁勋,一家无晶圆(fabless)半导体公司的收入在理论上是不可能超过10亿美元的。”我就不拿原因烦你了,但事实证明这当然不符合逻辑,而且有很多证据表明我们并非如此。
后来,有人告诉我,“黄仁勋,你们的营收永远不会超过250亿美元,因为某个其他公司的存在。”这些都不是基于第一性原理的思考。思考这个问题的简单方法是:我们制造的是什么?我们能创造的机会到底有多大?英伟达做的不是抢占市场份额(market share)的生意。刚才我谈到的几乎所有东西目前都还不存在。这才是困难的部分。
如果英伟达是一家努力争取市场份额的100亿美元公司,那股东们很容易看懂:哦,如果他们能抢到10%的份额,他们就能变得这么大。但人们很难想象我们能变得多大,因为我根本没有可以去抢份额的现成对象。
所以我认为这对世界来说是一个挑战:对未来的想象力。但我有的是时间,我会继续推演,我会继续谈论它。每一次GTC大会它都会变得越来越真实。然后越来越多的人会谈论它。总有一天,我们会到达那里的。但我100%确定我们会到达那里。
Lex Fridman 是的,这种关于“Token工厂”的视角,本质上就是每瓦每秒产生的Token,而且每一个Token都有价值。它是一样真正能带来价值的东西,并给不同的人带来不同种类、不同数量的价值。Token本身其实就是实际的产品。所以你会拥有一大堆的Token工厂。而且从第一性原理出发非常容易想象,考虑到AI能解决的潜在问题,你将会需要呈指数级增长的Token工厂。
黄仁勋 真正有趣的是,为什么我对此感到如此兴奋,因为Token领域的“iPhone”已经到来了。
Lex Fridman 你管它叫什么?等等,你是说OpenClaw是iPhone?这很有趣。
黄仁勋 我是指智能体(Agents)。
Lex Fridman 是的,智能体。确实。
黄仁勋 总体而言是智能体。Token领域的iPhone到来了。这是历史上增长最快的应用。它直线上升。真的是直线上升。
Lex Fridman 这很能说明问题。
黄仁勋 是的,毫无疑问OpenClaw就是Token领域的iPhone。
Lex Fridman 从去年12月左右开始,是不是真的有一些特别的事情发生了?人们真的觉醒并意识到了Claude Code、Codex、OpenClaw的威力。
说实话,有些不好意思承认,在来这里的路上,在机场,这是我第一次在公开场合这么做:我通过对着笔记本电脑说话来进行编程。
我感到有些尴尬,因为我是在假装和一位人类同事交谈。我不太确定我对未来每个人都走来走去跟他们的AI说话有什么感觉,但这确实是一种极其高效的完成工作的方式。
黄仁勋 而且更可能的是,你的AI会一直在打扰你。原因是它完成工作的速度太快了。它会向你汇报:“那个我做完了。你接下来想让我做什么?”大多数人没有意识到的一点是:未来跟他们聊天、发短信最频繁的,将是他们的“Claws”(智能体)或其他AI。
Lex Fridman 这是一个多么不可思议的未来。我读到过,你将你的很多成功归因于你比任何人都更努力工作的能力,以及比任何人都更能忍受苦难的能力。
这个旅程包含了许多东西。面对失败、应对成本和我们在上面谈到的工程问题。人为的问题、不确定性、责任、疲惫、尴尬,以及你提到过的几次公司濒临倒闭的生死时刻。
当然还有压力。现在,作为这家公司(许多经济体和国家都在围绕其制定战略、规划财务分配和AI基础设施)的CEO,你是如何应对如此巨大的压力的?考虑到有这么多国家和人民依赖你,是什么赋予了你力量?
黄仁勋 我意识到,英伟达的成功对美国非常重要。我们创造了巨额的税收。我们确立了我们国家的技术领导地位。技术领先对国家安全至关重要,不仅是在国家安全的某一方面,而是所有方面。当我们国家更加繁荣时,我们在国内政策和社会福利方面也能做得更好。因为我们在美国推动了大量的再工业化,我们创造了堆积如山的工作岗位。我们正在帮助把制造工作转移回美国——在那么多的工厂、芯片、计算机,当然还有这些AI工厂里。
我完全清楚,而且我很荣幸——这也是一份真正的礼物:许多普通投资者、老师、警察,不知何故投资了英伟达,或者因为看了Jim Cramer的节目买了一些股票,现在成了百万富翁。我完全知道这种情况。我也知道,英伟达在支持我们和处于我们下游的巨大生态系统网络中处于核心地位。
所以我应对这种压力的方式,就像我刚才做的那样。我去推演我们正在做什么?它导致了什么?它对其他人产生了什么影响?是积极的益处,还是甚至带来了巨大的负担?比如对供应链。
那么接下来的问题就是,你打算怎么做?在我感受到的几乎所有事情中,我都会将它拆解,然后推演:“好的,现在的情况是什么?发生了什么变化?难点在哪里?我要怎么做?”我把问题拆解开来,这些情况就被分解成了我能去着手处理的、可管理的事情。
之后我唯一能问自己的就是:“你做了吗?是你自己去做了,还是你找人去做了?如果你没做,你推演出你需要做但你没做,你也没找别人去做,那就别再为了它哭哭啼啼了。”懂吗?
所以我对自己相当严厉。但同时我也会把事情拆解开,这样我就不会恐慌。我能安然入睡,因为我已经列出了需要做的事情清单。而且我确保了:任何可能将我们公司置于危险境地、将我的合作伙伴置于危险境地、将我们行业置于危险境地的事情,我都已经告诉了某个人。任何我觉得可能让任何人受到伤害的事情,我都告诉了能够解决这个问题的人。所以我们要么把话说开了,要么已经在采取行动了。做完这些之后,Lex,你还能做什么呢?
Lex Fridman 考虑到在建立英伟达的旅途中遭受过极其巨大的痛苦,你在心理上跌入过谷底吗?
黄仁勋 哦,是的。哦,是的。当然。一直都有。一直都有。
Lex Fridman 在那种时候,你就把问题分解成片段?看看你能做些什么?
黄仁勋 是的。而且你知道,Lex,有一部分其实是关于“遗忘”(forgetting)。如你所知,AI学习最重要的属性之一,就是系统性遗忘。你需要知道什么时候该忘掉一些东西。你不能记住一切。你不能保留一切,你不想背负一切。我能非常迅速做到的事情之一,就是分解问题,推演问题,并分担负载。当我说告诉所有人时,我其实就是尽快地在分担那个重担。无论什么让我担心,告诉别人。不要只憋在心里。当然不要吓到他们。将问题分解成更小的部分,让人们去处理,并激励他们能够为此采取行动。
但其中一部分就是单纯的遗忘。你必须对自己狠一点。像是,“别再为此哭泣了。我们继续前进吧。”然后你起床。另一方面是,你会被下一个闪耀的光芒、下一个未来、下一个机遇吸引,“那个已经过去了。接下来是什么?”
我想你会在伟大的运动员身上看到这一点。他们只操心下一个球。上一个失球已经过去了。尴尬、挫折,然后,因为我的很多工作都是公开进行的。Lex,你的很多工作也是公开进行的。所以我公开做很多工作,会说很多当时看起来合理或有趣的话,很多时候只是因为当时我觉得很好笑。后来反思起来,可能没那么好笑。但是……
Lex Fridman 是的,相信我,我懂。但你基本上让自己被未来的光芒所牵引。忘掉过去,继续向着那个目标努力。我的意思是,你曾经说过一句相当有名的话:如果你知道建立英伟达会变得如此艰难——你发现它比你预期的要难一百万倍——你当年就不会去做它。
黄仁勋 是的。
Lex Fridman 但我听到这句话时,觉得这大概适用于一切值得做的事情,对吧?
黄仁勋 完全正确。顺便说一句,我当时试图解释的是,拥有一颗孩子般的心智,其实是一种不可思议的超能力。当我看着某件事情,几乎所有事情时,我脑海中冒出的第一个念头往往是:“这能有多难?”
你让自己进入那种模式——“这能有多难?”即使从来没有人做过。它看起来庞大无比。它要花费数千亿美元。它需要花费所有的这些时间。但你只是觉得,“这能有多难?”
你必须让自己进入那种心态。你不想提前过度模拟一切可能发生的挫折、苦难和失望。你不想提前知道那些。你希望带着一颗清新的心进入一段新经历,认为它会是完美的,它会很伟大,它会极其有趣。而在你身处其中时,你需要有耐力、有毅力。所以当挫折真的发生时,当那些令你吃惊的失望、尴尬和羞辱发生时。你不能让……这时候你只需要打开另一个开关,那就是忘掉它。继续前进,保持移动。
某种程度上,只要我对未来的假设以及未来为何会显现的原因——只要这些假设和输入条件没有发生实质性的变化,那么我就应该预期输出也不会改变。因此,我模拟出的未来仍然会发生。如果它仍然会发生,我就会继续追求它。我仍然相信它,所以这是两三种人类特征的结合:带着清新心态进入新体验的能力;忘记挫折的能力;相信自己、坚守信念的能力,但同时你也在不断重新评估。我认为这三四五件事的结合对韧性非常重要。我很幸运,不管是什么生活经历导致了这一点,我恰好具备了这些特征。我总是充满好奇心,总是在学习。
我总是在向每个人学习。而且因为我对一切都很谦卑,我总是在想:“天哪,他们做得太漂亮了。他们做得太奇妙了。”我想知道他们在思考什么?他们是怎么做到的?所以我在模拟所有人。在很多方面,我在模仿我观察到的几乎每一个人。你对他们所做的事情充满同理心,并且充满敬意。所以你在不断学习。
Lex Fridman 你现在是地球上最富有的人之一。也是地球上最成功的人类之一。保持谦卑会不会变得更难?你是否感受到金钱、权力和名望的影响,让你在自己的脑海里更难接受“我是错的”?让你更难去听取不同意你的人的意见并向他们学习?
黄仁勋 令人惊讶的是,并没有。实际上我刚好相反。因为我的大部分工作都是公开进行的,所以当我犯错时,几乎所有人都能看到。
Lex Fridman 你被迫保持谦卑了。很公平。
黄仁勋 当我犯错时,或者事情没有按预期发展时,我在外面说的大部分事情我都是相当确定的。原因在于,那会影响到其他人,我想对此保持非常严谨和周到的态度。但对于我在内部会议上推演的事情,很多都可能有不同的走向。但这从来不会阻止我去推演。我管理和领导的方式是,我不断在人们面前进行推演。即使在我和你交谈时,你也能看到我正在理清思路。
我想确保你理解我说的话,不是因为我命令你,而是因为我对我即将告诉你的事情保持极度谦卑。我试图向你展示我得出结论的步骤。然后你可以自己决定最后是否相信我说的话。我整天都在会议中这么做。对我的所有员工,我都在不断推演:“让我告诉你我是怎么看的。”然后我进行推演。这给了每个人插话的机会说:“我不同意那一部分。”
这种推演过程并让人们参与互动的美妙之处在于,他们不需要直接否定你的最终结论。他们可以不同意你的推理步骤。他们可以把我拉向不同的方向,然后我们再继续向前推演。所以我们有点像是一个集体寻路的方法。这真的很棒。
Lex Fridman 你身上有一种特质。当你在解释事情时,我能感觉到你真的是在现场进行推演,而且带着一种持续开放的心态,我觉得我似乎能够引导你的思维。这非常美好,在经历了这么多年的成功与痛苦之后,你还能保持这一点。我觉得有时候痛苦会让人封闭。
黄仁勋 嗯,是的。对尴尬的容忍度,我认为是关键。
Lex Fridman 是的,对尴尬的容忍。这真的是一种重要的能力。这意味着经历多年让自己感到尴尬的时刻。甚至在会议中,你知道周围有很多人,你提出了一个想法,然后被证明那个想法是错的,你要能够承认这一点并从中成长。从人性的层面上来说,这是非常困难的。
黄仁勋 是啊。他们都知道我最近的一份(底层的)工作是洗厕所,所以嘛……
Lex Fridman 我很高兴你保持了那种在Denny’s(连锁餐厅)工作的精神。那真的很美好,你从Denny’s起步的整个旅程都很美好。
我想问你关于电子游戏的问题。我是一个超级游戏迷。所以我要感谢英伟达多年来提供的令人惊叹的图形技术。
黄仁勋 顺便说一句,直到今天,GeForce仍然是我们最重要的营销策略。
人们在青少年时期了解到英伟达。然后他们上了大学,他们知道英伟达是谁。一开始只是玩《使命召唤》或者《堡垒之夜》。后来他们开始使用CUDA,再后来他们在Blender、达索和Autodesk里使用英伟达的技术。
Lex Fridman 是的。我跟我一个朋友提到我要和你对话。他说:“哦,他们做的游戏显卡很棒。”虽然其实不止于此,但人们真的很喜欢……硬件真的把这些世界变活了,给很多人带来了快乐。最近关于DLSS 5有一些争议。你能跟我解释一下这其中的风波吗?我想网上的一些玩家担心这会让游戏看起来像“AI废料/粗制滥造的内容(AI slop)”。你怎么看这场争议?
黄仁勋 是的。我认为他们的观点是有道理的,我能理解他们的出发点,因为我自己也不喜欢AI产生的那种千篇一律的废料。现在所有AI生成的内容越来越雷同,虽然它们都很漂亮。所以我对他们的想法感同身受。
但这并不是DLSS 5的目的。我展示了它的几个例子。DLSS 5是基于3D条件约束(3D conditioned)、3D引导的。它是受到基础真实结构数据引导的。所以是由艺术家来决定几何结构。我们完全忠实于几何结构,它在每一帧中都保持不变。它受制于纹理、艺术家的艺术创作。所以每一帧它都在增强,但它不改变任何实质内容。
关于增强的问题,因为这个系统是开放的,DLSS 5也允许你训练自己的模型来决定风格,甚至未来你可以提示(prompt)它。比如我希望它是一个卡通着色器(toon shader),我希望它看起来像这样,你可以给它一个例子。它就会生成那种风格,并且与艺术家的技艺、风格和意图保持完全一致。所以这一切都是为艺术家服务的设计,以便他们能创作出更美的东西,但仍然保持他们想要的风格。
我认为玩家们可能产生了一种错觉,以为游戏会像往常一样发售,然后我们会在客户端进行某种不可控的后处理。这不是DLSS的意图。DLSS是与艺术家的工作流结合在一起的。这是关于赋予艺术家AI的工具、生成式AI的工具。他们也可以决定不使用它。
Lex Fridman 我认为人们对人脸非常敏感。我们现在生活在这样一个时刻,我认为这是一个美好的时刻——人们对AI生成的废料很敏感。这就像一面镜子,帮助我们意识到我们真正追求的往往是不完美。我们追求的有时并不是绝对完美的画面。它帮助我们理解,在我们创造的世界里,到底是什么让我们感到动心。这是美好的。只要它是帮助我们创造这些世界的工具,那就非常棒。
黄仁勋 完全正确。它只是另一个工具。他们想让生成模型生成与照片写实完全相反的风格,它也能做到。所以这只是又多了一个工具。玩家们可能也会欣赏一点:在过去的几年里,我们向游戏开发者引入了皮肤着色器。现在很多游戏中的皮肤着色器包含了次表面散射,让皮肤看起来更像真实的皮肤。游戏产业、游戏开发者正在寻找越来越多、越来越好的工具来表达他们的艺术。所以这仅仅是多了一个工具,由他们决定如何使用。
Lex Fridman 问个有点离谱的问题:你认为有史以来最伟大或最具影响力的游戏是什么?也许可以从英伟达的视角来看?
黄仁勋 《毁灭战士》(Doom)。
Lex Fridman 毫无疑问是Doom。那是3D的开端。
黄仁勋 无论是从艺术角度、文化影响,还是从将PC变成游戏设备这一行业转折点来看,我都会说是《毁灭战士》。那是一个非常重要的时刻。当然,在那之前也有飞行模拟公司。但它们就是没有《毁灭战士》那样的流行度,是它真正促使行业将PC从一台办公自动化工具,转变成了适合家庭和玩家的个人计算机。《毁灭战士》在这方面的影响极为深远。
从实际的游戏技术角度来看,我会说是《VR战士》(Virtua Fighter)。而且我们和他们两家都是很好的朋友。
Lex Fridman 近期也有一些游戏,比如《赛博朋克 2077》,真的是非常棒的GPU加速图形。完全的光线追踪。就我个人而言,我也是《天际》(Skyrim)系列、《上古卷轴》的超级粉丝。虽然它是很久以前发布的,但人们会发布各种Mod,创造出令人难以置信的体验。感觉就像换了一个游戏,让我能够一遍又一遍地重玩。它让你意识到,你可以用全新的方式重新体验你早已深爱的世界。我最喜欢的事情之一就是在天际省里散步。
黄仁勋 我们创造了一个叫做RTX Remix的工具,它就是一个Mod制作工具。它允许社区将最新的技术注入到老游戏中。
Lex Fridman 当然,成就一款伟大电子游戏的不仅仅是画面,还有故事和角色的发展。但美丽的画面能增加沉浸感。那种感觉就像你被传送到了另一个世界。
如你所说,我认为很准确,关于通用人工智能(AGI)时间表的问题,取决于你对AGI的定义。所以我想问你关于可能的时间表。
假设对AGI有一个可能有些荒谬的定义:一个能够取代你的工作的AI系统。比如启动、发展并运营一家成功的、价值超过十亿美元的科技公司。你知道完成所有这些环节有多难。那么距离这个目标我们还有多远?比如像OpenClaw这样能执行极其复杂任务的系统:创新、寻找客户、销售、管理、建立由智能体和人类组成的团队等等。这是5年、10年、15年还是20年后的事?
黄仁勋 我认为就是现在。我认为我们已经实现了AGI。
Lex Fridman 你认为你能够拥有一家由这样的AI系统运营的公司吗?
黄仁勋 有可能。原因是这样的,你说了“十亿美元”,但你没说“永远”。所以例如,一个“Claw”有可能创建一个网络服务或某个有趣的小应用,突然之间,几十亿人每人花50美分使用了它,然后在不久之后它又倒闭了。在互联网时代,我们见过一大批这种类型的公司,而其中大多数网站的复杂程度,并不比今天OpenClaw能生成的代码更高。
Lex Fridman 有趣。实现病毒式传播并将这种传播变现。
黄仁勋 是的。我不知道具体是什么形式,但当时我也预测不到那些互联网公司的爆发。你这句话肯定会让很多人感到兴奋:你的意思是,我只要启动一个智能体就能赚大钱?
顺便说一句,这正在发生,对吧?当去中国时,你会看到一大批人在教他们的“Claws”(智能体系统),让它们试着出去找工作,去干活,去赚钱。
如果发生某种社交现象,或者有人创造了一个超级可爱的数字网红,或者某种让你喂养电子宠物的社交应用,突然间成为爆款,我也不会感到惊讶。许多人使用它几个月后,它就慢慢消失了。但如果你说要有十万个这样的智能体去建立“英伟达”,那几率是0%。
有一点我必须要做,我也希望确保我们所有人都要做,那就是认识到人们现在真的非常担心他们的工作。我只想提醒他们,你工作的“目的”(purpose)和你做工作所使用的“任务与工具”(tasks and tools)是相关联的,但并不是同一回事。我已经做了33年我的工作了。我是世界上任职时间最长的科技CEO,34年了。在过去这34年里,我用来完成工作的工具一直在不断变化,有时候在两三年的时间里就会发生极其巨大的变化。我真切希望每个人都能听到一个故事,那是关于计算机科学家、AI研究人员最初说会消失的第一个职业——放射科医生。
因为计算机视觉(CV)将达到超越人类的水平,而它确实做到了。计算机视觉在2019年、2020年左右达到了超人类的水平。所以计算机视觉超越人类已经有很长一段时间了。当时的预测是放射科医生会消失,因为研究放射影像将成为过去时,AI会代劳。他们完全是对的。现在每一套放射学平台和软件包都是由AI驱动的。然而,放射科医生的数量却增长了。现在全球都面临放射科医生短缺的问题。
所以问题是为什么?第一,危言耸听的警告走得太远,吓退了人们去从事这项对社会极其重要的职业,它造成了伤害。那这个警告为什么错了?原因是,放射科医生的“目的”是为了诊断疾病,帮助病人和医生。正因为我们现在研究影像的速度快得多了,你可以研究更多的影像,你可以更好地进行诊断,你可以更快地收治病人,你可以看更多的病人。医院赚了更多的钱。医院里的病人更多了。你需要更多的放射科医生。奇妙的是,这一切会发生是如此的显而易见。
英伟达的软件工程师数量将会增长,而不是减少。
原因是软件工程师的“目的”和软件工程师写代码的“任务”是相关的,但不是一回事。我希望我的软件工程师去解决问题。我不在乎他们写了多少行代码。他们工作的目的没有变:解决问题、团队协作、诊断问题、评估结果、寻找要解决的新问题、创新、将点滴联系起来。这些东西都不会消失。
Lex Fridman 你认为,就算单看编程,未来世界上程序员的数量也是会增加,而不是减少吗?
黄仁勋 是的。原因是:到底什么是编程的定义?我认为,到今天为止,编程的定义仅仅是:提供“规范说明”(specification),如果你想更有指导性的话,甚至可以给出你想编写的软件的架构。那么问题是,有多少人能做到这一点?去向计算机描述一个规范要求,告诉计算机去构建什么。我认为这个数字刚刚从3000万增加到了大概10亿。
所以未来的每一个木匠都将是一名程序员,而且一个拥有AI的木匠也是一名架构师。他们极大地提升了能为客户提供的价值。他们的艺术造诣得到了极大的提升。
我相信每一位会计师同时也会是你的金融分析师、你的理财顾问。所有这些职业都被提升了。如果我是一名木匠,看到AI,我绝对会疯掉:如果我是个水管工,我能带给客户的服务将不可同日而语,这会让我彻底疯狂。
Lex Fridman 而且我认为,那些目前是程序员和软件工程师的人,处于一种前沿位置——他们本能地懂得如何用自然语言与智能体交流,以设计出最好的软件。
随着时间的推移,它们会趋同,但我认为学习编程依然有价值,比如了解编程语言是什么,旧式的编程范式是怎样的,以及大型软件系统的优秀设计原则是什么。
黄仁勋 Lex,正如你对听众所说,我认为规范说明的终极目标,或者说规范的艺术性,将取决于你想解决什么问题。当我在思考给予公司战略方向并制定我们应该做的事情时,我描述它的层级,是详细到足以让人们大致理解方向并具有可操作性。它足够具体,让他们可以采取行动;但我又故意留有不具体(under specify)的空间,以便赋能43,000名不可思议的员工,让他们做得比我想象的还要好。
所以当我和工程师、和别人共事时,我考虑的是我想解决什么问题?我在和谁共事?规范的详细程度、架构定义的层级都与此相关。每个人都必须学习他们想在这个“编程光谱”的哪个位置。编写规范(specification)就是在编程。
你可能决定要非常具有规定性,因为你在寻找一个非常具体的结果。你也可能觉得这是一个你想要进行探索的领域,所以你可能故意不给出明确规范,从而让你能够与AI来回互动,甚至突破你自己的创造力边界。所以你在光谱的哪个位置,这种艺术性,就是编程的未来。
Lex Fridman 但在编程之外停留一下。我认为很多人,理所当然地,对自己的工作感到担忧,尤其是在白领阶层,对自己的工作抱有焦虑。每当自动化和新技术到来时,都会带来动荡时期,我不认为我们中有人确切知道该怎么做。我认为我们都需要有同情心,并有责任去感受失去工作的个人和家庭实际上所承受的痛苦。当像人工智能这样具有变革性的技术到来时,会产生很多痛苦,我不知道该怎么处理这些痛苦。希望能随着工具的发展让相同的人做相同的工作变得更有生产力、甚至更有趣,从而为他们创造更多的机会,就像在编程领域一样。但我还是觉得会伴随着很多痛苦和苦难。
黄仁勋 对于应对焦虑,我这有个第一时间的建议,这也是我自己处理焦虑的方法,正如我们之前讨论过的:面对对未来的巨大焦虑、对压力的巨大焦虑、对不确定性的巨大焦虑。我首先把它拆解。然后告诉自己,“好的,有些事情你能掌控并采取行动,有些事情你无能为力。但对于你能做的事情,让我们推演一下,然后去执行。”
如果我们要雇佣一名刚毕业的大学生,我有两个候选人:一个完全不知道AI是什么,另一个是使用AI的专家。我会雇佣那个精通使用AI的人。如果我需要招会计、市场营销人员、供应链管理、客服、销售、商务拓展、律师——我会雇佣那些精通使用AI的人。
因此,我的建议是,每一个大学生,每一位老师都应该鼓励他们的学生去使用AI。每一个毕业的大学生都应该成为AI的专家。如果你是一个木匠、电工,去使用AI吧。去看看它能为你现在的工作带来什么改变,提升你自己。如果我是个农民,我绝对会用AI;如果我是药剂师,我也会用。我想看看它能怎么提升我的工作,好让我自己成为革新这个行业的创新者。这是我会做的第一件事。
同样,确实存在一种情况:因为自动化,技术会造成工作岗位的转移并消除许多“任务”。如果你的工作仅仅等同于那个“任务”,那你非常容易被颠覆。但如果你的工作“目的”只是包含了某些“任务”,那对你来说至关重要的就是:去学习如何使用AI来将那些“任务”自动化。在这两者之间,则存在着一个宽广的光谱。
Lex Fridman 顺便说一句,AI最美妙的地方在于,聊天机器人的版本可以让你把问题拆解……当你感到焦虑时,你可以通过和它对话来分解问题。它能在多大程度上帮你理清生活中的问题,真的是不可思议。我不是指心理治疗那种问题,而是非常实际的:“我很担心我的工作,我需要哪些技能?我需要采取什么步骤?我如何学好AI?”你刚才说的每一件事,你都可以直接问它,它会给你一个逐点的计划。这就是一个了不起的私人生活教练。你不用去摸索如何使用AI,AI会主动说:“来,我教你怎么用。”
黄仁勋 你不可能走到Excel面前对它说:“我不知道怎么用Excel。”那你真的就没救了。
Lex Fridman 这实际上就是AI在生活的各个方面为我所做的。第一次使用某种新事物的摩擦感和作为新手的阻力被消除了。我几乎可以询问任何事物的“第一步我需要做什么?”它对你的这种引导,消除了体验世界上各种事物的摩擦感。就像我在线下跟你提到的,你说要去中国和台湾,我就去问AI:“我该去哪?怎么走?”所有这些问题立刻得到了解答,这太棒了。
黄仁勋 当你去台湾的时候,只要问AI:“黄仁勋在台湾最喜欢的餐厅是哪些?”它真的会告诉你。全台湾都有。
Lex Fridman 你在这个领域就像摇滚巨星一样。也许就像我们在线下聊的,我们的路线可能会有交集。如果在COMPUTEX(台北国际电脑展)上,那在计算领域将是一次非常美妙的相遇。
黄仁勋 或者英伟达GTC台湾站。
Lex Fridman 你认为人类的本性或人类意识中,是否存在某些根本非计算的(non-computational)东西?也许是某种无论芯片多么强大都永远无法复制的东西?
黄仁勋 我不知道芯片是否会感到紧张。当然,引发焦虑、紧张或任何其他情绪的条件各不相同。我相信AI将能够识别并理解这些情绪。但我不认为我的芯片会真实地“感受”到它们。
因此,那种焦虑、那种感觉、那种兴奋……所有那些情绪如何体现在人类的表现中。例如,极高水平的运动表现,或者低于平均水平的表现。面对完全相同的客观条件,不同的人会产生不同的情绪反应,从而表现出不同的结果。那构成了完整的人类表现光谱。我不认为我们正在制造的任何东西能表明:两台不同的计算机在被提供完全相同的情境时,会(除了统计上的随机性之外)单纯因为“感受不同”而产生不同的结果。
Lex Fridman 主观体验……天哪,我们人类感受到的主观体验里,有着真正特别的东西。就像我跟你提到过的,我来采访你之前挺紧张的。那种希望、恐惧、焦虑,以及生命本身的丰富性。一切是如此美妙。我们陷入爱河有多深,我们心碎时有多痛,我们对死亡有多恐惧,以及当我们所爱之人离世时我们感到的痛苦有多剧烈。所有这些,构成了一个完整的整体。我知道很难想象AI,一个计算设备能够做到这一点。
但是关于这整个事物,还有那么多我们尚未揭开的谜团,所以我保持开放的心态,随时准备接受惊喜。在过去的几个月和几年里,我已经收获了很多惊喜。规模扩展可以在智能领域创造令人难以置信的奇迹。见证这一切真的很奇妙,所以我对惊喜持开放态度。
黄仁勋 剖析什么是“智能(Intelligence)”非常重要。我们经常使用这个词,但它并不是一个神秘的词汇。智能是有明确定义的。它是一种系统,包含了我们所做的感知、理解、推理以及规划的能力。那个闭环,从根本上讲就是智能。
但智能这一个词,并不完全等同于“人性(humanity)”。我认为将这两者区分开来真的很重要。我们有两个不同的词。我不会对智能过度幻想,也不会过度将其浪漫化。大家都听我说过,我其实认为智能是一种商品(commodity)。我周围都是高智商的人。
我周围的人,在他们各自的领域都比我聪明得多。然而,在那个圈子里我却有一个角色。这其实挺有趣的。他们受教育程度比我高。他们上的学校比我好。在任何他们所处的领域,他们钻研得都比我深。他们所有人都是。我有60位这样的直接下属。对我来说,他们都是超人。而不知为何,我却坐在中间指挥着这60个人。
所以你必须问问自己……究竟是什么特质,让一个曾经的洗碗工能够坐在这些超级人类的中间?你明白我的意思吗?所以,我的观点是,智能是一项功能性的东西。
而人性(humanity)不是通过功能来界定的。它是一个宏大得多的词。我们的生活经历、我们对痛苦的容忍度、我们的决心,这些都是不同于“智能”的词汇。我想帮助听众理解,如果我能传达一件事的话,那就是:智能这个词,随时间推移被我们拔得太高了。
Lex Fridman 我们真正应该拔高、颂扬的词,应该是人性。
黄仁勋 性格(character),人性。同情心、慷慨,你刚才说的所有那些特质,我相信那才是真正的超能力。而现在,智能将被商品化。因为我们说过,目前最重要的事似乎是你的教育。但即使在过去大家说教育最重要的时候,你在学校里获得的也绝不仅仅是知识。但不幸的是,我们的社会把一切都浓缩到了一个词上。而生活远不止这一个词。我只是在告诉你,我的人生轨迹表明,就算我在智力曲线上低于周围所有人,这并没有改变我是最成功的那个人的事实。
所以我想借此激励其他人,不要让智能的民主化、智能的商品化给你带来焦虑。你应该受到它的鼓舞。
Lex Fridman 是的。我认为AI将帮助我们更多地颂扬人类。绝对是人性优先、人类至上,我认为让这个世界不可思议的原因永远在于人类。而AI只是一个奇妙的工具,它让我们人类变得更加强大。
正如我提到的,英伟达的成功以及数百万人的生活都依赖于你。但你终究只是一个人类,像我们所有人一样是个凡人。你会思考自己的死亡吗?你害怕死亡吗?
黄仁勋 我真的不想死。我拥有很棒的生活。我有一个很棒的家庭。我在做着非常重要的工作。这不仅仅是“一生只有一次”的经历——那意味着很多人可能都有过——这是“人类历史上只有一次”的经历,这就是我正在经历的。
英伟达是历史上最具影响力的科技公司之一。我们正在做非常重要的工作。我非常认真地对待它。所以一些很实际的事情是,我们如何考虑继任计划(succession planning)?我有一句出名的话,那就是我“不相信继任计划”。原因不是因为我觉得自己能长生不老。原因在于,如果你对继任计划感到担忧,如果你把所有的焦虑都放在继任计划上,那你能做些什么呢?
那么你同样要把这个问题拆解到底。如果你关心公司在你离开之后的未来,你今天应该做的最重要的事情,就是尽可能频繁、持续地向他人传递知识、信息、洞察、技能和经验。这就是为什么我不断在我的团队面前进行推演。
我的每一次会议都是一场推演会。我在公司内外度过的每一刻,都是为了尽可能快地向人们传递知识。我学到的任何东西在我的办公桌上停留的时间绝对不会超过零点一秒。我马上就会把这个信息,把这个“天哪,这太酷了”的知识指点给别人。甚至在我自己还没完全学完之前,我就已经告诉别人:“快来看这个。这太酷了,你绝对想学学这个。”所以我一直在传递知识、赋权他人、提升我周围所有人的能力,我追求并期望的结果是:我最终能在工作岗位上离世。并且希望那一刻发生得非常快,没有漫长的痛苦折磨。
Lex Fridman 从一个粉丝的角度,鉴于你对人类文明产生的巨大积极影响,我当然希望你继续走下去。观察英伟达正在做的事情本身就非常有趣,那种创新的速度,以及我作为工程的铁杆粉丝所看到的,英伟达持续做出的那些不可思议的工程。这不仅是一种观看的乐趣,更是对人类的礼赞,对伟大建设者的礼赞,对伟大工程的礼赞。这代表着某种非常特别的东西。所以我希望你和英伟达继续前行。关于这一切,关于人类,关于人类的未来,当你眺望未来10年、20年、50年、100年的时候,是什么让你充满希望?
黄仁勋 我一直对人类的善良、慷慨、同情心和人类的能力抱有极大的信心。我对此一直充满信心,有时候甚至过于自信了,以至于被人利用。但这从未让我停止去相信。我始终是从这样一个起点出发的:人们总是想要做好事。人们想要帮助他人。而且在绝大多数情况下,事实证明我是对的,而且经常超出我的预期。所以我对人类的能力有完全的信心。
给我带来无限希望的,是我现在的所见,以及基于我们当前所做的事情去推断未来极有可能发生的事情。
有那么多我们想要解决的问题。有那么多我们想要建造的东西。有那么多我们想要做的好事,现在都已触手可及,而且是在我有生之年能够触及的范围内。面对这些,你怎么可能不抱有极度浪漫主义的情怀呢?你明白我的意思吗?
Lex Fridman 生活在这样一个时代是多么令人激动啊。真的,真真切切地。
黄仁勋 你怎么可能不对此感到浪漫呢?“消除疾病”已经变成一个合理的期望;“大幅度减少污染”也成为了一个合理的期望;连“光速旅行”实际上都在我们的未来中变得合理——虽然不是远距离旅行,但短距离是可能的。人们问我怎么实现。很快,我就要把一个人形机器人送上太空飞船,那将是我的机器人。我们会尽快把它送出去,它会在飞行中不断改进和增强。等到时机成熟,我所有的人生轨迹都已经被上传到了互联网。把我所有的收件箱,我做过的所有事情,我说过的所有话都收集起来,变成我的专属AI。当时机到来时,我们只要把那些数据以光速发送出去,就能追上我的机器人了。
Lex Fridman 这太绝了。不过对我来说,这有些偏向应用层面了。但从最大化满足好奇心的角度来看,那里有那么多的科学谜团亟待解开。
黄仁勋 我们即将理解生物机器(人体机制),这就在拐角处了。不用等10年,可能只需要5年。然后你的生物机器、人类大脑以及理论物理学的大门将被彻底打开。这太令人兴奋了。能解释清楚“意识(consciousness)”将是无比棒的事情。
Lex Fridman 而且这一切都在我们的触手可及之内。Jensen,非常感谢你这么多年来所做的一切。感谢你为世界所做的一切。感谢你展现出这样的自己。我能看出你是一个伟大的人类。我祝愿你今年取得令人难以置信的成功。作为粉丝,我迫不及待想看到你的下一步动作,希望在台湾能见到你。非常感谢你今天的对话。
黄仁勋 谢谢你,Lex。我今天过得很愉快。请允许我再说一件事。感谢你所做的所有采访。你展现出的深度、尊重以及你所做的深入研究,向我们展示了你多年来采访的这些不可思议的人们。我极其享受观看它们。作为一名创新者,你创造了这种极具吸引力的长格式内容。不管怎样,感谢你所做的一切。
Lex Fridman 这对我意义重大。谢谢你,Jensen。
黄仁勋 谢谢你,Lex。
Lex Fridman 感谢您收听与黄仁勋的这场对话。
让我用Alan Kay的一句话来作为结尾:“预测未来的最好方法就是去创造它。”
感谢您的收听,希望下次再见。