Cleo Abram · 2025-01-27

黄仁勋谈AI未来:从游戏到超级智能的演变

摘要

英伟达CEO黄仁勋在访谈中回顾了GPU从游戏图形处理到AI计算引擎的演变历程,阐述了CUDA平台与AlexNet突破的关键意义,并展望未来十年AI将从科学研究迈入应用科学时代。他预言一切移动设备都将成为机器人,人类将借助超级AI成为超人,同时强调需关注偏见、幻觉与安全等风险。

核心概念及解读

GPU并行计算:与CPU串行处理不同,GPU能同时处理大量小任务,成为AI训练的核心硬件基础

CUDA平台:英伟达推出的并行计算编程模型,让研究人员可用通用编程语言调用GPU算力,大幅降低了AI开发门槛

AlexNet:2012年在ImageNet竞赛中取得突破的神经网络模型,标志着深度学习革命的开端,证明了GPU驱动AI训练的巨大潜力

Omniverse与Cosmos:英伟达开发的虚拟世界平台和世界模型,前者提供物理模拟环境,后者理解物理常识,两者结合用于训练机器人系统

物理AI:指能在真实物理世界中运作的智能体,包括人形机器人、自动驾驶汽车和智能建筑等,通过数字世界训练大幅提升学习效率

黄仁勋谈AI未来:从游戏到超级智能的演变

  • 原文标题:黄仁勋最新万字访谈:我们终将成为超人,不是因为拥有了超能力,而是因为拥有了超级AI

  • 链接:黄仁勋最新万字访谈

  • 文章类别:访谈实录


内容整理

访谈主题

黄仁勋在访谈中回顾了英伟达的发展历程,探讨了人工智能从基础研究到应用科学的转变,并对未来十年AI技术的发展及其对人类生活的影响进行了大胆预测。

文章框架

├── 访谈背景
│   ├── 访谈节目介绍
│   └── 黄仁勋与英伟达
├── 英伟达的发展历程
│   ├── GPU的诞生与并行处理
│   ├── CUDA的推出
│   └── AlexNet的突破
├── 人工智能的现状与未来
│   ├── 从基础研究到应用科学的转变
│   ├── 未来十年的AI应用
│   └── 机器人技术的突破
├── 技术与社会的未来
│   ├── 人类与AI的关系
│   ├── AI的潜在风险与应对
│   └── 能效与技术突破
└── 黄仁勋的未来展望
    ├── Omniverse与Cosmos
    ├── 数字生物学与气候科学
    └── 个人AI导师的重要性

文章内容

  • 访谈背景

    • 访谈节目介绍:Huge If True是一档由Cleo Abram主持的访谈节目,专注于科技、创新和社会变革等前沿话题。
    • 黄仁勋与英伟达:黄仁勋是英伟达的CEO,英伟达是一家专注于图形处理器(GPU)和人工智能技术的科技公司。
  • 英伟达的发展历程

    • GPU的诞生与并行处理:90年代,电子游戏对3D图形的需求催生了GPU。GPU的核心优势在于其并行处理能力,与传统CPU的串行处理模式截然不同。
    • CUDA的推出:CUDA是一个并行计算平台和编程模型,使得研究人员能够更便捷地利用GPU的算力,加速了人工智能的发展。
    • AlexNet的突破:2012年,AlexNet在ImageNet竞赛中取得突破性胜利,开启了人工智能革命的序幕。
  • 人工智能的现状与未来

    • 从基础研究到应用科学的转变:过去十年是人工智能的科学研究阶段,未来十年将是人工智能的应用科学时代,AI将渗透到各行各业。
    • 未来十年的AI应用:黄仁勋预言,未来一切移动的设备都将是机器人,人类将成为“超人”。
    • 机器人技术的突破:通过数字世界中的训练,机器人能够进行更多次数的训练重复,适应更多样化的条件,大幅提升学习效率。
  • 技术与社会的未来

    • 人类与AI的关系:黄仁勋认为,AI将成为人类的“超级助手”,提升人类的能力,而不是取代人类。
    • AI的潜在风险与应对:黄仁勋提到AI可能带来的风险,如偏见、虚假信息和安全性问题,并强调需要通过工程设计和社区合作来解决这些问题。
    • 能效与技术突破:黄仁勋强调,提升计算能效是英伟达的核心任务之一,未来将继续致力于研发更高效、更节能的计算机。
  • 黄仁勋的未来展望

    • Omniverse与Cosmos:英伟达正在开发Omniverse和Cosmos平台,用于创建高度逼真的虚拟世界,以训练机器人和进行物理模拟。
    • 数字生物学与气候科学:英伟达正在探索数字生物学和气候科学领域,目标是解码分子和细胞的语言,预测气候模式。
    • 个人AI导师的重要性:黄仁勋建议人们学习如何与AI互动,将其作为提升工作效率和个人能力的重要工具。

文章标签

#人工智能 , #英伟达 , #黄仁勋 , #深度学习 , #机器人技术 , #未来展望


框架与要点

I. 引言 (0:00 - 1:35)

  • 核心问题: 黄仁勋 (Jensen Huang) 正在构建什么?
  • 背景:
    • NVIDIA 的崛起:从一家显卡公司到全球最有价值的公司之一。
    • 技术变革:NVIDIA 引领了计算方式的根本性转变,推动了 AI、机器人、自动驾驶等领域的发展。
    • 黄仁勋的影响力:他的决策正在塑造未来。

II. 访谈目标与方式 (1:36 - 3:41)

  • 访谈目标: 制作一个乐观的解释性视频,探讨如何利用技术让未来更美好。
  • 访谈方式:
    • 不涉及公司财务、管理风格、法规政治等。
    • 面向广泛受众,包括非专业人士和青少年。
    • 分为三个部分:
      1. 过去:计算领域重大转变的关键洞见是什么?
      2. 现在:这些洞见如何导致了我们现在所处的世界?
      3. 未来:黄仁勋对未来的愿景是什么?

III. 过去:计算领域的变革 (3:42 - 15:44)

  • 从电子游戏开始 (3:42 - 5:30)
    • 20 世纪 90 年代,游戏开发者希望创造更逼真的图形,但硬件无法满足需求。
    • NVIDIA 的解决方案:发明了现代 GPU。
    • 什么是 GPU?
      • 与 CPU 的区别:
        • CPU:擅长顺序处理(逐个解决问题)。
        • GPU:擅长并行处理(同时解决多个小问题)。
      • 核心观察:软件程序中,一小部分代码执行了大部分处理,且这些处理可以并行完成。
  • 为什么首先选择游戏?(5:30 - 6:25)
    • 对虚拟世界的热爱。
    • 游戏市场潜力巨大,可以支持大规模研发。
    • 技术与市场的良性循环。
  • GPU 像时间机器 (6:25 - 7:17)
    • 加速计算,让人们更快地看到未来。
    • 例子:量子化学科学家可以在有生之年完成毕生工作。
  • CUDA 的诞生 (7:17 - 10:51)
    • 早期挑战:研究人员需要“欺骗”GPU,让 GPU 误以为处理的是图形问题。
    • 什么是 CUDA?
      • 一个平台,让程序员可以使用熟悉的编程语言(如 C)来控制 GPU。
      • 让更多人更容易获得强大的计算能力。
    • CUDA 的愿景:
      • 研究人员的发现、内部灵感和解决问题的需求。
      • 外部灵感:医学成像研究人员使用 GPU 进行 CT 重建。
      • 内部问题:创建既美观又动态的虚拟世界(如水流、爆炸等)。
      • 核心信念:GPU 将成为世界上产量最高的并行处理器。
  • AlexNet 的重要性 (10:51 - 15:44)
    • 2012 年,AlexNet 在图像识别竞赛中取得突破性成果。
    • AlexNet 是什么?
      • 一种名为神经网络的 AI。
      • 使用大量数据进行训练,并在 NVIDIA GPU 上运行。
    • 意义:
      • GPU 不仅能加速计算,还成为了一种全新计算方式的引擎。
      • 从“指导计算机”到“训练计算机”。
      • 开启了 AI 领域的巨变。
    • 黄仁勋的视角:
      • 如果“不构建它,他们就无法到来”。
      • NVIDIA 的策略:基于希望,但也经过理性思考。
      • 重大突破:AlexNet 出现后,NVIDIA 意识到深度学习的潜力,决定重塑整个计算堆栈。
    • NVIDIA DGX:为了迎接 AI 的发展。
  • GPU与CUDA推动了神经网络和机器学习的巨大进步。

IV. 现在:AI 的爆发 (15:45 - 21:41)

  • 为什么现在才听到这么多关于 AI 的消息?(15:45 - 19:32)
    • AlexNet 发生在 2012 年,但 AI 和 NVIDIA 的影响力在 10 年后才被广泛感受到。
    • 中间的十年:
      • 持续投入:没有理由不坚持,因为坚信 AI 的未来。
      • 投资数十亿美元,即使在没有明显成果的时候。
  • NVIDIA 的核心信念 (19:32 - 21:41)
    1. 加速计算:并行计算 + 通用计算。
    2. 深度学习网络 (DNN):
      • 可以从各种类型的数据中学习模式和关系。
      • 模型越大、数据越多,学习能力越强。
      • 没有已知的物理、架构或数学限制。
    3. 从数据中学习:AI 可以学习几乎任何形式的数据,并将其转换为任何形式的数据。

V. 未来:应用与挑战 (21:42 - 35:10)

  • 为什么这个时刻感觉如此不同?(21:42 - 23:53)
    • 过去十年:AI 的科学研究。
    • 未来十年:AI 的应用科学。
    • 应用领域:数字生物学、气候技术、农业、机器人、交通运输、教育、播客等。
  • 机器人的未来 (23:53 - 31:55)
    • 物理 AI:人形机器人、自动驾驶汽车、智能建筑、自主仓库等。
    • 训练方式的变革:
      • 过去:在现实世界中训练(可能损坏)或使用有限的数据源(如动作捕捉)。
      • 现在:在数字世界中训练(更多重复、更多条件、更快学习)。
    • NVIDIA 的工具:
      • Omniverse:用于训练机器人系统的 3D 世界。
      • Cosmos:使 3D 世界更逼真。
    • Omniverse 和 Cosmos 如何工作?
      • 类比 ChatGPT:
        • ChatGPT:生成文本,但可能“幻觉”。
        • 下一代 ChatGPT:通过上下文进行调整(如上传 PDF),以“事实为基础”。
      • Omniverse + Cosmos:
        • Cosmos:世界模型(类似 ChatGPT 的基础模型),理解物理世界的常识(如重力、摩擦、惯性等)。
        • Omniverse:物理模拟器,基于物理原理,为 Cosmos 提供“事实基础”。
        • 结合两者,可以生成无限的、基于物理事实的未来故事。
    • 未来 10 年的愿景:
      • 一切移动的东西都将是机器人。
      • 人类将拥有自己的 R2-D2(智能助手),存在于智能眼镜、手机、PC、汽车等设备中。
  • 最大的担忧 (32:05 - 35:10)
    • 偏见、毒性、幻觉、虚假信息、冒充等。
    • AI 安全:
      • 深度研究和工程:确保 AI 正确执行任务,避免伤害。
      • 系统故障:AI 想要做好事,但系统崩溃。
      • 架构 AI 安全系统:多个 AI 协同工作,确保功能正常,并在出现问题时提供安全保障。

VI. 限制与机遇 (35:10 - 45:50)

  • 最大的限制 (35:10 - 38:03)
    • 能量:在有限的能量下完成尽可能多的工作。
    • 物理定律:信息传输和比特翻转的能量限制。
    • 目标:构建更节能的计算机。
    • 例子:NVIDIA DGX(AI 超级计算机)的能效在 8 年内提高了 10000 倍。
  • 如何对特定芯片(如 Transformer)进行重大押注?(38:03 - 42:29)
    • Transformer:一种流行的 AI 架构,用于许多工具中。
    • 争论:
      • 将特定架构“烧录”到芯片中(针对特定任务进行优化)。
      • 保持通用性。
    • NVIDIA 的选择:
      • 核心信念:Transformer 不是最终的 AI 架构,而是通往未来演变的垫脚石。
      • 相信创新的丰富性,希望创建一个能让研究人员自由探索的架构。
      • 例子:Transformer 的“注意力机制”不断发展,出现了各种新的注意力机制。
  • 芯片是如何制造的?(42:29 - 44:18)
    • Nvidia 设计芯片,其他公司组装芯片
    • 与合作伙伴(如 TSMC)密切合作,了解半导体物理的极限,并共同探索。
    • 拥有深厚的专业知识(如半导体物理、系统工程、冷却系统、空气动力学等)。
  • 黄仁勋的下一个赌注 (44:18 - 45:50)
    • Omniverse 与 Cosmos 的融合:生成世界生成系统,对机器人和物理系统的未来至关重要。
    • 人形机器人:开发工具系统、训练系统、人类演示系统等。
    • 数字生物学:理解分子和细胞的语言,预测人体和生物学的未来。
    • 气候科学:高分辨率区域气候预测。

VII. 建议与总结 (45:50 - 结束)

  • 人们应该如何为这个未来做准备?(45:50 - 52:21)
    • 假设你的工作仍然重要,但完成工作所需的努力从一周变为几乎瞬间完成。
    • 类比:
      • 州际公路的建设:催生了郊区、促进了商品流通、出现了加油站和汽车旅馆等。
      • 视频会议:让远程工作成为可能。
    • 如果有一个随时待命的软件程序员,或者可以快速生成原型,会怎样?
    • AI 将赋能人类,增强信心。
    • 建议:立即获得一个 AI 导师,帮助学习、编程、写作、分析、思考等。
  • 介绍产品(52:21 - 55:42)
    • GeForce RTX 50 Series:AI驱动的显卡,7/8的像素由AI生成。
    • NVDIA DGX: AI 超级计算机,将有更便宜的版本,让更多人可以使用。
  • 黄仁勋对未来的建议 (55:42 - 58:54)
    • 学习 AI:学习如何与 ChatGPT、Gemini Pro、Grok 等 AI 交互。
    • 提问的艺术:与 AI 交互类似于提出好问题。
    • 无论从事什么领域,都要思考如何利用 AI 来更好地完成工作。
    • AI 将降低知识、理解和智能的门槛。
    • AI会成为我们的助手,使我们变得更强大。
  • 黄仁勋希望如何被记住?(58:54 - 结束)
    • 产生了非凡的影响。
    • NVIDIA 是一家重要且有影响力的科技公司。
    • 希望 NVIDIA 的能力能够惠及各种规模、各个领域的研究人员和开发者。
    • 希望未来人们回顾时,会发现 NVIDIA 在数字生物学、生命科学、材料科学、机器人等领域都产生了深远影响。

视频脚本

NVIDIA 创始人黄仁勋访谈录:AI、计算的未来与人类的超级能力

I. 引言

Cleo: 今天我们要探讨一个重要的问题:黄仁勋 (Jensen Huang) 正在构建什么?

Jensen Huang: (开场白)在某些时刻,你必须相信一些事情。我们已经彻底改造了我们所知的计算方式。

Cleo: NVIDIA 近年来迅速崛起,成为全球最有价值的公司之一。这背后是计算方式的根本性转变,推动了 AI、机器人、自动驾驶等领域的发展。而您,黄仁勋先生,作为 NVIDIA 的 CEO,您的决策正在塑造我们的未来。我们想知道,您的愿景是什么?您认为接下来会发生什么?您又在构建什么?

II. 访谈目标与方式

Cleo: 在深入探讨之前,我想先说明一下,这次访谈与您最近接受的其他访谈略有不同。

Jensen Huang: 好!

Cleo: 我不会问您关于公司财务、管理风格、法规或政治的问题。这些问题固然重要,但我们的观众可以从其他渠道获得相关信息。我们 Huge if True 频道制作乐观的解释性视频。我希望我们能一起制作一个联合解释性视频,探讨如何利用技术让未来更美好。因为我们相信,当人们看到更美好的未来时,他们会帮助建设这些未来。所以您将要交谈的人非常棒,他们是想要建设更美好未来的乐观主义者。 我们涵盖了超音速飞机、量子计算机和粒子对撞机等众多不同主题,这意味着数百万人在没有任何先验知识的情况下进入每一集。您可能正在与他们所在领域的专家交谈,他们不知道 CPU 和 GPU 之间的区别,或者一个 12 岁的孩子,他有一天可能会长大成为您,但才刚刚开始学习。就我而言,我已经为这次采访准备了几个月,包括与您的团队成员进行了多次背景对话,但我不是工程师。因此,我的目标是帮助观众看到您所看到的未来。 我主要关注三个方面:

  1. 过去: 我们是如何走到今天的?是什么关键的洞见促成了我们现在所处的计算领域的重大转变?
  2. 现在: 那些洞见如何导致了我们现在生活的世界?为什么现在有这么多事情同时发生?
  3. 未来: 您对未来的愿景是什么?

III. 过去:计算领域的变革

Cleo: 为了讨论我们现在所处的 AI 时代,我想我们需要回到 20 世纪 90 年代的电子游戏。当时,游戏开发者希望创造更逼真的图形,但硬件无法满足所有必要的数学计算。NVIDIA 提出了一种解决方案,不仅改变了游戏,也改变了计算本身。您能带我们回到那个时代,解释一下当时发生了什么,以及是什么洞见促使您和 NVIDIA 团队创造了第一个现代 GPU 吗?

Jensen Huang: 在 90 年代初,当我们刚成立公司时,我们观察到,在一个软件程序内部,只有少数几行代码,也许 10% 的代码,执行了 99% 的处理,而这 99% 的处理可以并行完成。然而,另外 90% 的代码必须按顺序执行。事实证明,完美的计算机应该能够同时进行顺序处理和并行处理,而不仅仅是其中一种。这就是我们的重大发现。我们成立公司,就是为了解决普通计算机无法解决的计算问题。这实际上就是 NVIDIA 的开端。

Cleo: 我最喜欢的一个关于 CPU 和 GPU 之间重要区别的例子,是 NVIDIA YouTube 频道上一个 15 年前的视频。流言终结者(Mythbusters)用一个小机器人逐个发射彩弹,来展示在 CPU 上逐个解决问题(顺序处理);然后他们推出了一个巨大的机器人,可以同时发射所有彩弹,在 GPU 上同时解决多个小问题(并行处理)。

Jensen Huang: (Mythbusters 视频中的声音) 3… 2… 1…

Cleo: 所以 NVIDIA 释放了电子游戏的所有这些新力量。为什么首先选择游戏?

Jensen Huang: 电子游戏需要并行处理来处理 3D 图形,我们选择电子游戏是因为:第一,我们喜欢这个应用,它是对虚拟世界的模拟,谁不想去虚拟世界呢?我们还有一个很好的观察,电子游戏有可能成为最大的娱乐市场。事实证明确实如此。拥有一个巨大的市场非常重要,因为技术很复杂,如果我们有一个巨大的市场,我们的研发预算就可以很大,我们可以创造新技术。技术和市场之间的良性循环,正是这种良性循环使 NVIDIA 成为世界上最重要的技术公司之一。这一切都归功于电子游戏。

Cleo: 我听您说过,GPU 就像一台时间机器?您能详细解释一下吗?

Jensen Huang: GPU 就像一台时间机器,因为它让你能更快地看到未来。一位量子化学科学家对我说过,因为 NVIDIA 的工作,他可以在有生之年完成毕生的工作。这就是时间旅行。他能够在有生之年完成原本超出他寿命的事情,这是因为我们让应用程序运行得更快,你就能看到未来。例如,当你进行天气预报时,你就是在看到未来;当你模拟一个虚拟城市和虚拟交通,并在这个虚拟城市中模拟我们的自动驾驶汽车时,我们就是在进行时间旅行。

Cleo: 并行处理在游戏中起飞,它让我们能够在计算机中创造出我们以前从未创造过的世界,而游戏是并行处理释放出更多力量的第一个令人难以置信的案例。然后,正如您所说,人们开始在许多不同的行业中使用这种力量。我听您讲过量子化学研究人员的故事,他以并行方式在 NVIDIA GPU 上运行分子模拟,这比他以前使用的超级计算机上的 CPU 要快得多。

Jensen Huang: 是的,没错。

Cleo: 天哪,它正在彻底改变所有其他行业,它开始改变我们对计算机可能性的看法。我的理解是,在 21 世纪初,您看到了这一点,并意识到这样做有点困难,因为那位研究人员必须“欺骗”GPU,让 GPU 误以为他的问题是一个图形问题。

Jensen Huang: 完全正确,你做了一些研究!

Cleo: 所以您创造了一种方法,让这变得容易得多。

Jensen Huang: 是的。

Cleo: 具体来说,这是一个名为 CUDA 的平台,它允许程序员使用他们已经熟悉的编程语言(如 C)来告诉 GPU 做什么。这很重要,因为它让更多人更容易获得所有这些计算能力。您能解释一下是什么愿景促使您创建了 CUDA 吗?

Jensen Huang: 部分是研究人员的发现,部分是内部灵感,部分是解决问题。你知道,很多有趣的想法都来自于这种混合。有些是愿望和灵感,有些只是绝望,你知道的。所以 CUDA 的情况非常相似。可能第一个使用我们的 GPU 进行并行处理的外部想法,来自于医学成像方面的一些有趣工作,麻省总医院的几位研究人员正在使用它进行 CT 重建。他们出于这个原因使用了我们的图形处理器,这启发了我们。 与此同时,我们公司内部试图解决的问题与这样一个事实有关:当你试图为电子游戏创建这些虚拟世界时,你希望它既美观又动态。水应该像水一样流动,爆炸应该像爆炸一样。所以你想做粒子物理,你想做流体动力学,如果你的管道只能做计算机图形学,那就更难做了。因此,我们有一个自然的理由想要在我们服务的市场中这样做。因此,研究人员也开始尝试使用我们的 GPU 进行通用加速,因此有多个因素汇集在一起,我们只是在时机成熟时决定做一些适当的事情,并因此创建了 CUDA。从根本上说,我确信 CUDA 会成功并将整个公司都投入其中的原因是,从根本上说,我们的 GPU 将成为世界上产量最高的并行处理器,因为电子游戏市场非常大,所以这种架构很有可能覆盖到许多人。

Cleo: 在我看来,创建 CUDA 是一件非常乐观的、“如果…就…”的事情,您当时说,如果我们创造一种方法,让更多人使用更多的计算能力,他们可能会创造出令人难以置信的东西。然后,当然,它变成了现实。他们做到了。

Cleo: 2012 年,一组三位研究人员向一个著名的竞赛提交了一份参赛作品,该竞赛的目标是创建能够识别图像并用类别标记它们的计算机系统。他们的参赛作品大获全胜,错误答案少得多,令人难以置信。它让所有人惊叹。它被称为 AlexNet,是一种名为神经网络的 AI。我的理解是,它如此出色的一个原因是,他们使用了大量数据来训练该系统,并且他们在 NVIDIA GPU 上进行了训练。突然之间,GPU 不仅是一种让计算机更快、更高效的方式,它们还成为了一种全新计算方式的引擎。我们正在从用逐步的指示指导计算机,转向通过向计算机展示大量示例来训练计算机学习。2012 年的这一时刻,真正开启了我们现在看到的 AI 领域的巨变。您能从您的角度描述一下那个时刻是什么样的吗?您认为它对我们的未来意味着什么?

Jensen Huang: 当你创造像 CUDA 这样的新事物时,如果你构建了它,他们可能不会来。这是愤世嫉俗者的观点。然而,乐观主义者的观点会说,但如果你不构建它,他们就无法到来。这就是我们看待世界的方式。你知道,我们必须从直觉上推理为什么这会非常有用。事实上,在 2012 年,Ilya Sutskever、Alex Krizhevsky 和 Geoff Hinton 在多伦多大学的实验室里,他们联系到了 gForce GTX 580,因为他们了解了 CUDA,并且 CUDA 可以用作训练 AlexNet 的并行处理器。所以我们的灵感是,GeForce 可以成为将这种并行架构推向世界的工具,研究人员总有一天会发现它,这是一个很好的策略。这是一个基于希望的策略,但也是经过理性思考的希望。 真正引起我们注意的是,与此同时,我们正试图在公司内部解决计算机视觉问题,我们正试图让 CUDA 成为一个好的计算机视觉处理器,我们对内部早期开发的一系列问题感到沮丧,这些问题与我们的计算机视觉工作以及让 CUDA 能够做到这一点有关。突然之间,我们看到了 AlexNet,这是一种与以前的计算机视觉算法完全不同的新算法,在计算机视觉能力方面实现了巨大的飞跃。当我们看到它时,部分出于兴趣,部分因为我们自己正在努力解决一些问题。所以我们非常感兴趣地想看看它是否有效。所以当我们看到 AlexNet 时,我们受到了启发。但我想说,最大的突破是当我们看到 AlexNet 时,我们问自己,AlexNet 能走多远?如果它能用计算机视觉做到这一点,它能走多远?如果它能达到我们认为它能达到的极限,它能解决的问题类型,对计算机行业意味着什么?对计算机架构意味着什么?我们正确地推断,如果机器学习,如果深度学习架构可以扩展,那么绝大多数机器学习问题都可以用深度神经网络来表示。我们可以用机器学习解决的问题类型如此之多,以至于它有可能彻底重塑计算机行业,这促使我们重新设计了整个计算堆栈,这就是 DGX 的由来,这个小小的 DGX 就在这里,所有这些都来自于我们的观察,即我们应该逐层重新发明整个计算堆栈。你知道,在 IBM System 360 推出 65 年后,我们已经彻底改造了我们所知的计算方式。

Cleo: 把这看作一个完整的故事,并行处理重塑了现代游戏,并彻底改变了整个行业,然后这种计算方式开始被用于不同的行业。您通过构建 CUDA 来投资这一点,然后 CUDA 和 GPU 的使用允许神经网络和机器学习的逐步变化,并开始了一场我们现在看到的革命,其重要性只会增加…突然之间,计算机视觉得到了解决,语音识别得到了解决,语言理解得到了解决,这些与智能相关的令人难以置信的问题,我们在过去没有解决方案,迫切希望有解决方案,突然之间一个接一个地得到解决,你知道每隔几年。这太不可思议了。

IV. 现在:AI 的爆发

Cleo: 是的,您看到了这一点,在 2012 年,您展望未来,相信这就是您现在将要生活的未来,您为此下了赌注,这些赌注的风险非常高。然后我的看法是,作为一个外行,这需要相当长的时间才能实现。您下了这些赌注——8 年、10 年——所以我的问题是:如果 AlexNet 发生在 2012 年,而这个观众可能在 10 年后才看到和听到更多关于 AI 和 NVIDIA 的信息,为什么花了十年时间?而且,因为您已经下了这些赌注,这十年的中间对您来说感觉如何?

Jensen Huang: 哇,这是个好问题。可能感觉就像今天。你知道,对我来说,总有一些问题,然后总有一些理由不耐烦。总有一些理由对你所处的位置感到高兴,也总有很多理由继续前进。所以我想,正如我刚才所反映的,这听起来就像今天早上!但我想说,在我们追求的所有事情中,首先你必须有核心信念。你必须从你最好的原则出发进行推理,理想情况下,你从物理学原理或对行业的深刻理解或对科学的深刻理解出发进行推理,无论你从哪里推理,你都从第一性原理出发。在某些时候,你必须相信一些事情。如果这些原则没有改变,假设没有改变,那么你没有理由改变你的核心信念。然后,一路上总有一些成功的证据,你正朝着正确的方向前进,有时你知道你很长时间没有成功的证据,你可能需要稍微纠正一下方向,但证据会出现。如果你觉得你正朝着正确的方向前进,我们就继续前进。 关于我们为什么坚持了这么久的问题,答案实际上恰恰相反:没有理由不坚持,因为我们相信它。我已经相信 NVIDIA 30 多年了,我仍然每天都在这里工作。我没有根本的理由改变我的信仰体系,我从根本上相信,我们正在做的彻底改变计算的工作,今天比以前更加真实。所以我们会坚持下去,直到另有情况。当然,一路上会有非常困难的时期。你知道,当你投资于某件事,而没有人相信它,而且花费了很多钱,你知道也许投资者或其他什么人宁愿你保留利润,或者你知道不管是什么,提高股价或不管是什么。但你必须相信你的未来。你必须投资于自己。我们如此深信这一点,以至于我们在它真正发生之前就投资了数十亿美元。是的,这是漫长的 10 年。但这一路上很有趣。

Cleo: 您如何总结这些核心信念?您对计算机应该如何工作以及它们能为我们做什么的信念是什么,让您不仅度过了那十年,而且还在做您现在正在做的事情,我确信您正在为接下来的几十年下赌注?

Jensen Huang: 第一个核心信念是我们第一次讨论的,是关于加速计算。并行计算与通用计算。我们将这两种处理器加在一起,我们将进行加速计算。今天我仍然相信这一点。第二个是认识到这些深度学习网络,这些 DNN,在 2012 年进入公众视野,这些深度神经网络能够从各种类型的数据中学习模式和关系。如果它能变得越来越大,它就能学习到更多、更细微的特征。让它们变得越来越大、越来越深或越来越宽更容易,所以架构的可扩展性是经验性的。模型大小和数据大小越大,你就能学到越多的知识,这也是经验性的。所以如果是这样的话,你知道,限制是什么?除非存在物理限制、架构限制或数学限制,否则就不会有,而且从未发现过,所以我们相信你可以扩展它。然后唯一的问题是:你能从数据中学到什么?你能从经验中学到什么?数据基本上是人类经验的数字版本。所以你能学到什么?你显然可以从图像中学习物体识别。你可以通过听声音来学习语音。你甚至可以学习语言、词汇、语法,所有这些都只是通过研究一堆字母和单词。所以我们现在已经证明,AI 或深度学习能够学习几乎任何形式的数据,并且可以将其转换为任何形式的数据。这意味着什么?

V. 未来:应用与挑战

Jensen Huang: 你可以从文本到文本,对吧,总结一段话。你可以从文本到文本,从一种语言翻译到另一种语言。你可以从文本到图像,那是图像生成。你可以从图像到文本,那是字幕。你甚至可以从氨基酸序列到蛋白质结构。在未来,你将从蛋白质到文字:“这种蛋白质有什么作用?”或“给我一个具有这些特性的蛋白质的例子。”你知道,识别药物靶点。所以你可以看到,所有这些问题都即将得到解决。你可以从文字到视频,为什么你不能从文字到机器人的动作标记呢?你知道,从计算机的角度来看,这有什么不同?所以它打开了一个充满机遇的世界,一个我们可以去解决的问题的世界。这让我们非常兴奋。

Cleo: 感觉我们正处于这个真正巨大的变化的尖端。当我想象未来 10 年时,与过去 10 年不同,我知道我们已经经历了很多变化,但我认为我无法预测我将如何使用目前正在开发的技术。

Jensen Huang: 完全正确。我认为过去 10 年,你之所以有这种感觉,是因为过去 10 年主要关注的是 AI 的科学。在接下来的 10 年里,我们将有很多 AI 的科学,但接下来的 10 年将是 AI 的应用科学。基础科学与应用科学。所以 AI 的应用研究,应用方面现在变成了:我如何将 AI 应用于数字生物学?我如何将 AI 应用于气候技术?我如何将 AI 应用于农业、渔业、机器人、交通运输、优化物流?我如何将 AI 应用于你知道的教学?我如何将 AI 应用于你知道的播客,对吧?

Cleo: 我想选择其中的几个,以帮助人们了解我们一直在谈论的计算领域的这种根本性变化,实际上将如何改变他们对生活的体验,他们将如何实际使用基于我们刚才谈论的一切的技术。我现在经常听您谈论的一件事,也是我特别感兴趣的一件事,是物理 AI。或者换句话说,机器人——“我的朋友们!”——意思是人形机器人,但也包括自动驾驶汽车、智能建筑、自主仓库、自主割草机等机器人。据我所知,我们可能即将看到所有这些机器人的能力出现巨大飞跃,因为我们正在改变训练它们的方式。直到最近,你还必须在现实世界中训练你的机器人,在那里它可能会损坏或磨损,或者你可以从相当有限的来源(如穿着动作捕捉服的人)获取数据。但这意味着机器人没有获得足够多的例子来更快地学习。但现在我们开始在数字世界中训练机器人,这意味着每天有更多的重复,更多的条件,学习速度更快。所以我们现在可能正处于机器人的大爆炸时刻,NVIDIA 正在构建工具来实现这一点。您有 Omniverse,我的理解是这是 3D 世界,可以帮助训练机器人系统,这样它们就不需要在物理世界中训练。

Jensen Huang: 完全正确。

Cleo: 您刚刚宣布了 Cosmos,这是一种使 3D 世界更逼真的方法。所以你可以得到各种不同的,如果我们在这个桌子上训练东西,桌子上有许多不同类型的照明,一天中的许多不同时间,机器人可能会经历许多不同的你知道的体验,这样它就可以从 Omniverse 中获得更多。作为一个从小就喜欢《星际迷航》中的 Data、《阿西莫夫》的书并梦想着一个有机器人的未来的孩子,我们如何从我们现在拥有的机器人,走向您所看到的机器人未来的世界?

Jensen Huang: 是的,让我用语言模型,也许是 ChatGPT,作为理解 Omniverse 和 Cosmos 的参考。首先,当 ChatGPT 刚问世时,它非同寻常,它能够根据你的提示生成文本。然而,尽管它令人惊叹,但如果它持续时间过长,或者如果它对一个你知道它不了解的主题夸夸其谈,它仍然会很好地生成合理的答案。它只是没有以事实为基础。所以人们称之为幻觉。 因此,在不久之后的下一代,它能够通过上下文进行调整,所以你可以上传你的 PDF,现在它以 PDF 为基础。PDF 成为事实基础。它可以实际上查找搜索,然后搜索成为它的事实基础。在这两者之间,它可以推理如何产生你要求的答案。 所以第一部分是生成式 AI,第二部分是事实基础。好的,现在让我们进入物理世界。世界模型,我们需要一个基础模型,就像我们需要 ChatGPT 有一个核心基础模型一样,这是机器人能够对物理世界保持智能的突破。它必须理解重力、摩擦、惯性、几何和空间意识等事物。它必须理解,即使我移开视线,物体仍然在那里,当我回来时它仍然在那里,物体恒常性。它必须理解因果关系。如果我倾斜它,它就会倒下。所以这些物理常识,如果你愿意的话,必须被捕捉或编码到一个世界基础模型中,这样 AI 就有了世界常识。好的,所以我们必须去,有人必须去创造它,这就是我们用 Cosmos 所做的。我们创建了一个世界语言模型。就像 ChatGPT 是一个语言模型一样,这是一个世界模型。我们要做的第二件事是,我们必须做与我们对 PDF 和上下文以及以事实为基础相同的事情。所以我们用物理模拟来增强 Cosmos,因为 Omniverse 使用物理模拟,这是基于原则求解器的。数学是牛顿物理学,对吧,这是我们知道的数学,所有基本的物理定律我们已经理解了很长时间。它被编码到、捕捉到 Omniverse 中。这就是为什么 Omniverse 是一个模拟器。使用模拟器来调整或调节 Cosmos,我们现在可以生成无限数量的未来故事。它们基于物理事实。就像在 PDF 或搜索加上 ChatGPT 之间,我们可以生成无限数量的有趣事物,回答一堆有趣的问题。Omniverse 加上 Cosmos 的结合,你可以为物理世界做到这一点。

Cleo: 为了向观众说明这一点,如果你在工厂里有一个机器人,你想让它学习它可以走的每一条路线,而不是手动走过所有这些路线(这可能需要几天时间,并且可能会对机器人造成很大的磨损),我们现在能够在短时间内以数字方式模拟所有这些路线,并且在机器人可能面临的许多不同情况下(天黑了、被挡住了等等)——所以机器人现在学习得更快了。在我看来,未来可能看起来与今天非常不同。如果您把这推演到 10 年后,您如何看待人们在不久的将来实际与这项技术互动?

Jensen Huang: Cleo,所有移动的东西总有一天都会变成机器人,而且很快就会实现。你知道,你推着割草机的想法已经有点傻了。你知道,也许人们这样做是因为它很有趣,但没有必要这样做。每辆汽车都将是机器人。使人形机器人成为可能所需的技术,指日可待。所以所有移动的东西都将是机器人,它们将在 Omniverse Cosmos 中学习如何成为机器人,我们将生成所有这些合理的、物理上合理的未来,机器人将从中学习,然后它们将进入物理世界,你知道这完全一样。一个你被机器人包围的未来是肯定的。我很高兴拥有我自己的 R2-D2。 当然,R2-D2 不会是它现在的样子,到处乱滚。它将是你知道的 R2-D2,是的,它可能会有一个不同的物理体现,但它永远是 R2。你知道,所以我的 R2 将一直陪伴着我。有时它在我的智能眼镜里,有时在我的手机里,有时在我的电脑里。它在我的车里。所以 R2 一直在我身边,包括你知道当我回到家时,我留下了一个 R2 的物理版本。你知道,无论那个版本是什么,我们都会与 R2 互动。所以我认为我们将拥有自己的 R2-D2 一生的想法,它与我们一起成长,这现在是肯定的,是的。

Cleo: 我认为很多新闻媒体在谈论这样的未来时,他们关注的是可能出错的地方。这是有道理的。有很多事情可能会出错。我们应该谈论可能出错的事情,这样我们才能防止它出错。

Jensen Huang: 是的,这就是我们在节目中喜欢采取的方法,什么是巨大的挑战,以便我们能够克服它们?

Cleo: 当您担心这个未来时,您会想到哪些方面?

Jensen Huang: 嗯,有很多大家都在谈论的东西:偏见、毒性或幻觉。你知道,对某件事充满信心地说话,但它一无所知,结果我们依赖这些信息。生成,这是生成虚假信息、虚假新闻或虚假图像或任何东西的一种形式。当然还有冒充。它非常擅长假装成人类,它可以非常出色地假装成一个特定的人。因此,我们需要关注的领域范围相当明确,并且有很多人正在为此努力。有一些与 AI 安全相关的东西,需要深入的研究和深入的工程设计,简单来说,它想做正确的事情,但它没有正确执行,结果伤害了某人。例如,自动驾驶汽车想要开得好,开得正确,但不知怎么的传感器坏了,或者它没有检测到某些东西。或者你知道,转弯太急或不管是什么。它做得不好。它做错了。因此,必须进行大量的工程设计,以确保通过确保产品正常运行来维护 AI 安全。 然后,最后你知道无论发生什么,如果系统,AI 想要做好事,但系统失败了。这意味着 AI 想要阻止某些事情发生,但结果就在它想做的时候,机器坏了。所以这与飞机内的飞行计算机有三个版本没有什么不同,所以系统内部有三重冗余,然后你有两个飞行员,然后你有空中交通管制,然后你有其他飞行员注意这些飞行员。因此,AI 安全系统必须被设计成一个社区,这样这些 AI 才能正常工作。当它们不能正常工作时,它们不会把人们置于危险之中。它们周围有足够的安全和安保系统,以确保我们保持 AI 的安全。所以这个对话的范围是巨大的,你知道我们必须把各个部分拆开,并像工程师一样构建它们。

VI. 限制与机遇

Cleo: 我们现在所处的这个时刻令人难以置信的事情之一是,我们不再拥有我们在 CPU 和顺序处理的世界中拥有的许多技术限制。我们不仅解锁了一种新的计算方式,而且还解锁了一种继续改进的方式。并行处理具有与我们在 CPU 上能够进行的改进不同的物理特性。我很好奇,在当前的世界中,您经常思考的科学或技术限制是什么?

Jensen Huang: 嗯,一切最终都取决于你在你所拥有的能量限制下能完成多少工作。所以这是一个物理限制,以及关于传输信息和传输比特、翻转比特和传输比特的物理定律,归根结底,做这件事所需的能量限制了我们能完成的事情。我们拥有的能量限制了我们能完成的事情。我们远没有遇到任何阻碍我们前进的根本限制。与此同时,我们寻求构建更好、更节能的计算机。这台小电脑,它的更大版本售价 25 万美元——拿起来?——是的,这是小宝贝 DGX,是的。这是一台 AI 超级计算机。我交付的版本,这只是一个原型,所以它是一个模型。第一个版本是 DGX 1,我在 2016 年交付给了 Open AI,售价 25 万美元。比这个版本多 10,000 倍的能量,这个版本有六倍的性能。我知道,这太不可思议了。我们正处于一个整体的世界中。而且仅仅从 2016 年开始,八年后,我们将计算的能效提高了 10,000 倍。想象一下,如果我们变得 10,000 倍节能,或者如果一辆汽车的能效提高了 10,000 倍,或者一个电灯泡的能效提高了 10,000 倍。我们的灯泡现在将是 100 瓦,而不是 10,000 倍,产生相同的照度。是的,所以我们一直在研究的计算能效,特别是 AI 计算的能效已经取得了令人难以置信的进步,这是必不可少的,因为我们希望创建你知道的更智能的系统,并且我们希望使用更多的计算来变得更智能,所以做这项工作的能效是我们的首要任务。

Cleo: 在我准备这次采访时,我和很多我的工程师朋友交谈过,这是他们非常想让我问的一个问题。所以您真的在和您的人说话。您已经展示了提高可访问性和抽象化的价值,通过 CUDA 和允许更多人以各种其他方式使用更多的计算能力。随着技术的应用变得越来越具体,我想到了 AI 中的 Transformer……对于观众来说,Transformer 是一种非常流行的、更新的 AI 结构,现在用于您见过的许多工具中。它们之所以受欢迎,是因为 Transformer 的结构方式有助于它们“注意”关键信息位并提供更好的结果。您可以构建完全适合一种 AI 模型的芯片,但如果您这样做,那么您将使它们无法做其他事情。因此,随着 AI 的这些特定结构或架构变得越来越流行,我的理解是,在您对“将它们烧录到芯片中”或设计非常特定于特定任务的硬件与保持更通用之间,存在着争论,所以我的问题是,您如何做出这些赌注?您如何考虑解决方案是可以去任何地方的汽车,还是真正优化火车从 A 点到 B 点?您正在下注,赌注很大,我很好奇您是如何考虑的。

Jensen Huang: 是的,这又回到了你的问题,你的核心信念是什么?问题是,核心信念要么是,Transformer 是任何研究人员将再次发现的最后一种 AI 算法、AI 架构,要么是 Transformer 是通往几年后几乎无法识别为 Transformer 的 Transformer 演变的垫脚石。我们相信后者。原因是因为你只需要回顾历史,问问自己,在计算机算法的世界里,在软件的世界里,在工程和创新的世界里,有一个想法能持续那么久吗?答案是否定的。所以这是一种美,事实上这是计算机的本质美,它今天能够做一些 10 年前甚至没有人想象到的事情。如果你在 10 年前把那台计算机变成微波炉,那么应用程序为什么会继续出现呢?因此,我们相信创新的丰富性和发明的丰富性,我们希望创建一个架构,让发明家、创新者、软件程序员和 AI 研究人员在其中畅游,并提出一些惊人的想法。看看 Transformer。Transformer 的基本特征是这个被称为“注意力机制”的想法,它基本上说 Transformer 将理解每个单词与每个其他单词的含义和相关性。所以如果你有 10 个单词,它必须找出它们之间 10 个单词的关系。但如果你有 100,000 个单词,或者如果你的上下文现在大到,读取一个 PDF 并读取一堆 PDF,上下文窗口现在就像一百万个标记,处理所有这些标记是不可能的。所以你解决这个问题的方法是,有很多新的想法,闪光注意力或分层注意力,或者你知道的,我前几天刚读到的波浪注意力。自 Transformer 以来发明的不同类型的注意力机制的数量非常惊人。 因此,我认为这将继续下去,我们相信它将继续下去,并且计算机科学还没有结束,AI 研究还没有全部放弃,无论如何我们还没有放弃,拥有一台能够实现研究和创新以及新想法的灵活性的计算机从根本上来说是最重要的。

Cleo: 我非常好奇的一件事是,您设计芯片。有些公司组装芯片。有些公司设计硬件,使其能够在纳米尺度上工作。当您设计这样的工具时,您如何看待在当前物理上可能实现的背景下的设计?您现在正在考虑用什么来推动这个极限?

Jensen Huang: 我们的做法是,即使我们让别人制造东西,例如我们的芯片是由 TSMC 制造的。即使我们让 TSMC 制造它们,我们也假设我们需要拥有 TSMC 所拥有的深厚专业知识。因此,我们公司里有人非常擅长半导体物理,所以我们有一种感觉,我们有一种直觉,即今天的半导体物理可以做什么。然后我们与他们密切合作以发现极限,因为我们正在努力突破极限,所以我们一起发现极限。现在,我们在系统工程和冷却系统方面也做同样的事情。事实证明,管道对我们来说非常重要,因为有液体冷却。也许风扇对我们来说非常重要,因为有空气冷却,我们正试图以几乎像你知道的那样设计这些风扇,它们在空气动力学上是合理的,这样我们就可以通过最大量的空气,产生最少的噪音。所以我们公司有空气动力学工程师。所以即使我们不制造它们,我们也会设计它们,并且我们必须拥有深厚的专业知识,知道如何制造它们。从那开始,我们试图突破极限。

Cleo: 这次谈话的一个主题是,您是一个对未来下大赌注的人,并且一次又一次地证明您对这些赌注的判断是正确的。我们谈到了 GPU,我们谈到了 CUDA,我们谈到了您在 AI 方面下的赌注——自动驾驶汽车,我们将正确地看待机器人——这是我的问题。您现在下的是什么赌注?

Jensen Huang: 我们在 CES 上刚刚描述了最新的赌注,我对此感到非常自豪,我对此非常兴奋,那就是 Omniverse 和 Cosmos 的融合,这样我们就有了这种新型的生成世界生成系统,这种多元宇宙生成系统。我认为这在机器人和物理系统的未来中将非常重要。 当然,我们正在与人类机器人合作,开发工具系统、训练系统和人类演示系统,以及您已经提到的所有这些东西,我们才刚刚看到这项工作的开始,我认为未来 5 年在人类机器人领域将非常有趣。当然,我们正在数字生物学方面所做的工作,这样我们就可以理解分子和细胞的语言,就像我们理解物理和物理世界的语言一样,我们希望理解人体的语言,理解生物学的语言。所以,如果我们能学会这一点,我们就能预测它。然后,突然之间,我们拥有人类数字孪生的能力是合理的。所以我对这项工作感到非常兴奋。我喜欢我们在气候科学方面所做的工作,并且能够从天气预报中,理解和预测高分辨率的区域气候,你头顶一公里内的天气模式。我们可以以很高的精度预测它,其影响非常深远。所以我们正在做的很多事情都非常酷。你知道,我们很幸运,我们创造了这个时间机器的工具,我们需要在我们刚刚谈到的所有这些领域中拥有时间机器,这样我们才能看到未来。如果我们能看到未来,我们就能预测未来,那么我们就有更好的机会让未来成为它的最佳版本。这就是科学家想要预测未来的原因。这就是为什么,这就是为什么我们试图预测未来,以及我们试图设计的一切,这样我们就可以优化最佳版本。

VII. 建议与总结

Cleo: 如果有人正在观看这个视频,也许他们在进入这个视频时知道 NVIDIA 是一家非常重要的公司,但不完全理解为什么或它如何影响他们的生活,他们现在有希望更好地理解我们在过去几十年中在计算领域经历的重大转变,这个非常令人兴奋、非常奇怪的时刻,我们现在所处的这个时刻,我们有点处于许多不同事物的悬崖边缘。如果他们想能够稍微展望一下未来,您会建议他们如何准备或思考他们现在所处的这个时刻,以及这些工具实际上将如何影响他们?

Jensen Huang: 嗯,有几种方法可以推理我们正在创造的未来。一种推理方法是,假设你的工作继续很重要,但你完成工作所需的努力从你知道的一周时间变成了几乎瞬间完成。你知道,苦差事的努力基本上为零。这意味着什么?这与如果突然之间我们在这个国家有了高速公路会发生什么非常相似?这种情况在上一次工业革命中确实发生了,突然之间我们有了州际高速公路,当你有州际高速公路时会发生什么?嗯,你知道郊区开始出现,突然之间你知道从东到西的货物分配不再是一个问题,突然之间加油站开始出现在高速公路上,快餐店出现了,你知道有人,一些汽车旅馆出现了,因为人们你知道穿越州、穿越国家,只是想在某个地方呆几个小时或过夜,所以突然之间新的经济和新的能力,新的经济。 如果视频会议使我们能够看到彼此而无需再旅行,会发生什么?突然之间,实际上可以远离家和工作,工作和生活得更远。所以你问自己这样的问题。你知道,如果我一直有一个软件程序员和我在一起会发生什么,无论我梦想什么,软件程序员都可以为我编写。你知道,如果我只有一个想法的种子会发生什么,我把它粗略地勾勒出来,突然之间你知道一个产品的原型被放在我面前?这将如何改变我的生活,这将如何改变我的机会?你知道它让我能够做什么,等等。所以我认为在接下来的十年里,智能,不是所有的事情,而是对于某些事情,基本上会变得超人。但我可以准确地告诉你那是什么感觉。我周围都是超人,从我的角度来看是超级智能,因为他们是世界上最擅长他们所做的事情的人,他们做的事情比我做得好得多。我周围有成千上万这样的人,但有一天这从未让我想到我不再是必需的。它实际上赋予了我力量,并给了我信心去解决更雄心勃勃的事情。所以假设,假设现在每个人都被这些在特定方面非常擅长或在某些方面擅长的超级 AI 包围。这会让你有什么感觉?嗯,它会赋予你力量,它会让你感到自信,我很确定你可能会使用 ChatGPT 和 AI,我今天感觉更有力量,更有信心去学习一些东西。几乎任何特定领域的知识,理解的障碍已经被降低了,我一直有一个私人导师陪伴着我。所以我认为这种感觉应该是普遍的。如果有一件事我会鼓励每个人去做,那就是立即给自己找一个 AI 导师。那个 AI 导师当然可以教你任何你想学的东西,帮助你编程,帮助你写作,帮助你分析,帮助你思考,帮助你推理,你知道所有这些事情都会让你感觉更有力量,我认为这将是我们的未来。我们将成为,我们将成为超人,不是因为我们有超级,我们将成为超人,因为我们有超级 AI。

Cleo: 您能给我们简单介绍一下这些物品吗?

Jensen Huang: 这是一个新的 GeForce 显卡,是的,这是 RTX 50 系列。它本质上是一台超级计算机,你可以把它放到你的电脑里,我们当然用它来玩游戏,今天人们用它来进行设计和创意艺术,它能做令人惊叹的 AI。这里真正的突破,这真的是一件了不起的事情,GeForce 启用了 AI,它使 Geoff Hinton、Ilya Sutskever 和 Alex Krizhevsky 能够训练 AlexNet。我们发现了 AI,我们推进了 AI,然后 AI 回到 GeForce 来帮助计算机图形学。所以这是一件令人惊叹的事情:在 4K 显示器中大约 800 万像素中,我们正在计算,我们正在处理的只有 50 万像素。其余的我们使用 AI 来预测。AI 猜对了,但图像是完美的。我们通过我们计算的 50 万像素来告知它,我们对每一个像素都进行了光线追踪,而且都很漂亮。它是完美的。然后我们告诉 AI,如果这些是这个屏幕中 50 万个完美的像素,那么另外 800 万个像素是什么?它会填充屏幕的其余部分,而且它是完美的。

Cleo: 如果你只需要做更少的像素,你是否能够投入更多,因为你需要做的更少,所以质量更好,所以 AI 所做的推断……

Jensen Huang: 完全正确。因为无论你有多少计算,无论你有多少注意力,无论你有什么资源,你都可以把它放到 50 万像素中。现在这是一个完美的例子,说明了为什么 AI 将使我们所有人都成为超人,因为它能做的所有其他事情,它都会为我们做,让我们能够把我们的时间和精力集中在我们做的真正有价值的事情上。所以我们将利用我们自己的资源,你知道的,这是能量密集型的,注意力密集型的,我们将它用于少数 10 万像素,并使用 AI 来进行超分辨率,将其升级到你知道的其他所有东西。所以这张显卡现在主要由 AI 驱动,里面的计算机图形技术也令人难以置信。然后是下一个,正如我之前提到的,2016 年我为 AI 研究人员构建了第一个,我们将第一个交付给了 Open AI,Elon 在那里接收它,这个版本我构建了一个迷你迷你版,原因是 AI 已经从 AI 研究人员扩展到每个工程师、每个学生、每个 AI 科学家。AI 将无处不在。所以我们将制造这些 3000 美元的版本,而不是这些 25 万美元的版本,学校可以拥有它们,你知道学生可以拥有它们,你把它放在你的 PC 或 Mac 旁边,突然之间你就拥有了自己的 AI 超级计算机。你可以开发和构建 AI。构建你自己的 AI,构建你自己的 R2-D2。

Cleo: 您觉得有什么重要的事情是这个观众需要知道而我没有问的?

Jensen Huang: 我会建议的最重要的事情之一是,例如,如果我今天是一名学生,我要做的第一件事就是学习 AI。我如何学习与 ChatGPT 交互,我如何学习与 Gemini Pro 交互,我如何学习与 Grok 交互?学习如何与 AI 交互,与非常擅长提问的人非常相似。你非常擅长提问,提示 AI 非常非常相似。你不能只是随机问一堆问题,所以要求 AI 成为你的助手需要一些专业知识和技巧,以及如何提示它。所以如果我,如果我今天是一名学生,不管它是为了数学、科学、化学、生物学,还是不管我要进入什么科学领域或什么职业,我都会问自己,我如何才能利用 AI 来更好地完成我的工作?如果我想成为一名律师,我如何才能利用 AI 成为一名更好的律师?如果我想成为一名更好的医生,我如何才能利用 AI 成为一名更好的医生?如果我想成为一名化学家,我如何才能利用 AI 成为一名更好的化学家?如果我想成为一名生物学家,我如何才能利用 AI 成为一名更好的生物学家?这个问题应该在每个人中持续存在。正如我这一代人成长为第一代人,我们必须问自己,我们如何才能利用计算机来更好地完成我们的工作?是的,我们之前的那一代人没有电脑,我这一代人是第一代人,我们必须问这个问题,我如何才能利用计算机来更好地完成我的工作?记住,我在 Windows 95 之前进入了这个行业,对吧,1984 年办公室里没有电脑。在那之后不久,电脑开始出现,所以我们不得不问自己,我们如何才能利用电脑来更好地完成我们的工作?下一代不必问这个问题,但它必须问下一个问题,我如何才能利用 AI 来更好地完成我的工作?我认为这是每个人的开始和结束。

Cleo: 对于每个人来说,这都是一个非常令人兴奋、令人恐惧,但也非常值得思考的问题。

Jensen Huang: 我认为这将非常有趣。AI 显然是一个人们现在才刚刚开始学习的词,但它只是,你知道的,它让你的电脑更容易访问。提示 ChatGPT 问它任何你想问的问题比自己去研究更容易。因此,我们降低了理解的门槛,我们降低了知识的门槛,我们降低了智能的门槛,每个人都真的必须去尝试。你知道真正疯狂的事情是,如果我把一台电脑放在某人面前,而他们从未使用过电脑,他们不可能在一天内学会那台电脑。这是不可能的。真的必须有人给你演示,但对于 ChatGPT,如果你不知道如何使用它,你所要做的就是输入“我不知道如何使用 ChatGPT,告诉我”,它会回来给你一些例子,所以这就是令人惊奇的事情。你知道关于智能的令人惊奇的事情是,它会一路帮助你,让你在这一路上成为超人,你知道的。

VIII. 黄仁勋希望如何被记住?

Cleo: 好的,如果您还有时间,我还有一个问题。这不是我计划要问你的,但在来这里的路上,我有点害怕飞机,这不是我最理性的品质,这里的飞行有点颠簸,非常颠簸,我坐在那里,它在移动,我在想他们会在我的葬礼上说什么,之后——她问了好问题,这就是墓碑上要说的——我希望如此!是的。在我爱我的丈夫、我的朋友和我的家人之后,我希望他们会谈论的是乐观。我希望他们能认识到我在这里试图做的事情。我很好奇,您已经做了很长时间了,感觉您在这段描述中有很多关于未来的愿景,您希望人们说您在尝试做什么的主题是什么?

Jensen Huang: 很简单,他们产生了非凡的影响。我认为我们很幸运,因为很久以前的一些核心信念,并坚持这些核心信念,并在这些信念的基础上发展,我们发现自己今天成为世界上许多最重要和最有影响力的技术公司之一,而且可能是有史以来。因此,我们非常认真地对待这一责任。我们努力确保我们创造的能力可供大公司以及各个科学领域的个人研究人员和开发人员使用,无论是否盈利,无论大小,无论是否出名。正是因为理解了我们正在做的具有重大意义的工作,以及它对这么多人的潜在影响,我们希望尽可能广泛地提供这种能力。我确实认为,当我们回顾几年后,我确实希望下一代意识到的是,他们,首先,他们会因为我们创造的所有你知道的游戏技术而认识我们。我确实认为,我们将回顾整个数字生物学和生命科学领域已经发生了转变。我们对材料科学的整个理解已经彻底改变。机器人正在帮助我们在世界各地做危险和单调的事情。如果我们想开车,我们可以开车,但否则你知道打个盹或像在家庭影院里一样享受你的汽车,你知道从工作到家的路上,在那时你希望你住得很远,这样你就可以在车里呆更长时间。你回头看,你会意识到几乎所有这些事情的中心都有一家公司,而这家公司恰好是你从小玩游戏的公司。我希望下一代能学到这一点。

Cleo: 非常感谢您抽出时间。

Jensen Huang: 我很享受,谢谢!

Cleo: 我很高兴!