Google for Developers · 2025-08-14

Demis Hassabis专访:从游戏AI到世界模型,AGI进化的真实路径

摘要

Google DeepMind CEO Demis Hassabis在《Release Notes》播客中系统梳理了从游戏AI到思考型模型、世界模型的技术演进。他分享了DeepMind如何通过Genie 3等项目推动AI理解现实世界,阐述了"多模态+工具+系统"的AGI路径,并介绍了以Kaggle Game Arena为代表的新型AI评测体系。Demis强调,未来AI不仅要能感知和输出,更要具备深度思考、世界理解和自我进化能力。

内容框架与概述

本次访谈围绕DeepMind的技术演进路径展开,首先梳理了从AlphaGo、AlphaZero等游戏AI到"思考型模型"的发展脉络。Demis指出,DeepMind近期发布节奏极快,几乎每天都有新突破,包括Deep Think、IMO金牌、Genie 3等。这种"agent+思考"范式被认为是迈向AGI的必经之路,AI不仅要能做出第一个反应,更要能反复自我修正和优化思路。

核心技术突破集中在Genie 3与世界模型方向。所谓世界模型,就是AI不仅理解语言和数学,还能理解物理世界的结构、规律、材料、流体、生命体等。Genie 3的突破在于保证了"世界一致性"——比如你离开房间再回来,物体还在原位。这种物理一致性是AI理解现实的关键标志,已被用于训练SIMA等游戏智能体,实现"AI在AI生成世界中自主探索"。

在AI评测方面,传统评测如AIME数学题已接近饱和,Deep Think已达99.2%。Demis认为需要更难、更广、更真实的评测体系。Kaggle Game Arena采用"AI对AI竞技"思路,通过多样化游戏自动生成难度和评分,避免传统题库泄题、过拟合等问题。游戏作为评测场景具有客观可量化、自动扩展难度、可引入多智能体挑战等优势。

关于AI产品化,Demis指出AI正从"单一大模型"向"系统化"演进,未来AI产品将是"模型+工具+系统"的组合。产品化挑战在于AI能力进化极快,产品设计需"可插拔",能随时替换底层引擎。DeepMind正推动Genie、Veo、Gemini等多条技术线融合,目标是打造"omni model"(全能模型),实现"一个模型做所有事"。

核心概念及解读

世界模型(World Model):AI必须理解物理世界的结构、规律和一致性,才能实现通用智能和现实应用。这不仅包括语言和数学,还包括物理、材料、流体、生命体等现实世界要素。世界模型是AI"走出屏幕"、在现实中自主行动的前提。

思考型模型(Thinking Models):从游戏AI演化而来的一条主线,强调AI不仅要感知和输出,还能自主规划、推理和决策。类似人类的深度思考过程,AI需要"反复自我修正和优化思路",而不仅仅是做出第一个反应。

系统化AI(From Model to System):未来AI产品将由"模型+工具+系统"组成,能力边界动态扩展。模型不仅能推理,还能调用外部工具(如搜索、代码、物理模拟器等),实现更强的复合能力。部分能力应内置于主模型,部分则以外部工具形式存在。

新型评测体系(Game Arena):AI能力评测需覆盖推理、物理智能、多目标权衡、安全性等多维度。Kaggle Game Arena通过"AI对AI竞技"自动生成难度,避免传统题库泄题和过拟合问题,推动AI能力全面进化。

Omni Model愿景:未来AGI是多模态、全能型模型,能在语言、视觉、物理、推理等各领域均衡表现。DeepMind正推动Genie、Veo、Gemini等多条技术线融合,目标是打造"一个模型做所有事"的全能智能体。


原文信息

字段内容
原文Demis Hassabis专访:从游戏AI到世界模型,AGI进化的真实路径
作者Google for Developers
发表日期2025-08-14

此文档由 AI 自动整理