Diego Rivas · 2026-01-30

Project Genie：生成式无限互动世界的实验性探索

摘要

Google DeepMind宣布推出Project Genie，这是一款基于Genie 3世界模型的实验性网络应用。该工具目前向美国Google AI Ultra订阅用户开放，支持用户通过文字或图像创建实时生成的互动环境，并以第一或第三人称视角进行探索。世界模型能够模拟物理交互，随着用户的移动实时生成前方路径。Google承认当前版本存在画面真实度、角色控制和时长限制等不足，并表示将持续改进。

内容框架与概述

文章首先介绍了世界模型的概念及其在AGI发展中的重要性。世界模型能够模拟环境动态，预测环境演化及行动后果。Google DeepMind开发了Genie 3作为通用世界模型，能够生成多样化的互动环境，与静态三维体验不同，它能够在用户移动和交互时实时生成前方路径。

接着文章详细说明了Project Genie的三项核心功能。世界草图功能允许用户通过文字、生成或上传的图像创建不断扩展的环境，并与Nano Banana Pro集成以实现精细控制。世界探索功能将世界打造为可导航的环境，根据用户行动实时生成路径。世界混合功能则支持用户在现有提示基础上重新诠释世界，也可以浏览精选世界获取灵感，完成后可下载探索视频。

最后文章讨论了负责任开发方面的考量。作为早期研究模型，Project Genie存在生成画面真实度不足、角色控制不精确、交互延迟较高以及生成时长限制在60秒内等已知问题。部分Genie 3模型能力如可提示事件功能尚未在此原型中实现。Google计划通过收集更多用户反馈来持续改进体验，并逐步扩大服务地域范围。