2025-04-09

Google Cloud Next 2025 AI发布会全景解读

摘要

谷歌云在2025年度大会上发布了全栈AI创新成果，涵盖第七代TPU Ironwood芯片、Gemini 2.5系列模型、AI Hypercomputer超算架构、Agent Development Kit智能体开发框架以及Agentspace企业智能体平台，并宣布年度资本支出约750亿美元，全面推进基础设施、模型能力与行业应用落地。

核心概念及解读

Ironwood TPU：谷歌第七代张量处理单元，性能为初代公开TPU的3600倍，单Pod超9000芯片，算力达42.5 exaflops，专为下一代AI模型训练与推理设计

Gemini 2.5 Pro：谷歌迄今最智能的大语言模型，具备原生思考推理能力，在ChatbotArena排名第一，支持多模态输出与工具调用

AI Hypercomputer：谷歌推出的超级计算架构，统一多种硬件平台与软件栈，简化AI部署流程并优化性能与成本

Agent2Agent Protocol（A2A）：一种开放协议，允许不同模型和框架构建的AI智能体之间进行跨系统通信与协作

Agentspace：面向企业员工的智能体应用平台，集成搜索、对话AI、深度研究等能力，可连接企业数据与应用并执行自动化操作

I. 引言与谷歌云愿景

开场强调全球组织正利用创新解决方案推动变革、提升效率、赋能员工、吸引客户和促进增长。
谷歌云CEO Thomas Kurian回顾过去一年的成就：
- 2024年发布超过3000项产品更新。
- 谷歌云区域扩展至42个，并计划进一步扩展。
- 扩展了200万英里的陆地和海底光纤网络，并宣布了新的海底光缆项目。
谷歌AI发展势头强劲：
- 超过400万开发者使用Gemini。
- Vertex AI使用量去年增长 $20$ 倍。
- Google Workspace每月提供超过20亿次AI辅助。
本次大会将分享超过500个客户利用AI实现业务创新的成功案例。
谷歌正投资于技术和生态系统，以支持客户的增长和转型。
谷歌与Alphabet CEO Sundar Pichai发言：
- AI是推进谷歌及客户使命的最重要方式。
- 谷歌投资全栈AI创新，从基础设施到模型和产品。
- 计划在2025年投资约 $750$ 亿美元的总资本支出，主要用于服务器和数据中心，支持AI计算和云业务。
- 谷歌基础设施支持全球数十亿用户，并用于训练最强大的Gemini模型。

II. 基础设施创新

推出Cloud Wide Area Network (WAN)：
- 利用谷歌全球规模的网络。
- 优化应用性能，性能提升超过 $40\%$，总拥有成本降低高达 $40\%$。
- Citadel Securities和雀巢等公司已在使用。
宣布第七代TPU - Ironwood：
- 将于今年晚些时候推出。
- 性能是首款公开TPU的 $3600$ 倍，能效提升 $29$ 倍。
- 是谷歌有史以来最强大的芯片，支持下一代AI模型。
量子计算进展：
- 最新量子芯片Willow解决了困扰研究人员三十年的量子纠错关键挑战。
AI计算需求增长迅猛：
- 过去8年，年复合增长率超过 $10$ 倍，总增长达 $10^8$ 倍。
Ironwood TPU Pods细节：
- 每个Pod拥有超过9000个芯片，计算能力达 $42.5$ exaflops，是世界第一超算的 $24$ 倍以上。
AI Hypercomputer：
- 旨在简化AI部署、提高性能、优化成本的超级计算系统。
- 支持多种硬件平台（包括NVIDIA的GB200, B200 GPU，未来将支持Vera Rubin GPU）和统一软件栈。
- 推出Cluster Director管理大规模加速器。
存储创新：
- Hyperdisk Exapools：提供业界领先的聚合性能和容量。
- Anywhere Cache：数据靠近加速器，存储延迟降低高达 $70\%$。
- Rapid Storage：区域对象存储，随机读写延迟降低 $5$ 倍。
软件与编排增强：
- Google Kubernetes Engine (GKE) 新增推理能力：降低成本达 $30\%$，尾延迟降低 $60\%$，吞吐量提高 $40\%$。
- Pathways：Google DeepMind开发的分布式机器学习运行时首次向云客户开放，支持多主机推理。
- vLLM on TPUs：支持已为GPU优化PyTorch与vLLM的客户在TPU上运行。
性能与成本效益：
- Gemini 2.0 Flash 在AI Hypercomputer上实现每美元智能输出比GPT-4o高 $24$ 倍，比DeepSeek R1高 $5$ 倍。
Google Distributed Cloud (GDC)：
- 将谷歌硬件和软件带到客户环境（本地或气隙环境）。
- 宣布Gemini可在GDC上本地运行。
- 支持NVIDIA Confidential Computing和Blackwell系统。
- GDC气隙产品已获美国政府Secret和Top Secret任务授权。
与NVIDIA的合作：
- Jensen Huang强调双方深度合作，将通过GDC把最先进的AI带给受监管行业和国家。

III. AI模型与平台

Gemini模型家族：
- 推出Gemini 2.0，具有原生图像/音频输出和工具使用能力。
- 推出Gemini 2.5 Pro：具备“思考”（Thinking）能力，是谷歌迄今最智能模型，ChatbotArena排名第一，在高级推理基准测试中表现优异。
- 推出Gemini 2.5 Flash：低延迟、高性价比，内置思考能力。
- Gemini已应用于谷歌所有主要产品（15个用户超5亿的产品）。
- Gemini在Workspace中的应用：助力Rivian、Freshfields、Schwarz Group等客户。
- Workspace新功能：Sheets中的“Help Me Analyze”、Docs中的“Audio Overviews”、Workspace Flows自动化流程。
其他生成式模型：
- Imagen 3：更高质量的文本到图像模型，细节更丰富，伪影更少。
- Chirp 3：通过短语音输入创建自定义语音。
- Lyria：文本到音乐生成模型，首家提供此功能的超大规模云服务商。
- Veo 2：行业领先的视频生成模型，可生成数分钟4K视频，带SynthID水印，提供高级编辑控制（镜头预设、首尾帧控制、动态修复/外扩）。
- 谷歌是唯一提供跨所有模态（文本、图像、音频、视频、音乐）生成模型的公司。
Vertex AI平台：
- 提供发现、定制、部署基础模型和构建管理AI智能体的综合平台。
- 客户案例：Intuit（Document AI简化报税）、Nokia、Wayfair、AES、Commerzbank、Seattle Children’s、UWM、Honeywell。
- 增长迅速：Gemini在Vertex AI上的使用量增长超 $40$ 倍，每月数十亿次API调用。
- Model Garden：提供超过200个模型，包括谷歌自有模型、第三方模型（如Meta Llama 4）和开源模型（如Ai2模型）。
- 增强的Grounding能力：连接任意数据源/向量数据库（新增支持NetApp存储）、企业应用（Oracle, SAP等），结合Google Search、企业数据、Google Maps等确保模型回复的事实性。
- 客户案例：Deutsche Bank使用Gemini和Vertex AI构建AI研究助手DB Lumina。

IV. AI智能体 (AI Agents)

A. 智能体框架与开发：
- 定义：智能体是展现推理、规划、记忆和工具使用能力的系统。
- 推出Agent Development Kit (ADK)：简化复杂多智能体系统构建的开源框架，支持Gemini。
- 支持Model Context Protocol (MCP)：统一模型与数据源/工具交互方式。
- 推出Agent2Agent Protocol (A2A)：实现不同模型/框架构建的智能体间通信，得到Lang Graph、Crew AI等伙伴支持。
B. 智能体应用空间 (Agentspace)：
- 推出Google Agentspace：面向员工，用于查找/综合信息、与AI智能体对话并让其代为操作企业应用的平台。
- 集成企业搜索、对话AI、Gemini及第三方智能体、工具（连接器）、安全与合规性。
- Agentspace演示：模拟银行客户经理使用场景，创建个人监控智能体、调用深度研究智能体、进行现金流预测、起草邮件。
- Agentspace与Chrome浏览器集成，可直接在搜索框访问企业数据。
- 内置Google专家智能体：NotebookLM（笔记与研究）、Idea Generation（创意生成）、Enterprise Deep Research（企业深度研究）。
- 客户案例：KPMG、Cohesity、Gordon Food Services、Rubrik、Wells Fargo。
C. 智能体应用领域：
- 1. 客户智能体：
  - Vertex AI Search赋能客户发现（Reddit Answers, Lowe’s, Mercado Libre）。
  - Customer Engagement Suite (CES) 提升客户服务（DBS银行、Loveholidays、YouTube、Verizon）。
  - 下一代CES：更自然的语音与情感理解、流视频支持、无代码构建、工具集成。
  - CES演示：模拟家居园艺购物场景，展示语音/视频交互、升级人工座席干预流程。
  - 行业特定智能体：Wendy’s（汽车穿梭点餐）、Mercedes-Benz（车载对话搜索）、Home Depot（家居改善指导）。
- 1. 创意智能体：
  - 赋能媒体、营销、设计等创意团队。
  - 案例：Sphere《绿野仙踪》项目（使用Veo 2）、WPP Open平台、Monks.Flow、Brandtech Group Pencil、Mondelez。
  - 与Adobe合作：将Imagen 3和Veo 2模型引入Adobe Express等应用。
- 1. 数据智能体：
  - 帮助数据团队管理数据，业务团队激活数据。
  - 案例：Mattel（利用Gemini分析消费者反馈）。
  - BigQuery平台：支持结构化与非结构化数据，支持开放格式，跨云访问，集成Oracle OCI。
  - 推出面向数据工程、数据科学、业务分析师的专业智能体。
  - 案例：Spotify、Unilever、Bayer、Nuro、内华达州政府（加速福利审批）。
  - 数据科学演示：使用BigQuery Data Canvas和Notebooks，结合Gemini智能体分析现金流问题，展示从数据准备到模型预测的全流程自动化。
- 1. 编码智能体：
  - Gemini Code Assist：企业版理解代码库、标准和惯例。
  - 案例：雷诺集团Ampere、Broadcom、CME Group、Paypal、WiPro。
  - 推出新的Code Assist智能体：支持代码现代化、完整软件开发生命周期，提供看板交互界面。
  - 集成Atlassian、Sentry、Snyk等伙伴工具。
  - Gemini也可在Aider、Cursor、GitHub Copilot、Replit等第三方工具中使用。
- 1. 安全智能体：
  - 提升安全分析师速度和效率。
  - 整合Mandiant威胁情报、SecOps平台、云安全（虚拟红队）、Mandiant服务。
  - 推出新的安全智能体：分析恶意软件、分类警报。
  - 案例：Charles Schwab、Vertiv、Dun & Bradstreet、Vodafone、新加坡政府。
  - 推出Google Unified Security (GUS)：融合安全能力的一体化解决方案。
  - GUS演示：展示如何检测开发者误操作导致的数据泄露、VM遭受攻击，并自动响应、推荐加固措施（Model Armor）。

V. 生态系统与互操作性

宣布收购网络安全公司Wiz的最终协议。
谷歌云通过四种方式促进创新整合：
- 跨云连接：Cross-Cloud Interconnect、联合身份认证（Microsoft Entra ID）、BigQuery/AlloyDB跨云访问。
- ISV集成：通过Google Cloud Marketplace提供预集成解决方案。
- 服务伙伴：Accenture、Capgemini、Deloitte等合作伙伴基于谷歌云推出智能体。
- 主权云：与合作伙伴共同提供满足国际法规的Google Cloud Sovereign AI服务。

VI. 总结

谷歌致力于提供领先的企业级AI优化平台、开放的多云平台和互操作性，帮助客户创新并加速AI投资回报。
感谢与会者，并宣布下一届Google Cloud Next将于2026年4月22日至24日在拉斯维加斯举行。

‹

Google 官方提示工程白皮书

Lee Boonstra · 2025-04-10

主动自觉地使用AI现已成为Shopify的基本要求

Tobi Lutke · 2025-04-07

›

Google Cloud Next 2025 AI发布会全景解读

摘要

核心概念及解读

目录