2025-04-09
Google Cloud Next 2025 AI发布会全景解读
摘要
谷歌云在2025年度大会上发布了全栈AI创新成果,涵盖第七代TPU Ironwood芯片、Gemini 2.5系列模型、AI Hypercomputer超算架构、Agent Development Kit智能体开发框架以及Agentspace企业智能体平台,并宣布年度资本支出约750亿美元,全面推进基础设施、模型能力与行业应用落地。
核心概念及解读
Ironwood TPU:谷歌第七代张量处理单元,性能为初代公开TPU的3600倍,单Pod超9000芯片,算力达42.5 exaflops,专为下一代AI模型训练与推理设计
Gemini 2.5 Pro:谷歌迄今最智能的大语言模型,具备原生思考推理能力,在ChatbotArena排名第一,支持多模态输出与工具调用
AI Hypercomputer:谷歌推出的超级计算架构,统一多种硬件平台与软件栈,简化AI部署流程并优化性能与成本
Agent2Agent Protocol(A2A):一种开放协议,允许不同模型和框架构建的AI智能体之间进行跨系统通信与协作
Agentspace:面向企业员工的智能体应用平台,集成搜索、对话AI、深度研究等能力,可连接企业数据与应用并执行自动化操作
I. 引言与谷歌云愿景
- 开场强调全球组织正利用创新解决方案推动变革、提升效率、赋能员工、吸引客户和促进增长。
- 谷歌云CEO Thomas Kurian回顾过去一年的成就:
- 2024年发布超过3000项产品更新。
- 谷歌云区域扩展至42个,并计划进一步扩展。
- 扩展了200万英里的陆地和海底光纤网络,并宣布了新的海底光缆项目。
- 谷歌AI发展势头强劲:
- 超过400万开发者使用Gemini。
- Vertex AI使用量去年增长 $20$ 倍。
- Google Workspace每月提供超过20亿次AI辅助。
- 本次大会将分享超过500个客户利用AI实现业务创新的成功案例。
- 谷歌正投资于技术和生态系统,以支持客户的增长和转型。
- 谷歌与Alphabet CEO Sundar Pichai发言:
- AI是推进谷歌及客户使命的最重要方式。
- 谷歌投资全栈AI创新,从基础设施到模型和产品。
- 计划在2025年投资约 $750$ 亿美元的总资本支出,主要用于服务器和数据中心,支持AI计算和云业务。
- 谷歌基础设施支持全球数十亿用户,并用于训练最强大的Gemini模型。
II. 基础设施创新
- 推出Cloud Wide Area Network (WAN):
- 利用谷歌全球规模的网络。
- 优化应用性能,性能提升超过 $40\%$,总拥有成本降低高达 $40\%$。
- Citadel Securities和雀巢等公司已在使用。
- 宣布第七代TPU - Ironwood:
- 将于今年晚些时候推出。
- 性能是首款公开TPU的 $3600$ 倍,能效提升 $29$ 倍。
- 是谷歌有史以来最强大的芯片,支持下一代AI模型。
- 量子计算进展:
- 最新量子芯片Willow解决了困扰研究人员三十年的量子纠错关键挑战。
- AI计算需求增长迅猛:
- 过去8年,年复合增长率超过 $10$ 倍,总增长达 $10^8$ 倍。
- Ironwood TPU Pods细节:
- 每个Pod拥有超过9000个芯片,计算能力达 $42.5$ exaflops,是世界第一超算的 $24$ 倍以上。
- AI Hypercomputer:
- 旨在简化AI部署、提高性能、优化成本的超级计算系统。
- 支持多种硬件平台(包括NVIDIA的GB200, B200 GPU,未来将支持Vera Rubin GPU)和统一软件栈。
- 推出Cluster Director管理大规模加速器。
- 存储创新:
- Hyperdisk Exapools:提供业界领先的聚合性能和容量。
- Anywhere Cache:数据靠近加速器,存储延迟降低高达 $70\%$。
- Rapid Storage:区域对象存储,随机读写延迟降低 $5$ 倍。
- 软件与编排增强:
- Google Kubernetes Engine (GKE) 新增推理能力:降低成本达 $30\%$,尾延迟降低 $60\%$,吞吐量提高 $40\%$。
- Pathways:Google DeepMind开发的分布式机器学习运行时首次向云客户开放,支持多主机推理。
- vLLM on TPUs:支持已为GPU优化PyTorch与vLLM的客户在TPU上运行。
- 性能与成本效益:
- Gemini 2.0 Flash 在AI Hypercomputer上实现每美元智能输出比GPT-4o高 $24$ 倍,比DeepSeek R1高 $5$ 倍。
- Google Distributed Cloud (GDC):
- 将谷歌硬件和软件带到客户环境(本地或气隙环境)。
- 宣布Gemini可在GDC上本地运行。
- 支持NVIDIA Confidential Computing和Blackwell系统。
- GDC气隙产品已获美国政府Secret和Top Secret任务授权。
- 与NVIDIA的合作:
- Jensen Huang强调双方深度合作,将通过GDC把最先进的AI带给受监管行业和国家。
III. AI模型与平台
- Gemini模型家族:
- 推出Gemini 2.0,具有原生图像/音频输出和工具使用能力。
- 推出Gemini 2.5 Pro:具备“思考”(Thinking)能力,是谷歌迄今最智能模型,ChatbotArena排名第一,在高级推理基准测试中表现优异。
- 推出Gemini 2.5 Flash:低延迟、高性价比,内置思考能力。
- Gemini已应用于谷歌所有主要产品(15个用户超5亿的产品)。
- Gemini在Workspace中的应用:助力Rivian、Freshfields、Schwarz Group等客户。
- Workspace新功能:Sheets中的“Help Me Analyze”、Docs中的“Audio Overviews”、Workspace Flows自动化流程。
- 其他生成式模型:
- Imagen 3:更高质量的文本到图像模型,细节更丰富,伪影更少。
- Chirp 3:通过短语音输入创建自定义语音。
- Lyria:文本到音乐生成模型,首家提供此功能的超大规模云服务商。
- Veo 2:行业领先的视频生成模型,可生成数分钟4K视频,带SynthID水印,提供高级编辑控制(镜头预设、首尾帧控制、动态修复/外扩)。
- 谷歌是唯一提供跨所有模态(文本、图像、音频、视频、音乐)生成模型的公司。
- Vertex AI平台:
- 提供发现、定制、部署基础模型和构建管理AI智能体的综合平台。
- 客户案例:Intuit(Document AI简化报税)、Nokia、Wayfair、AES、Commerzbank、Seattle Children’s、UWM、Honeywell。
- 增长迅速:Gemini在Vertex AI上的使用量增长超 $40$ 倍,每月数十亿次API调用。
- Model Garden:提供超过200个模型,包括谷歌自有模型、第三方模型(如Meta Llama 4)和开源模型(如Ai2模型)。
- 增强的Grounding能力:连接任意数据源/向量数据库(新增支持NetApp存储)、企业应用(Oracle, SAP等),结合Google Search、企业数据、Google Maps等确保模型回复的事实性。
- 客户案例:Deutsche Bank使用Gemini和Vertex AI构建AI研究助手DB Lumina。
IV. AI智能体 (AI Agents)
- A. 智能体框架与开发:
- 定义:智能体是展现推理、规划、记忆和工具使用能力的系统。
- 推出Agent Development Kit (ADK):简化复杂多智能体系统构建的开源框架,支持Gemini。
- 支持Model Context Protocol (MCP):统一模型与数据源/工具交互方式。
- 推出Agent2Agent Protocol (A2A):实现不同模型/框架构建的智能体间通信,得到Lang Graph、Crew AI等伙伴支持。
- B. 智能体应用空间 (Agentspace):
- 推出Google Agentspace:面向员工,用于查找/综合信息、与AI智能体对话并让其代为操作企业应用的平台。
- 集成企业搜索、对话AI、Gemini及第三方智能体、工具(连接器)、安全与合规性。
- Agentspace演示:模拟银行客户经理使用场景,创建个人监控智能体、调用深度研究智能体、进行现金流预测、起草邮件。
- Agentspace与Chrome浏览器集成,可直接在搜索框访问企业数据。
- 内置Google专家智能体:NotebookLM(笔记与研究)、Idea Generation(创意生成)、Enterprise Deep Research(企业深度研究)。
- 客户案例:KPMG、Cohesity、Gordon Food Services、Rubrik、Wells Fargo。
- C. 智能体应用领域:
- 客户智能体:
- Vertex AI Search赋能客户发现(Reddit Answers, Lowe’s, Mercado Libre)。
- Customer Engagement Suite (CES) 提升客户服务(DBS银行、Loveholidays、YouTube、Verizon)。
- 下一代CES:更自然的语音与情感理解、流视频支持、无代码构建、工具集成。
- CES演示:模拟家居园艺购物场景,展示语音/视频交互、升级人工座席干预流程。
- 行业特定智能体:Wendy’s(汽车穿梭点餐)、Mercedes-Benz(车载对话搜索)、Home Depot(家居改善指导)。
- 创意智能体:
- 赋能媒体、营销、设计等创意团队。
- 案例:Sphere《绿野仙踪》项目(使用Veo 2)、WPP Open平台、Monks.Flow、Brandtech Group Pencil、Mondelez。
- 与Adobe合作:将Imagen 3和Veo 2模型引入Adobe Express等应用。
- 数据智能体:
- 帮助数据团队管理数据,业务团队激活数据。
- 案例:Mattel(利用Gemini分析消费者反馈)。
- BigQuery平台:支持结构化与非结构化数据,支持开放格式,跨云访问,集成Oracle OCI。
- 推出面向数据工程、数据科学、业务分析师的专业智能体。
- 案例:Spotify、Unilever、Bayer、Nuro、内华达州政府(加速福利审批)。
- 数据科学演示:使用BigQuery Data Canvas和Notebooks,结合Gemini智能体分析现金流问题,展示从数据准备到模型预测的全流程自动化。
- 编码智能体:
- Gemini Code Assist:企业版理解代码库、标准和惯例。
- 案例:雷诺集团Ampere、Broadcom、CME Group、Paypal、WiPro。
- 推出新的Code Assist智能体:支持代码现代化、完整软件开发生命周期,提供看板交互界面。
- 集成Atlassian、Sentry、Snyk等伙伴工具。
- Gemini也可在Aider、Cursor、GitHub Copilot、Replit等第三方工具中使用。
- 安全智能体:
- 提升安全分析师速度和效率。
- 整合Mandiant威胁情报、SecOps平台、云安全(虚拟红队)、Mandiant服务。
- 推出新的安全智能体:分析恶意软件、分类警报。
- 案例:Charles Schwab、Vertiv、Dun & Bradstreet、Vodafone、新加坡政府。
- 推出Google Unified Security (GUS):融合安全能力的一体化解决方案。
- GUS演示:展示如何检测开发者误操作导致的数据泄露、VM遭受攻击,并自动响应、推荐加固措施(Model Armor)。
V. 生态系统与互操作性
- 宣布收购网络安全公司Wiz的最终协议。
- 谷歌云通过四种方式促进创新整合:
- 跨云连接:Cross-Cloud Interconnect、联合身份认证(Microsoft Entra ID)、BigQuery/AlloyDB跨云访问。
- ISV集成:通过Google Cloud Marketplace提供预集成解决方案。
- 服务伙伴:Accenture、Capgemini、Deloitte等合作伙伴基于谷歌云推出智能体。
- 主权云:与合作伙伴共同提供满足国际法规的Google Cloud Sovereign AI服务。
VI. 总结
- 谷歌致力于提供领先的企业级AI优化平台、开放的多云平台和互操作性,帮助客户创新并加速AI投资回报。
- 感谢与会者,并宣布下一届Google Cloud Next将于2026年4月22日至24日在拉斯维加斯举行。