Gemini 3.1 Pro 模型卡片发布
摘要
Gemini 3.1 Pro是Google最新发布的高级多模态推理模型,于2026年2月推出。该模型基于Gemini 3 Pro构建,支持最高100万token的上下文窗口和6.4万token输出,可处理文本、音频、图像、视频及完整代码库。在推理、编码、代理工具使用、多语言和长上下文等多项基准测试中,Gemini 3.1 Pro均展现出领先性能,尤其在ARC-AGI-2抽象推理、GPQA科学知识、Terminal-Bench 2.0终端编码等任务上取得最高分。
内容框架与概述
文章开篇说明模型卡片的目的在于提供模型的关键信息,包括已知限制、缓解方法和安全性能。主体部分依次介绍模型基本信息(描述、依赖、输入输出、架构)、训练数据与处理、硬件与软件实现、发布渠道、评估结果以及使用限制与安全策略。评估部分详细列出了与Gemini 3 Pro、Sonnet 4.6、Opus 4.6、GPT-5.2等竞品的对比数据,覆盖学术推理、抽象推理、代码生成、多模态理解等多个维度。
核心概念及解读
原生多模态推理:指模型从一开始就被训练为同时理解和处理多种模态(文本、图像、音频、视频等)的信息,而非事后拼接不同模型。
上下文窗口:指模型单次处理的最大token数量,Gemini 3.1 Pro支持100万token输入和6.4万token输出,适用于长文档和大规模代码库分析。
代理工具使用(Agentic Tool Use):模型能够自主调用外部工具(如搜索引擎、代码执行器)来完成复杂任务,Terminal-Bench和SWE-Bench等基准测试评估这一能力。
长上下文性能:模型处理超长文档的能力,MRCR v2测试显示其在128k上下文长度下达到84.9%的准确率,与Sonnet 4.6持平。
人类终考(Humanity’s Last Exam):涵盖广泛学术领域的综合推理基准,Gemini 3.1 Pro在无工具条件下取得44.4%分数,结合搜索和代码工具后提升至51.4%。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Gemini 3.1 Pro - Model Card |
| 作者 | Google DeepMind |
| 发表日期 | 2026-02-19 |
此摘要卡片由 AI 自动生成