Google DeepMind · 2026-02-19

Gemini 3.1 Pro 模型卡片发布

摘要

Gemini 3.1 Pro是Google最新发布的高级多模态推理模型，于2026年2月推出。该模型基于Gemini 3 Pro构建，支持最高100万token的上下文窗口和6.4万token输出，可处理文本、音频、图像、视频及完整代码库。在推理、编码、代理工具使用、多语言和长上下文等多项基准测试中，Gemini 3.1 Pro均展现出领先性能，尤其在ARC-AGI-2抽象推理、GPQA科学知识、Terminal-Bench 2.0终端编码等任务上取得最高分。

内容框架与概述

文章开篇说明模型卡片的目的在于提供模型的关键信息，包括已知限制、缓解方法和安全性能。主体部分依次介绍模型基本信息（描述、依赖、输入输出、架构）、训练数据与处理、硬件与软件实现、发布渠道、评估结果以及使用限制与安全策略。评估部分详细列出了与Gemini 3 Pro、Sonnet 4.6、Opus 4.6、GPT-5.2等竞品的对比数据，覆盖学术推理、抽象推理、代码生成、多模态理解等多个维度。

核心概念及解读

原生多模态推理：指模型从一开始就被训练为同时理解和处理多种模态（文本、图像、音频、视频等）的信息，而非事后拼接不同模型。

上下文窗口：指模型单次处理的最大token数量，Gemini 3.1 Pro支持100万token输入和6.4万token输出，适用于长文档和大规模代码库分析。

代理工具使用（Agentic Tool Use）：模型能够自主调用外部工具（如搜索引擎、代码执行器）来完成复杂任务，Terminal-Bench和SWE-Bench等基准测试评估这一能力。

长上下文性能：模型处理超长文档的能力，MRCR v2测试显示其在128k上下文长度下达到84.9%的准确率，与Sonnet 4.6持平。

人类终考（Humanity’s Last Exam）：涵盖广泛学术领域的综合推理基准，Gemini 3.1 Pro在无工具条件下取得44.4%分数，结合搜索和代码工具后提升至51.4%。

原文信息

字段	内容
原文	Gemini 3.1 Pro - Model Card
作者	Google DeepMind
发表日期	2026-02-19

此摘要卡片由 AI 自动生成

‹

编码代理已死：AI编程工具的新时代

@ampcode · 2026-02-19

停车感知导航系统

Adam Zewe | MIT News · 2026-02-19

›

Gemini 3.1 Pro 模型卡片发布

摘要

内容框架与概述

核心概念及解读

原文信息

目录