MiniMax · 2026-02-13

MiniMax M2.5：更快更强更智能

摘要

MiniMax发布M2.5模型，通过在数十万真实环境中进行强化学习训练，在编码、代理工具使用、搜索和办公场景达到SOTA水平。SWE-Bench Verified得分80.2%，BrowseComp得分76.3%。模型支持超过10种编程语言，可处理从系统设计到代码审查的完整开发生命周期。推理速度比M2.1提升37%，与Claude Opus 4.6相当，而成本仅为十分之一，每小时运行费用低至0.3美元。

内容框架与概述

文章首先介绍M2.5模型的定位，强调其在真实世界生产力场景中的卓越表现。主体部分从编码、搜索与工具调用、办公效率三大维度展开详细技术阐述，通过SWE-Bench Verified、BrowseComp等专业基准测试验证模型能力，并对比竞品展示性能优势。随后重点介绍模型的速度提升和成本优势，每秒100 tokens的吞吐量仅为竞品一半价格。最后阐述M2系列的快速迭代进展及背后的强化学习扩展技术，包括自研的Forge框架和CISPO算法。