一个小站的自留地
MiniMax 发布 MiniMax-M2.5 2026 年 2 月 12 日,MiniMax 在官网宣布推出 MiniMax-M2.5。官方称,MiniMax-M2.5 经过数十万个真实复杂环境中的大规模强化学习 (Reinforcement Learning, RL) 训练,面向编程、工具调用与搜索、办公等生产力场景,目标是在真实世界任务中提升可交付性与执行效率。 在公开的基准结果中,MiniMax 表示 M2.5 在 SWE-Bench Verified 达到 80.2%,Multi-SWE-Bench…
MiniMax 发布 MiniMax M2.7

MiniMax 正式发布 M2.7 模型。这是 MiniMax 首个深度参与迭代自身的模型,标志着其开启了模型和组织的自我进化。

M2.7 能够自行构建复杂的智能体脚手架 (Agent Harness) ,并基于多智能体协作 (Agent Teams) 、复杂技能 (Skills) 以及工具搜索工具 (Tool Search Tool) 等能力,完成高度复杂的生产力任务。

在涵盖多种编程语言的 SWE-Pro 基准测试中,M2.7 取得了 56.22% 的正确率;在端到端项目交付测试 VIBE-Pro 和复杂工程系统测试 Terminal Bench 2 中,分别取得 55.6% 和 57.0% 的成绩。

在专业办公领域,M2.7 显著提升了对 Office 三件套 (Excel、PPT 和 Word) 的复杂编辑能力,支持多轮修改和高保真编辑。在金融领域,M2.7 可以自主阅读公司年报、交叉比对研报并构建营收预测模型。在互动娱乐场景中,凭借优秀的身份保持能力和情商,MiniMax 基于该模型构建并开源了智能体交互系统 OpenRoom,以探索人与智能体之间全新的交互方式。目前,MiniMax M2.7 已在 MiniMax Agent 与开放平台全量上线。

MiniMax
 
 
Back to Top