MiniMax发布M2.7模型,开启AI自我进化新阶段

Source

品玩3月18日讯,MiniMax正式发布其M2系列模型的全新版本——M2.7。该模型的核心突破在于能够深度参与自身迭代,构建复杂的Agent Harness,并利用Agent Teams、复杂Skills与工具搜索等能力,开启了模型的自我进化过程。在研发中,M2.7被用于构建强化学习框架中的数十个复杂技能,实现了对自身训练、评测与优化流程的驱动与优化。

在软件工程领域,M2.7表现优异。其在SWE-Pro基准测试中得分达56.22%,接近Opus水平;在端到端项目交付基准VIBE-Pro上得分55.6%;在对复杂系统理解要求极高的Terminal Bench 2中得分57.0%。实际应用中,它能将线上生产故障恢复时间缩短至3分钟以内,并具备原生多智能体(Agent Teams)协作能力。

在专业办公领域,模型在涵盖多领域专业知识的GDPval-AA评测中ELO得分高达1495。其能够深度处理Word、Excel、PPT等办公文档,进行多轮高保真编辑,并能像分析师一样阅读金融年报、构建预测模型并生成完整的研究报告、PPT和Excel图表。在包含40个复杂技能的场景下,其技能遵循率仍保持在97%。

此外,M2.7显著加强了身份保持与情商能力,为互动娱乐场景的创新拓展了空间。该模型已在MiniMax Agent与开放平台全量上线。