微软MAI-Image-2.5 登上Arena文生图模型排行榜前三

Source

微软近日发布其最新一代文本生成图像模型 MAI-Image-2.5，并在 Arena 的最新文生图排行榜中首发即拿下第三名的位置，显示其在 AI 图像生成领域的整体实力正明显追赶行业领先者。目前在这一榜单上，OpenAI 的 gpt-image-2 以 1388 分位居第一。

微软表示，MAI-Image-2.5 在多种图像风格上的表现全面提升，能够更好地贴合用户提示生成图像，并在文字渲染与画面细节方面有显著改进。

微软最初于去年推出自研图像生成模型 MAI-Image-1，该模型在 Arena 的 Image Arena 排名中仅位列第 9 名，与当时其他实验室的顶级模型存在明显差距，随后微软将该模型整合到 Bing.com/create 以及 Bing 手机应用中向用户开放。今年 3 月，微软 AI 团队发布第二代 MAI-Image-2，在自然光表现、肤色还原等方面带来明显提升，并首次闯入 Arena 排行榜前三，仅落后于Google的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity，并同步接入 Copilot、Bing Image Creator 和 Microsoft Foundry API，供开发者调用。

在此基础上，新一代 MAI-Image-2.5 进一步强化了模型整体能力。微软介绍称，MAI-Image-2.5 能更精确地理解和执行用户的文字提示，生成的图像在细节和整体结构上更加连贯，且在文字内容的绘制上更加可靠。该模型的视觉推理能力也有所增强，对物体、光照、比例、场景结构以及空间关系的理解更加准确，有助于生成更符合真实场景和用户预期的画面。

微软特别强调，MAI-Image-2.5 在文字渲染、风格化插画以及商业类图像上的进步最为明显，包括海报、包装打样、品牌创意和产品图等场景，都能产生更高质量的输出。相比前代模型，新模型生成图像中的文字更加清晰锐利，版式布局更加稳定，品牌视觉元素也更突出、更具整体质感，更契合商业设计和营销应用需求。

微软 AI 负责人 Mustafa Suleyman 在社交平台上表示，MAI-Image-2.5 登上 Arena 文生图排行榜第三名，标志着图像生成质量又迎来一次重要跃迁，并预告在即将到来的 Build 大会上，微软 AI 团队还将带来更多相关更新与发布。他称，这只是微软在 AI 图像领域发力的又一步，后续还会持续推进模型能力和产品形态的迭代。

目前，MAI-Image-2.5 已通过 Arena 面向所有用户开放试用，用户可以直接在该平台上与其他模型进行对比体验。按照微软的计划，这一新模型也将在未来两周内陆续登陆 MAI Playground 和 Microsoft Foundry，为普通用户与开发者提供更多样化的生成式图像创作与集成选项。