微软MAI-Image-2.5 登上Arena文生图模型排行榜前三

Source
微软近日发布其最新一代文本生成图像模型 MAI-Image-2.5,并在 Arena 的最新文生图排行榜中首发即拿下第三名的位置,显示其在 AI 图像生成领域的整体实力正明显追赶行业领先者。 目前在这一榜单上,OpenAI 的 gpt-image-2 以 1388 分位居第一。

微软表示,MAI-Image-2.5 在多种图像风格上的表现全面提升,能够更好地贴合用户提示生成图像,并在文字渲染与画面细节方面有显著改进。

微软最初于去年推出自研图像生成模型 MAI-Image-1,该模型在 Arena 的 Image Arena 排名中仅位列第 9 名,与当时其他实验室的顶级模型存在明显差距,随后微软将该模型整合到 Bing.com/create 以及 Bing 手机应用中向用户开放。 今年 3 月,微软 AI 团队发布第二代 MAI-Image-2,在自然光表现、肤色还原等方面带来明显提升,并首次闯入 Arena 排行榜前三,仅落后于Google的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity,并同步接入 Copilot、Bing Image Creator 和 Microsoft Foundry API,供开发者调用。

在此基础上,新一代 MAI-Image-2.5 进一步强化了模型整体能力。微软介绍称,MAI-Image-2.5 能更精确地理解和执行用户的文字提示,生成的图像在细节和整体结构上更加连贯,且在文字内容的绘制上更加可靠。 该模型的视觉推理能力也有所增强,对物体、光照、比例、场景结构以及空间关系的理解更加准确,有助于生成更符合真实场景和用户预期的画面。

HJRDuJKbsAAbMCN.jpg

微软特别强调,MAI-Image-2.5 在文字渲染、风格化插画以及商业类图像上的进步最为明显,包括海报、包装打样、品牌创意和产品图等场景,都能产生更高质量的输出。 相比前代模型,新模型生成图像中的文字更加清晰锐利,版式布局更加稳定,品牌视觉元素也更突出、更具整体质感,更契合商业设计和营销应用需求。

微软 AI 负责人 Mustafa Suleyman 在社交平台上表示,MAI-Image-2.5 登上 Arena 文生图排行榜第三名,标志着图像生成质量又迎来一次重要跃迁,并预告在即将到来的 Build 大会上,微软 AI 团队还将带来更多相关更新与发布。 他称,这只是微软在 AI 图像领域发力的又一步,后续还会持续推进模型能力和产品形态的迭代。

目前,MAI-Image-2.5 已通过 Arena 面向所有用户开放试用,用户可以直接在该平台上与其他模型进行对比体验。 按照微软的计划,这一新模型也将在未来两周内陆续登陆 MAI Playground 和 Microsoft Foundry,为普通用户与开发者提供更多样化的生成式图像创作与集成选项。