腾讯发布并开源混元世界模型 2.0，一句话造出3D世界，兼容游戏引擎！

Source

4月16日，腾讯正式发布并开源混元3D世界模型2.0（ HY-World 2.0）。HY-World 2.0是一个多模态世界模型，能够理解文字、图片、视频等不同类型输入，自动生成、重建和模拟 3D 世界，同时支持多格式3D资产（Mesh/3DGS/点云等）导出，可以与现有的游戏工作流无缝对接，用于快速生成游戏地图和关卡原型。

混元世界模型 2.0让 AI 从“对话”、“画图”、“捏物体”，进化到了“造世界”——包含人、物、景的完整世界。不同于谷歌的Genie 3和混元世界模型1.5仅能生成视频文件，世界模型2.0的实用性更进一步：它可以直接生成可二次编辑的3D资产文件，这些生成的3D资产可以直接导入到游戏制作或者具身仿真引擎，实现真正可玩、可用。

目前，世界模型2.0已经上线至腾讯混元3D创作引擎官网，用户可以申请使用。（申请使用地址：https://3d.hunyuan.tencent.com/sceneTo3D）

实机演示：输入“生成一个温馨的绘本风格小木屋”，游戏角色可以自由穿行在生成的3D场景中

所有内容均为3D文件，且全部由HY-World 2.0大模型一键生成

混元世界模型2.0支持文、图、视频多种输入。输入一段文字或一张图片，模型即可精准解析复杂语义，一键生成风格多样的可漫游世界。相比较混元世界模型1.0，2.0的模型架构全面升级，画面精细度和真实感大幅提升。用户还可以自定义风格，按需生成真实风、漫画风、游戏风的3D空间。生成完成后，用户可以将资产导入到Unity、UE 等引擎、进行二次编辑，显著降低了游戏地图的创作门槛。

模型还支持角色模式，用户可以操作角色在街道、建筑、场景中自由探索，不限时间，具有物理碰撞，就像在游戏里一样。

同时，世界模型2.0支持复刻真实3D场景，用户输入一段真实空间的视频或者多视角图片，模型就能构建出高精度的数字孪生空间。基于升级后的 WorldMirror 2.0 架构，模型支持任意尺寸图像与视频输入，一次性预测密集点云、多视角深度图、表面法线及相机参数，一次生成永久可复用。未来，室内装修预览、城市规划、文化遗产保护等场景，都可以基于这一能力实现快速构建和还原。

混元世界模型2.0以3D为主轴，通过统一空间理解、生成、重建的架构，实现了SOTA级的生成效果。与其他世界模型相比，混元世界模型2.0在场景完整度（物体侧面和背面）以及对输入图片的遵循程度表现更优。混元生成的3DGS与Mesh的混合表征，也让用户能够开启角色模式进行有真实物体碰撞的交互。

混元世界模型（HY-World 系列）自发布以来就在持续进化：从首个开源的3D世界模型 HY-World 1.0 ，到可实时在线交互的 HY-World 1.5 ，再到一键生成3D空间资产的 HY-World 2.0，腾讯混元的3D世界模型正在一步步将“AI 造世界”从概念变为现实。

2025年下半年以来，腾讯引入多位高级人才、加快研发架构升级、持续加大混元大模型研发效率，并取得了显著成果。2025年12月，混元发布大语言模型2.0版本，推理能力与效率居国内顶尖行列；智能水平更高的新模型 HY3 也在内部业务测试中，在元宝App测试中获得明显正向收益。此次混元世界模型2.0发布，是混元在多模态领域的又一突破。