
昨日,腾讯在 2025 世界人工智能大会上,正式发布混元 3D 世界模型 1.0,并进行全面开源。
官方表示,混元 3D 世界模型 1.0 是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,面向游戏开发、VR、数字内容创作等领域打造。
混元 3D 世界模型 1.0 融合了全景视觉生成与分层 3D 重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游 3D 场景生成。
据悉,混元 3D 世界模型 1.0 的核心还在于其创新的「语意层次化 3D 场景表征及生成算法」。该算法将复杂 3D 世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的 3D Mesh 资产,兼容 Unity、Unreal Engine、Blender 等主流工具。
与全球领先的开源模型相比,混元 3D 世界模型 1.0 在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前 SOTA 的开源模型。
值得一提的是,除本次发布即开源的混元 3D 世界模型 1.0,混元还将在月底开源一系列小尺寸模型,包含 0.5B、1.8B、4B、7B 混合推理模型。在 LMArena Vision 榜单拿下国内第一的多模态理解模型混元-large-vision,以及专为游戏场景优化的交互式游戏视频生成框架混元 GameCraft 等也将于近期对外开源。
|