腾讯混元团队今日正式推出HunyuanWorld-Voyager(混元Voyager)模型,标志着AI在3D空间智能领域取得重大突破。这款业界首创的原生3D重建超长漫游世界模型,在斯坦福大学李飞飞团队制定的WorldScore基准测试中表现卓越,综合能力位居榜首。
该模型在视频生成与3D重建两大核心任务上展现出显著优势。其创新性地采用空间与特征融合技术,实现了原生3D记忆和场景重建功能,有效规避了传统后处理方式带来的精度损失和延迟问题。通过输入端3D条件精准控制画面视角,输出端直接生成3D点云,为虚拟现实、游戏开发等应用场景提供了更高效的解决方案。
混元Voyager突破了传统视频生成技术的局限,能够创建具有空间一致性的长距离漫游场景,并支持将视频内容直接转换为3D格式。该模型与已开源的混元世界模型1.0完美兼容,不仅能扩展原有模型的漫游范围,还能提升复杂场景的生成质量,同时支持场景风格化编辑功能。
在应用层面,该模型展现出强大的多任务处理能力,包括视频场景重建、3D物体纹理生成、视频风格定制化处理以及深度估计等3D理解与生成功能。其独特的深度信息处理技术为各类3D应用提供了更丰富的可能性。