OpenMOSS开源MOVA同步音视频模型，音画同步效果达电影级

Source

品玩1月30日讯，据市场消息，上海创智学院OpenMOSS团队联合模思智能发布中国首个高性能开源音视频模型MOVA，实现端到端音画同出，打破Sora2、Veo3等闭源技术垄断。

MOVA可生成长8秒、最高720p视听片段，在多语言口型同步、环境音效契合度上达工业水准。其全栈开源模型权重、训练及推理代码，补全音视频生成开源拼图。技术采用异构双塔架构与跨模态时间对齐机制，搭配多阶段数据管线和训练策略，保障音画精准共鸣。

实验显示，MOVA口型同步指标领先LTX-2等开源模型，竞技场ELO评分1113.8，胜率超50%。目前MOVA已支持昇腾等硬件，降低使用门槛，推动音视频生成开源共创，助力多模态基础模型发展。