OpenMOSS开源MOVA同步音视频模型,音画同步效果达电影级

Source

品玩1月30日讯,据市场消息,上海创智学院OpenMOSS团队联合模思智能发布中国首个高性能开源音视频模型MOVA,实现端到端音画同出,打破Sora2、Veo3等闭源技术垄断。

MOVA可生成长8秒、最高720p视听片段,在多语言口型同步、环境音效契合度上达工业水准。其全栈开源模型权重、训练及推理代码,补全音视频生成开源拼图。技术采用异构双塔架构与跨模态时间对齐机制,搭配多阶段数据管线和训练策略,保障音画精准共鸣。

实验显示,MOVA口型同步指标领先LTX-2等开源模型,竞技场ELO评分1113.8,胜率超50%。目前MOVA已支持昇腾等硬件,降低使用门槛,推动音视频生成开源共创,助力多模态基础模型发展。