美团LongCat团队发布LongCat-Video 探索世界模型

Source

品玩10月27日讯,美团LongCat团队正式发布LongCat-Video视频生成模型,旨在以视频生成路径探索“世界模型”,为自动驾驶、具身智能等场景夯实技术基础。

该模型基于DiT架构,以“条件帧数量”区分任务,原生支持文生、图生视频及视频续写,形成任务闭环。可生成720p/30fps高清内容,原生支持5分钟级长视频输出,通过多重技术规避时序与物理合理性问题;经三重优化提升推理效率10.1倍。

其136亿参数基座模型在文生、图生视频任务中达开源SOTA,VBench等测试表现优异。模型已开源至GitHub、Hugging Face等平台,供开发者使用。