视频推理速度提升至10.1倍!美团 LongCat-Video正式发布并开源 https://img.meituan.net/smartvenus/520f2e5d463cdfebe99422aabcd3ad04385479.png@100w 实现分钟级长视频连贯生成。
视频推理速度提升至10.1倍!美团 LongCat-Video正式发布并开源
科技创新2025-10-27

10月27日上午消息,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性,在长视频生成领域具备显著优势。

近年来,“世界模型”(World Model)因让人工智能真正理解、预测甚至重构真实世界,被业界视作通往下一代智能的核心引擎。作为能够建模物理规律、时空演化与场景逻辑的智能系统,“世界模型”赋予人工智能“看见”世界运行本质的能力。而视频生成模型有望成为构建世界模型的关键路径——通过视频生成任务压缩几何、语义、物理等多种形式的知识,人工智能得以在数字空间中模拟、推演乃至预演真实世界的运行。

正因如此,美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中,成为公司更好连接“比特世界”和“原子世界”的技术基础。