美团发布并开源视频生成模型将融入自动驾驶、具身智能等场景中|美团|无人驾驶|长视频_新浪科技

新京报贝壳财经讯（记者陈维城）10月27日，美团LongCat团队发布并开源LongCat-Video视频生成模型，以统一模型在文生、图生视频基础任务上达到开源SOTA（最先进水平），并依托原生视频续写任务预训练，实现分钟级长视频连贯生成，保障跨帧时序一致性与物理运动合理性。

LongCat-Video的模型评估围绕内部基准测试和公开基准测试展开，覆盖 Text-to-Video（文本生成视频）、Image-to-Video（图像生成视频）两大核心任务。依托视频续写任务预训练，新模型可稳定输出5分钟级别的长视频，视频推理速度提升至10.1倍。

美团LongCat团队认为，此次发布的视频生成模型，是为探索“世界模型”迈出的第一步。未来，凭借精准重构真实世界运行状态的能力，LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中。

编辑杨娟娟

校对陈荻雁

关键词 : 美团无人驾驶长视频

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

美团发布并开源视频生成模型 将融入自动驾驶、具身智能等场景中