蚂蚁灵波开源世界模型LingBot-World,对标Genie 3

蚂蚁灵波开源世界模型LingBot-World,对标Genie 3
2026年01月29日 10:00 新浪科技

  新浪科技讯 1月29日上午消息,继连续发布空间感知与VLA基座模型后,蚂蚁灵波科技再次刷新行业预期,开源发布世界模型LingBot-World。官方表示,该模型在视频质量、动态程度、长时一致性、交互能力等关键指标上均媲美Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。

  针对视频生成中最常见的“长时漂移”问题(生成时间一长就可能出现物体变形、细节塌陷、主体消失或场景结构崩坏等现象),LingBot-World通过多阶段训练以及并行化加速,实现了近10分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。

  交互性能上,LingBot-World可实现约16 FPS的生成吞吐,并将端到端交互延迟控制在1秒以内。用户可通过键盘或鼠标实时控制角色与相机视角,画面随指令即时反馈。此外,用户可通过文本触发环境变化与世界事件,例如调整天气、改变画面风格或生成特定事件,并在保持场景几何关系相对一致的前提下完成变化。

  模型具备Zero-shot泛化能力,仅需输入一张真实照片(如城市街景)或游戏截图,即可生成可交互的视频流,无需针对单一场景进行额外训练或数据采集,从而降低在不同场景中的部署与使用成本。

  随着“灵波”系列连续发布三款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。这标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。蚂蚁正通过InclusionAI 社区将模型全部开源,和行业共建,探索AGI的边界。一个旨在深度融合开源开放并服务于真实场景的AGI生态,正加速成型。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:江钰涵

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 02-02 易思维 688816 --
  • 01-30 林平发展 603284 37.88
  • 01-30 电科蓝天 688818 9.47
  • 01-26 北芯生命 688712 17.52
  • 01-23 世盟股份 001220 28
  • 新浪首页 语音播报 相关新闻 返回顶部