首个机器人 4D 世界模型来了:智元机器人团队提出 EnerVerse 架构

首个机器人 4D 世界模型来了:智元机器人团队提出 EnerVerse 架构
2025年01月08日 10:07 IT之家

IT之家 1 月 8 日消息,如何让机器人在任务指引和实时观测的基础上规划未来动作是具身智能领域核心问题,其受“模态对齐”和“数据稀缺”制约。智元机器人团队提出 EnerVerse 架构,通过自回归扩散模型(autoregressive diffusion),在生成未来具身空间的同时引导机器人完成复杂任务。

据介绍,不同于现有方法简单应用视频生成模型,EnerVerse 深度结合具身任务需求,创新性地引入稀疏记忆机制(Sparse Memory)与自由锚定视角(Free Anchor View, FAV),在提升 4D 生成能力的同时,实现了动作规划性能的突破。

智元机器人官方称,实验结果表明 EnerVerse 不仅具备未来空间生成能力,更在机器人动作规划任务中实现了当前最优(SOTA)表现。IT之家从智元官方获悉,目前项目主页与论文《EnerVerse:设想机器人操作的具身未来空间》已上线,模型与相关数据集即将开源。

EnerVerse 主要科研成员来自智元机器人研究院具身算法团队。论文共同一作黄思渊是上海交通大学与上海人工智能实验室的联培博士生,师从 CUHK-MMLab 的李鸿升教授。博士期间的研究课题为基于多模态大模型的具身智能以及高效智能体的研究。在 CoRL、MM、 IROS、ECCV 等顶级会议上,以第一作者或共同第一作者身份发表多篇论文。另一位共同一作陈立梁是智元机器人的具身算法专家,主要负责具身空间智能与世界模型的研究。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片