宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学

宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学
2024年12月17日 12:50 IT之家

9.9 万元起,还能够大规模量产的国产人形机器人,表现得实在是太 6 了:

而且还走上了开源路线,就在刚刚,宇树机器人开源的强化学习代码又更新了!

更新之后不再是只能训练 —— 不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放

一开始,宇树开源的是英伟达 Issac Gym 平台上的训练代码,这次新增了对 MuJoCo 模拟仿真的支持。

而且还能迁移到实体机器人上运行,目前支持宇树的 H1、H1-2 和 G1 三款机器人。

这下从训练到模拟再到真机运行,整个 RL 套件的开源体系终于完整了。

看到这个消息,有网友激动地表示,训练机器人灵魂的方法终于公开了!

全过程代码公开,还有详细教程

宇树给这个项目取名叫 RL GYM,可能和一开始专门提供基于 Issac Gym 的训练代码有关。

现在 RL GYM 又支持了 MuJoCo,可以在预训练的基础上进行仿真模拟了。

训练阶段的 Issac Gym 需要 CUDA,也就是需要 N 卡,仿真阶段的 MuJoCo 则支持各种 GPU,甚至 CPU 和 TPU 也能运行。

从环境的安装配置,到训练和模拟,以及最后的真机迁移,不仅有代码,还有非常详细的手把手教程。

以最新款的 G1 为例,在 Issac Gym 里训练完之后的效果是这样的:

放到 MuJoCo 里模拟,就有了开头看到在这段 DEMO:

最后迁移到 G1 真机,就能看到训练的效果了(并且真机迁移的部分还有中文教程):

H1 和 H1-2 也与此类似,另外通过 RL GYM 还可以在 Issac Gym 里训练机器狗 Go2:

还有更多开源项目

在宇树的整个开源体系当中,RL GYM 只是其中一环,在宇树所有的 GitHub 仓库中星标数排第三。

排第一的是针对开源机器人系统 R (obot) OS 推出的模拟包,包含了宇树系列机器人的质量、惯量、力矩等参数。

星标数第二的则是使用苹果 Vision Pro 对 G1 进行遥操作控制的仓库,可以用于数据采集。

采集到的数据是 JSON 形式,而训练通过 LeRobot 实现,因此宇树还提供了将 JSON 格式数据转为 LeRobot 所需格式的教程。

其中包含遥操作控制的代码教程,以及硬件配置图、物料清单和安装说明:

除了 GitHub 上发布的这些工具,宇树还在 HuggingFace 上公开了训练数据集,与数据采集工具同期发布。

数据集包含五种操作,使用配备有三指灵巧手的宇树 G1 人形机器人收集,每张图分辨率为 640x480,每个手臂和灵巧手的状态和动作维度为 7。

比如,利用这套数据集可以让机器人学习拧瓶盖倒水:

将三色积木叠放到一起:

此外还包括将摄像头放入相应包装盒、收集物品并存储、双臂抓取红色木块并将其放入一个黑色长方形容器中这些操作。

最后,宇树开源的也不只是和机器人相关的项目。

上个月宇树发布了售价 419 美元的激光雷达,在产品上线的同时就将其采用的 Point-LIO 算法进行了开源。

机器人
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片