来源:DeepTech深科技
如果你看过波士顿动力(Boston Dynamics)公司发布的机器人奔跑、跳跃和跑酷的视频,你可能会觉得机器人已经具备了惊人的敏捷性。
事实上,这些机器人仍然是经过了“手动”编程的(针对特定动作或任务),它们难以应对以前从未遇到过的新障碍。
然而,一种通过试错来教机器人运动的新方法可能有助于应对新场景,就像人类学习和适应不可预测的事件一样。
研究人员使用了强化学习技术,帮助一个名为 Cassie 的两足机器人在不同的地形上跑 400 米,并完成立定跳远和跳高动作。他们没有对每个动作进行明确的专项训练。
强化学习通过奖励或惩罚人工智能(模型)来实现目标。这种方法可以教会机器人在新的场景中进行能力的泛化并做出动作,而不是像传统方法训练出来的机器人那样不知所措。
“我们想突破机器人敏捷性的极限。”美国加州大学伯克利分校的博士生 Zhongyu Li 说,他参与了该项目,但(论文)尚未经过同行评审。“大目标是教机器人学会如何像人类一样做各种动态运动。”
该团队使用模拟来训练 Cassie,这种方法大大加快了它学习的时间,从几年缩短到几周,并使机器人能够在现实世界中完成同样的动作,而无需进一步微调。
首先,他们训练了控制 Cassie 的神经网络,使其从头开始掌握一项简单的技能,如原地跳跃、向前走或奔跑而不摔倒。它被鼓励模仿所展示的动作,其中包括人体动作捕捉的数据和所要完成动作的演示动画。
第一阶段完成后,该团队向模型展示了新的命令,鼓励机器人使用其新的运动技能执行任务。一旦它能熟练地在模拟环境中执行新任务,他们就会通过一种名为任务随机化的方法将训练过的任务多样化。
这使机器人对意外情况有了更多的准备。例如,机器人能够在被绳子拉向侧面的同时保持稳定的步态。Li 说:“我们让机器人能够利用观察到的历史,迅速适应现实世界。”
Cassie 以 2 分 34 秒的成绩完成了 400 米跑步,然后在不需要额外训练的情况下完成了 1.4 米的跳远。
接下来,研究人员将研究如何用这种技术训练配有摄像头的机器人。美国俄勒冈州立大学计算机科学教授阿兰·芬恩(Alan Fern)补充道,这将比没有摄像头来完成动作更具挑战性。他帮助开发了 Cassie 机器人,但没有参与该项目。
他说:“该领域的下一个重要进展是人形机器人,它们可以进行真正的工作,规划活动,并与物理世界进行更生活化的互动,而不仅限于跑步和跳远。”
支持:Ren
运营/排版:何晨龙
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)