新算法可帮助机器人提高学习能力

新算法可帮助机器人提高学习能力
2024年05月14日 11:00 媒体滚动

美国西北大学的工程师们创造了MaxDiffRL算法,通过让机器人随机探索和高效学习,增强了机器人技术中的人工智能。这种方法大大提高了机器人在各种应用中的性能和可靠性,在首次尝试任务时就能展现出卓越的技能。  美国西北大学的工程师们开发出了一种专为智能机器人设计的新型人工智能算法。通过帮助机器人快速、可靠地学习复杂的技能,可以大大提高机器人在自动驾驶汽车、无人机送货、家庭助理和自动化等一系列应用中的实用性和安全性。  这种算法被称为“最大扩散强化学习”(MaxDiff RL),它的成功之处在于能够鼓励机器人尽可能随机地探索环境,以获得各种不同的经验。这种“设计的随机性”提高了机器人收集到的有关其周围环境的数据质量。通过使用更高质量的数据,模拟机器人表现出了更快和更高效的学习能力,从而提高了它们的整体可靠性和性能。MaxDiff RL的卓越性能  在与其他人工智能平台进行测试时,使用西北大学新算法的模拟机器人的表现始终优于最先进的模型。事实上,新算法的效果非常好,机器人学会新任务后,只需一次尝试就能成功完成——第一次就能做对。这与当前的人工智能模型形成了鲜明对比,后者通过不断尝试和犯错来实现较慢的学习速度。  这项研究发表在5月2日《自然-机器智能》(Nature Machine Intelligence)杂志上。  领导这项研究的西北大学托马斯·贝鲁塔(Thomas Berrueta)说:“其他人工智能框架可能有些不可靠。有时,它们能完全完成任务,但有时,它们会完全失败。有了我们的框架,只要机器人有能力完成任务,那么每次打开机器人时,你都能指望它准确地完成任务。这使得解读机器人的成功和失败变得更加容易,而这在一个越来越依赖人工智能的世界中是至关重要的。”  贝鲁塔是西北大学的总统奖学金获得者,也是麦考密克工程学院机械工程专业的博士生。机器人专家托德·墨菲(Todd Murphey)是麦考密克工程学院的机械工程学教授,也是贝鲁塔的导师,他是论文的资深作者。贝鲁塔和墨菲与艾利森·皮诺斯基(Allison Pinosky)合著了这篇论文,后者也是墨菲实验室的博士生。非实体的断开  为了训练机器学习算法,研究人员和开发人员会使用大量的大数据,而人类会对这些数据进行仔细的筛选和整理。人工智能从这些训练数据中学习,不断试错,直到获得最佳结果。虽然这一过程对于ChatGPT和谷歌Gemini等非实体系统非常有效,但对于机器人等实体人工智能系统却行不通。机器人只能靠自己收集数据,没有人类管理员的帮助。  “传统算法在两个方面与机器人技术不兼容。”墨菲说,“首先,非实体系统可以利用一个不适用物理定律的世界。其次,单个故障不会产生任何后果。对于计算机科学应用来说,唯一重要的是大部分时间都能成功。而在机器人技术中,一次失败就可能造成灾难性后果。”  为了解决这种脱节,贝鲁塔、墨菲和皮诺斯基旨在开发一种新颖的算法,确保机器人能够随时随地收集高质量的数据。MaxDiff RL的核心是命令机器人更随意地移动,以收集有关其环境的全面、多样的数据。通过自编随机经验的学习,机器人掌握了完成有用任务的必要技能。一次成功  为了测试新算法,研究人员将其与当前最先进的模型进行了比较。通过计算机模拟,研究人员要求模拟机器人执行一系列标准任务。在所有情况下,使用MaxDiff RL的机器人都比其他模型学习得更快。它们正确执行任务的一致性和可靠性也远高于其他模型。  也许更令人印象深刻的是使用MaxDiff RL方法的机器人往往一次就能成功地正确执行任务。而这甚至是在它们一无所知的情况下开始的。  贝鲁塔说:“我们的机器人更快、更敏捷,能够有效地归纳所学知识,并将其应用于新的情况。对于现实世界的应用来说,机器人没有无穷无尽的时间去尝试和犯错,这是一个巨大的优势。”  由于MaxDiff RL是一种通用算法,因此可用于各种应用。研究人员希望它能解决阻碍该领域发展的基础问题,最终为智能机器人的可靠决策铺平道路。  皮诺斯基说:“这不一定只能用于四处移动的机器人车辆。它也可以用于固定的机器人,比如厨房里的机械臂,它可以学习如何装洗碗机。随着任务和物理环境变得越来越复杂,在学习过程中,体现的作用变得更加重要。这是迈向能完成更复杂、更有趣任务的真实系统的重要一步。”  本研究得到了美国陆军研究办公室和美国海军研究办公室的支持。(逸文)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-29 瑞迪智驱 301596 25.92
  • 04-25 欧莱新材 688530 9.6
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 新浪首页 语音播报 相关新闻 返回顶部