物理科技生物学-PHYICA

训练机器人一拳超人第一季动画免费操纵柔软和可变形的物体

技术工程 2021-12-02 21:54:54

Training robots to manipulate soft and deformable objects一个新的仿真环境PlasticineLab旨在让机器人学习更加直观。像图中这样的任务旨在训练特工操纵类似于现实世界中的柔软和可变形物体。学分:麻省理工学院-IBM沃森人工智能实验室。机器人可以解出魔方,并在火星的崎岖地形上导航,但它们很难完成简单的任务,比如擀出一块面团或拿一双筷子。即使有堆积如山的数据、明确的指示和广泛的培训,他们也很难完成孩子容易完成的任务。设计了一个新的仿真环境,PlasticineLab,让机器人的学习更加直观。通过将物理世界的知识构建到模拟器中,研究人员希望能够更容易地训练机器人操纵现实世界中经常弯曲和变形的物体和材料,而不会恢复到它们的原始形状。该模拟器由麻省理工学院、麻省理工学院-IBM沃森人工智能实验室和加州大学圣地亚哥分校的研究人员开发,于5月在国际学习表征会议上推出。

在PlasticineLab中,机器人代理学习如何在仿真中通过操纵各种软对象来完成一系列给定的任务。在擀面皮中,目标是通过压在面团上或用擀面杖擀平面团;在绳子中,把绳子绕在柱子上;在筷子中,拿起一根绳子,把它移动到一个目标位置。

研究人员训练他们的代理人比在强化学习算法下训练的代理人更快地完成这些和其他任务,他们说,通过将世界的物理知识嵌入模拟器,这使他们能够利用基于梯度下降的优化技术来找到最佳解决方案。

“将物理学的基础知识编程到模拟器中,可以使学习过程更加高效,”该研究的主要作者黄志奥说,他是麻省理工学院-IBM Watson AI Lab的前实习生,现在是加州大学圣地亚哥分校的博士生。“这让机器人对充满生物和可变形物体的现实世界有了更直观的感受。”

该作品的资深作者、IBM研究员创干表示:“通过强化学习的试错技术,机器人可能需要数千次迭代才能掌握一项任务,强化学习通常用于在模拟中训练机器人。“我们表明,通过烘焙一些物理知识,可以更快地完成这项工作,这使得机器人可以使用基于梯度的规划算法进行学习。”

基本的物理方程通过一种叫做Taichi的图形编程语言被烘焙到PlasticineLab中。太极和PlasticineLab所基于的早期模拟器ChainQueen都是由该研究的合著者胡远明开发的。通过使用基于梯度的规划算法,PlasticineLab中的代理能够不断地将其目标与到那时为止所做的运动进行比较,从而导致更快的航向修正。

“我们可以通过反向传播找到最佳解决方案,反向传播是用于训练神经网络的相同技术,”该研究的合著者、麻省理工学院的博士生杜涛说。“反向传播为代理提供了更新其操作所需的反馈,从而更快地达到目标。”

这项工作是赋予机器人更多常识的持续努力的一部分,这样它们有一天可能能够烹饪、清洁、折叠衣物,并在现实世界中执行其他平凡的任务。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/5063.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~