教机器人新技能的简单方法_物理科技生物学-PHYICA

An easier way to teach robots new skills 麻省理工学院的研究人员开发了一个系统，使机器人能够仅根据少数人类样本来学习新的拾取和放置任务。这可以让人类对机器人重新编程，在大约15分钟内抓取以前从未见过的随机姿态的物体。来源:麻省理工学院随着电子商务订单的涌入，一个仓库机器人从货架上取下杯子，并将其放入箱子中进行运输。一切都在嗡嗡作响，直到仓库发生变化，机器人现在必须抓住倒置储存的更高、更窄的杯子。重新编程这个机器人需要手工标记数以千计的图像，显示它如何抓住这些新杯子，然后重新训练这个系统。

但是，麻省理工学院研究人员开发的一项新技术只需要少量的人类演示就可以给机器人重新编程。这种机器学习方法使机器人能够以从未遇到过的随机姿态拾取和放置从未见过的物体。在10到15分钟内，机器人将准备好执行新的取放任务。

该技术使用专门设计的神经网络来重建3D物体的形状。通过几次演示，该系统使用神经网络所了解的3D几何知识来抓住与演示中相似的新对象。

在模拟和使用真实的机械臂中，研究人员表明，他们的系统可以有效地操纵从未见过的杯子、碗和瓶子，以随机的姿势排列，只需10次演示就可以教会机器人。

“我们的主要贡献是更有效地为机器人提供新技能的一般能力，这些机器人需要在更加非结构化的环境中操作，在这种环境中可能存在许多可变性。“通过构造进行概括的概念是一种令人着迷的能力，因为这个问题通常要困难得多，”电气工程和计算机科学(EECS)的研究生、论文的第一作者之一安东尼·西梅奥诺夫说。

西梅奥诺夫和合著者之一的EECS研究生杜一伦共同撰写了这篇论文；谷歌大脑的研究人员安德里亚·塔利亚萨基(Andrea taglia Sacchi)；Joshua B. Tenenbaum，脑和认知科学系认知科学和计算的Paul E. Newton职业发展教授，计算机科学和人工智能实验室(CSAIL)成员；阿尔伯托·罗德里格斯，机械工程系1957级副教授；CSAIL教授普尔基特·阿格拉瓦尔(Pulkit Agrawal)和EECS即将上任的助理教授文森特·西兹曼(Vincent Sitzmann)是资深作者。这项研究将在机器人和自动化国际会议上发表。

抓取几何图形

一个机器人可能被训练捡起一个特定的物品，但是如果那个物体是侧躺着的(也许它摔倒了)，机器人会认为这是一个全新的场景。这是机器学习系统如此难以推广到新的面向对象的原因之一。

为了克服这一挑战，研究人员创建了一种新型的神经网络模型，即神经描述符场(NDF)，它可以学习一类物品的3D几何形状。该模型使用3D点云计算特定项目的几何表示，3D点云是一组三维数据点或坐标。数据点可以从深度相机获得，该深度相机提供关于对象和视点之间的距离的信息。虽然网络是在合成3D形状的大型数据集上模拟训练的，但它可以直接应用于现实世界中的对象。

该小组设计了具有等方差特性的NDF。有了这个属性，如果向模型显示一个直立的杯子的图像，然后显示一个侧放的相同的杯子的图像，那么它理解第二个杯子是相同的对象，只是旋转了。

鸣谢:麻省理工学院“这种等方差使得我们能够更有效地处理你观察的物体处于任意方向的情况，”西梅奥诺夫说。

当NDF学习重建相似物体的形状时，它也学习关联那些物体的相关部分。例如，它知道杯子的把手是相似的，即使有些杯子比其他杯子更高或更宽，或者把手更小或更长。

“如果你想用另一种方法做到这一点，你必须手工标记所有的部分。相反，我们的方法从形状重建中自动发现这些部分，”杜说。

研究人员使用这种经过训练的NDF模型，仅用几个物理例子来教机器人一项新技能。他们将机器人的手移动到他们希望它抓住的物体的一部分，比如碗的边缘或杯子的把手，并记录下指尖的位置。

杜解释说，由于NDF已经了解了如此多的3D几何知识以及如何重建形状，它可以推断出新形状的结构，这使得系统能够以任意姿势将演示转移到新对象。

挑选获胜者

他们使用杯子、碗和瓶子作为对象，在模拟和真实的机器人手臂上测试他们的模型。他们的方法在新方向的新物体上的抓放任务中有85%的成功率，而最佳基线只能达到45%的成功率。成功意味着抓住一个新的物体，把它放在目标位置，就像把杯子挂在架子上一样。

许多基线使用2D图像信息，而不是3D几何，这使得这些方法更难以积分等方差。这是NDF技术表现更好的一个原因。

虽然研究人员对它的性能感到满意，但他们的方法只对它接受训练的特定对象类别有效。一个被教会拿起杯子的机器人将无法拿起盒子或手机，因为这些物体的几何特征与网络被训练的几何特征相差太大。

“在未来，将它扩展到许多类别或者完全放弃类别的概念将是理想的，”西梅奥诺夫说。

他们还计划使该系统适应非刚性物体，从长远来看，使该系统能够在目标区域变化时执行取放任务。