一个可以简化机器人模仿学习的新框架

A new framework that could simplify imitation learning in robotics 图显示了研究人员方法的两个“半部分”，左侧是表征学习，右侧是通过最近邻进行的行为模仿。功劳:在过去的几十年里，计算机科学家一直试图训练机器人来处理各种任务，包括家务和制造过程。用来训练机器人完成手工任务的最著名的策略之一是模仿学习。正如它的名字所暗示的，模仿学习需要用人类演示来教机器人如何做某事。虽然在一些研究中，这种训练策略取得了非常有希望的结果，但它通常需要包含数百个视频的大型注释数据集，人类在这些数据集上完成给定的任务。

纽约大学的研究人员最近开发了VINN，这是一种替代的模仿学习框架，不一定需要大的训练数据集。这种新的方法，在arXiv上预先发表的一篇论文中提出，通过解耦模仿学习的两个不同方面来工作，即学习任务的视觉表示和相关的动作。

开展这项研究的研究人员之一Jyo Pari告诉TechXplore:“我很有兴趣看看我们如何简化模仿学习。“模仿学习需要两个基本组成部分；一个是学习在你的场景中什么是相关的，另一个是你如何利用相关的特征来执行任务。我们希望将传统上耦合到一个系统中的这些组件解耦，并了解它们各自的作用和重要性。”

大多数现有的模仿学习方法将表征和行为学习结合成一个单一的系统。另一方面，帕里和他的同事创造的新技术专注于表征学习，人工智能代理和机器人通过这一过程学习识别场景中与任务相关的特征。

“我们在自监督表示学习中采用了现有的方法，这是视觉社区中的一个流行领域，”帕里解释说。“这些方法可以采集没有标签的图像，并提取相关特征。将这些方法应用于模仿是有效的，因为我们可以通过对表示进行简单的最近邻居搜索来识别演示数据集中哪个图像与机器人当前看到的图像最相似。因此，我们可以让机器人从类似的演示图像中复制动作。”

使用他们开发的新模仿学习策略，Pari和他的同事能够在模拟环境中增强视觉模仿模型的性能。他们还在一个真实的机器人上测试了他们的方法，通过观察类似的演示图像，有效地教它如何开门。

“我觉得我们的工作是未来作品的基础，可以利用表征学习来增强模仿学习模型，”Pari说。“然而，即使我们的方法能够进行简单的最近邻任务，它们仍然有一些缺点。”

未来，新框架将有助于简化机器人学中的模仿学习过程，促进其大规模实施。到目前为止，帕里和他的同事只使用他们的策略来训练机器人完成简单的任务。因此，在接下来的研究中，他们计划探索可能的策略，使他们能够在更复杂的任务中实施它。

“弄清楚如何利用最近邻的鲁棒性在更复杂的任务与参数模型的能力是一个有趣的方向，”帕里补充说。“我们目前正在努力扩大VINN的规模，使其不仅能完成一项任务，还能完成多项不同的任务。”

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/12085.html