物理科技生物学-PHYICA

Real2sim2real:一种应用于平面机器人铸造的自监督学习技术

技术工程 2022-02-16 21:54:15

Real2sim2real: A self-supervised learning technique applied to planar robot casting 在平面机器人铸造(PRC)中,机器人手腕握住电缆一端的单一平面运动会导致电缆的另一端滑过平面并停在所需的目标点,该点可能位于机器人工作空间之外。(A)显示了带有电缆和平面工作空间的UR5机器人的侧视图,(B)说明了电缆1上16个目标的测试性能。金色的内部扇区代表机器人工作空间,而灰色的外部扇区代表电缆可到达的工作空间。(C,D)显示了机器人和电缆的多个叠加俯视图,以及在(C)中具有低误差的示例和(D)中具有高误差的示例中,在端点位置处,在PRC动作之后的相关目标点。功劳:Lim等人在接下来的几十年里,机器人可能会被引入人类环境,包括家庭、办公室和零售场所。除此之外,机器人系统可以用来整理空间,使它们对人类更安全。虽然机器人迄今为止已经取得了非常有希望的成果,但它们还不能可靠地操纵可变形结构,如电力电缆、绳索和软管。此外,大多数机器人系统也不能有效地操纵二维可变形物体,例如衣服、餐巾和被褥,或者三维可变形物体,例如枕头、产品、食品和袋子。

加州大学伯克利分校AUTOLAB的研究人员正在与丰田研究所(TRI)的研究人员合作,增强机器人操纵可变形物体的能力;特别是解开电缆和处理织物。在arXiv上预先发表的一篇最新论文中,他们介绍了一种新的用于平面机器人铸造的自监督深度学习技术,该任务涉及在平面表面上操纵电缆。

“虽然我们之前的工作更侧重于(准)静态操纵,但这个项目探索了可变形物体操纵的动态运动的效率和有效性,”进行这项研究的研究人员之一肯·戈德堡告诉TechXplore。“在之前的一篇论文中,我们重点介绍了动态电缆动作,例如“跳马”来操纵一端固定在墙上的电缆。我们的新论文集中于在平面上操纵自由端电缆。”

最近研究的一个关键目标是确定一个新的动态电缆操作任务,他们称之为“平面机器人铸造”。“为了解决这个问题,他们开发了一个自我监督的学习框架,可以在几乎没有人为干预的情况下获得控制策略。

在他们的论文中,他们提出了一种解决这一任务的特殊管道,称为“real2sim2real”。“他们还评估了可以模拟平面机器人铸造任务的不同模拟环境。

“我们的自我监督学习技术real2sim2real可以加快训练速度,提高成绩,”Raven Huang和Vincent Lim解释道。“为了加快学习速度,我们想用一个逼真的物理模拟。然而,这种背景下的物理模拟并不代表现实。为了解决这个问题,机器人首先以自我监督的方式收集一些真实数据,利用预先记录的重置动作,以免获得人为干预。”

real2sim2real pipeline使用黄和Lim及其同事收集的真实数据来调整平面机器人铸造任务的模拟,使其尽可能与现实相匹配。随后,它计算出的模拟数据量要大得多,更安全,速度也比它在现实世界中收集数据的速度快得多。

为了学习机器人系统的控制策略,该模型结合了真实数据和模拟数据。该数据集包含真实和模拟数据,然后还用于解决真实和模拟环境中的性能差异,进一步增强其处理平面机器人铸造任务的能力。

劳伦斯·陈(Lawrence Chen)说:“与使用纯模拟数据或纯真实数据学习的其他方法相比,我们的方法平衡了使模拟尽可能准确(我们称之为缩小模拟差距)和尽可能高效学习的需求。“我们的框架还允许机器人长时间自主收集数据。”

Real2sim2real: A self-supervised learning technique applied to planar robot casting real 2 sim 2中国的真实管道。我们以自我监督的方式收集物理数据集。我们对物理数据集进行二次采样,生成一个调整数据集,并使用它来调整仿真参数,使其轨迹与使用差分进化(B)的真实轨迹相匹配,然后使用调整后的模拟器生成一个大的仿真数据集(C)。我们使用模拟数据集和物理数据集的加权组合来训练策略(D)并实时评估策略(E)。功劳:Lim等人Goldberg和他的团队在一系列测试中评估了他们开发的自我监督工具。值得注意的是,real2sim2real的表现优于他们与之比较的所有基线方法,以及仅在模拟数据或真实数据上训练的技术。

TRI的Mike Laskey说:“real2sim2real管道的效率让我们感到惊讶。“我们证明了它能够高效地学习可变形物体的动态操作策略,并获得相对较高的精度。模拟数据和真实数据相结合的混合方法显著提高了性能和数据效率。”

新方法比其他方法需要的真实数据少96%。其余的数据是由研究人员的模型在一个可靠的模拟环境中创建的。这将最终促进机器人系统在家庭、船只、工厂和其他环境中管理电缆的使用。未来,该团队希望将real2sim2real框架应用于其他机器人操作任务。

“我们未来的研究方向之一将是将我们的方法扩展到更复杂的可变形物体,如织物或袋子,”戈德堡说。“对于这样的物体,我们有更高的维度和更复杂的动态特性,促使我们将动态运动和(准)静态运动结合起来。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/10431.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~