物理科技生物学-PHYICA

神经进化机器人:模寸丝不挂拟和现实之间的差距

技术工程 2021-12-21 21:56:38

Neuro-evolutionary robotics: a gap between simulation and reality机器人及其参考模型。a本文介绍的实验所用配置的电子圆盘机器人。详情见“方法”。b参考模型RM 1.1,它正式描述了编程接口,在本文介绍的实验中,控制软件通过该接口与底层硬件交互。距离和方位向量指向感知到的相邻对等体的集合位置;其幅度随着感知到的相邻对等体的数量而增加,随着它们的距离而减小。形式上,v=∑nm=1(11+rm,∠bm)v=∑m=1n⁡(11+rm≈BM),其中rm和≈BM分别是相邻m的距离和方位。如果没有感知到相邻的对等体,矢量指向机器人的前方,并且具有单位大小;形式上,V = (1,≈0)。credit:DOI:10.1038/s 14467-021-24642-3 Neuro-evolutionary robotics是一种对成群机器人实现集体行为具有吸引力的方法。尽管已经有大量的研究致力于此,尽管已经提出了许多方法和想法,但经验评估和比较分析很少。由布鲁塞尔自由大学布鲁塞尔理工学院IRIDIA研究中心的Mauro Birattari和他的团队领导的《自然通讯》杂志上的一份出版物,比较了机器人集群离线设计的一些最流行和最先进的神经进化方法。

“具体来说,这些方法可以促进人形机器人行为的发展,但据我所知,神经进化机器人还没有在现实世界的应用中得到常规采用,”毛罗·比拉塔利解释道。

所有这些过程都使用进化算法来生成控制机器人的神经网络,即以传感器读数为输入并输出执行器命令的神经网络。这些方法使用计算机模拟生成适合机器人必须完成的特定任务的神经网络k。一旦神经网络生成(在模拟中),它就被安装在物理机器人上并进行测试。

在比较不同方法时,研究人员观察到一种“过度拟合”:设计过程在仿真环境中变得过于专业化,产生的神经网络无法“泛化”到现实世界。这是一个现实差距,即现实和设计过程中使用的模拟器之间的差异。虽然模拟器相当精确,但差异是不可避免的。

例如,如果机器人需要在两个区域之间来回移动,进化过程可能在模拟中找到的一个解决方案是产生一个神经网络,使机器人沿着接触两个区域的圆形路径移动。这个解决方案非常优雅,在模拟中非常有效。当应用于机器人时,这种解决方案会失败得很惨:例如,如果(一个)机器人轮子的实际直径与标称值略有不同,轨迹的半径就会不同...轨迹将不再像期望的和模拟预测的那样穿过两个给定的区域,”Mauro Birattari举例说明。

虽然与直觉相反,但解决方案似乎是降低设计方法的“威力”:采用一种可以产生有限范围行为的方法。这显然意味着研究人员将不得不接受他们将在模拟中获得更差的结果。这种方法在模拟中的表现不如“强大”的方法,因为它不能利用模拟器的所有特性,然而结果会更一般,对模拟器来说不太专业,因此更有可能很好地推广到现实中。越简单越好。

巧克力法似乎很好地说明了这个想法。巧克力是IRIDIA中心的研究人员几年前提出的一个过程,它不属于神经进化机器人,但以类似于神经进化的方式,在相同的条件下,自动为机器人生成控制软件。巧克力在预先存在的软件模块上运行,这些软件模块是低级行为(例如,我朝着光的方向走,我停下来,我远离被感知的同伴...)和从一种低级行为转移到另一种低级行为的条件(例如,我被同伴包围,我所在楼层的颜色是黑色...).

巧克力玩的不是能够产生各种行为的强大神经网络,而是(相对而言)更加“粗糙”的预定义构件。可行的假设是,这样做可以降低“过度拟合”的风险。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/6356.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~