物理科技生物学-PHYICA

使用泛莱拉爱化技术使人工智能系统更加通用

技术工程 2021-12-30 21:54:14

Using generalization techniques to make AI systems more versatileCredit:deep mind deep mind的一个名为“开放式学习团队”的小组开发了一种训练AI系统玩游戏的新方法。DeepMind的团队没有像其他游戏玩家人工智能系统一样,让它接触数百万个以前的游戏,而是给了它的新人工智能系统代理一套最基本的技能,他们用这些技能来实现一个简单的目标(比如在虚拟世界中发现另一个玩家),然后在此基础上进行构建。研究人员创建了一个名为XLand的虚拟世界——一个色彩丰富的虚拟世界,有着普通电子游戏的外观。在其中,被研究人员称为代理的人工智能玩家开始实现一个总体目标,当他们这样做时,他们获得了可以用来实现其他目标的技能。研究人员然后切换游戏,给代理一个新的目标,但允许他们保留他们在以前的游戏中学到的技能。该小组写了一篇论文描述他们的工作,并将其发布在arXiv预印本服务器上。这种技术的一个例子是,一个代理试图进入它的世界的一个地方,这个地方太高了,不能直接爬上去,而且没有入口,比如楼梯或坡道。在笨手笨脚的情况下,代理发现它可以移动一个扁平的物体作为斜坡,从而到达它需要去的地方。为了让他们的代理学习更多的技能,研究人员创建了70万个场景或游戏,在这些场景或游戏中,代理面临大约340万个独特的任务。通过采用这种方法,代理能够自学如何玩多种游戏,例如标记、捕捉旗帜和捉迷藏。研究人员称他们的方法极具挑战性。XLand的另一个有趣的方面是有一种霸主的存在,一个实体保持对代理的标签,并记录他们正在学习的技能,然后生成新的游戏来加强他们的技能。通过这种方法,只要代理被赋予新的任务,他们就会不断学习。

在运行他们的虚拟世界时,研究人员发现,代理人学习了他们发现有用的新技能,然后在这些技能的基础上发展,从而获得了更高级的技能,例如在没有选择时诉诸实验,与其他代理人合作,以及学习如何使用对象作为工具。他们认为,他们的方法是朝着创造具有普遍能力的algori thmss迈出的一步,这些algori thm学习如何自己玩新游戏——这些技能有一天可能会被自动机器人使用。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/6994.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~