使用泛莱拉爱化技术使人工智能系统更加通用

Using generalization techniques to make AI systems more versatile Credit:deep mind deep mind的一个名为“开放式学习团队”的小组开发了一种训练AI系统玩游戏的新方法。DeepMind的团队没有像其他游戏玩家人工智能系统一样，让它接触数百万个以前的游戏，而是给了它的新人工智能系统代理一套最基本的技能，他们用这些技能来实现一个简单的目标(比如在虚拟世界中发现另一个玩家)，然后在此基础上进行构建。研究人员创建了一个名为XLand的虚拟世界——一个色彩丰富的虚拟世界，有着普通电子游戏的外观。在其中，被研究人员称为代理的人工智能玩家开始实现一个总体目标，当他们这样做时，他们获得了可以用来实现其他目标的技能。研究人员然后切换游戏，给代理一个新的目标，但允许他们保留他们在以前的游戏中学到的技能。该小组写了一篇论文描述他们的工作，并将其发布在arXiv预印本服务器上。这种技术的一个例子是，一个代理试图进入它的世界的一个地方，这个地方太高了，不能直接爬上去，而且没有入口，比如楼梯或坡道。在笨手笨脚的情况下，代理发现它可以移动一个扁平的物体作为斜坡，从而到达它需要去的地方。为了让他们的代理学习更多的技能，研究人员创建了70万个场景或游戏，在这些场景或游戏中，代理面临大约340万个独特的任务。通过采用这种方法，代理能够自学如何玩多种游戏，例如标记、捕捉旗帜和捉迷藏。研究人员称他们的方法极具挑战性。XLand的另一个有趣的方面是有一种霸主的存在，一个实体保持对代理的标签，并记录他们正在学习的技能，然后生成新的游戏来加强他们的技能。通过这种方法，只要代理被赋予新的任务，他们就会不断学习。

在运行他们的虚拟世界时，研究人员发现，代理人学习了他们发现有用的新技能，然后在这些技能的基础上发展，从而获得了更高级的技能，例如在没有选择时诉诸实验，与其他代理人合作，以及学习如何使用对象作为工具。他们认为，他们的方法是朝着创造具有普遍能力的algori thmss迈出的一步，这些algori thm学习如何自己玩新游戏——这些技能有一天可能会被自动机器人使用。

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/6994.html