NetHack播放器屏幕。功劳:Facebook.com历史上,强化学习领域的重大进步来自于游戏中的模拟环境,如《Dota 2》、《《我的世界》》和《星际争霸2》。不幸的是,这些发展带来了繁重的计算量,通常只需要一次实验就需要使用数千个图形处理器。即使有这些成本,这些RL方法中的许多并没有被证明非常适用于解决现实世界的问题。一旦脸书注意到需要一个拥有大量不同观测数据的环境,该环境仍能以低计算成本快速运行模拟,这家社交媒体巨头就在去年启动了开源网络黑客学习环境(NLE)。现在是2021年,脸书宣布了其2021年神经科学竞赛,包括网络黑客挑战——人工智能研究最容易获得的大挑战,该组织与人工智能众包实体AIcrowd一起。
由于其不可原谅的性质,要求玩家在角色死亡后在新的地牢中重新开始整个游戏,许多人认为网络黑客是最具挑战性的游戏之一。事实上,即使在专家级别,成功完成游戏平均需要比典型的星际争霸2游戏多25-50倍的步骤。此外,由于玩家与他们的环境和相关对象的接触是完全复杂的,用户必须经常跳出框框思考或咨询外部来源,如网络黑客维基,才能获胜。
幸运的是,由于NetHack在终端上运行,玩家可以非常快速地模拟游戏,每天只用两个GPU就可以训练代理超过12亿步。通过这种方式,NetHack Challenge在不需要超级计算机的复杂环境中测试最新的AI方法,一举两得。
然而,尽管有这些新的发展,网络黑客实际上从20世纪80年代就已经存在了。虽然在视觉上很简单,但这款游戏带来了大量的挑战,使得它在许多不同的玩家中持续流行。此外,游戏仍然完全免费。
网络黑客造成的一个相当大的障碍在于它的永久死亡特性,这意味着一旦一个角色死亡,该玩家的游戏会话就结束了。因此,研究人员希望管理这些更高风险的新方法也可以转化为现实世界的使用,在现实世界中,当面临棘手的情况时,人工智能可以帮助人类用户进行创造性思维。
本质上,脸书网络黑客挑战邀请参赛者使用任何必要的手段来雇佣能够击败游戏或更现实地获得尽可能高的分数的代理。
本次比赛将于2021年6月初至10月15日举行,获胜者将于12月在神经科宣布。
来源:由phyica.com整理转载自PH,转载请保留出处和链接!