物理科技生物学-PHYICA

如何每个AI的决策技好吊色视频在线巧和常识:玩游戏

科学新闻 2021-10-07 21:54:35

How to each AI decision-making skills and common sense: Play games在图形冒险游戏之前,有基于文本的冒险游戏。功劳:GaminGHD人类是适应性很强的生物。无论是从过去的经验中学习,还是理解社会的期望,我们都能轻松地从一种情况转移到另一种情况。对于人工智能来说,适应新的情况并没有那么容易。尽管人工智能模型能够保存大量的知识,并从过去的错误中学习,但它们缺乏对隐含信息的普遍理解和常识,而这些信息往往会影响我们的决策。为了测试人工智能在不同环境和背景下掌握决策技能的能力,ISI研究员、Viterbi计算机科学研究助理教授Jonathan May与ISI高级监督计算机科学家Ralph Weischedel和博士生Yin合作,为人工智能模型创建了一个复杂的训练过程。

此前,梅进行了一项研究,旨在探索人工智能聊天机器人将改进融入对话的方法。梅和他的团队基于即兴研究中常用的“是和”方法,创建了一个聊天机器人,它能够产生引人入胜的对话,而不仅仅是对信息做出反应。

虽然他之前的项目是围绕着创造有趣和吸引人的对话,梅的新工作试图进一步探索人工智能的类人能力。这是专门通过深度强化学习来完成的,在这个过程中,深度神经网络有助于帮助模型从错误中学习,并为更好的结果做出正确的决定。

“给定不同的训练语料库,我们可以让对话变得流畅、引人入胜,甚至富有同情心。但是大多数对话代理无法坚持解决问题,尤其是在长时间的对话中。

在这项研究中,人工智能面临的挑战是掌握遵循“自己选择冒险”结构的基于文本的游戏。具体来说,研究人员使用了一系列烹饪游戏来训练BERT,BERT是一种著名的语言处理模型,最初由谷歌开发。因为游戏中的每一个决定都会导致积极或消极的结果,人工智能模型最终会知道哪些决定是有益的,哪些是不可取的。然而,缺乏常识导致人工智能模型在做出最佳决定之前耗尽了所有选项。

“如果代理有常识,它将节省大量搜索时间,并专注于更重要的任务特定的知识,”尹解释说。

通过深度强化学习,梅和他的团队不仅能够训练BERT必要的决策技能,以在看不见的烹饪游戏中获得理想的结果,而且能够将这些技能集推广到完全看不见的寻宝领域的新游戏中。

“你做出的每一个微观决定可能不会教会你是否走在正确的道路上,但最终你会学到这一点,这将有助于你下次必须做出决定,”梅解释了项目的目标。

顺序决策技能的发展将在人工智能模型中证明是重要的,因为它允许更灵活的上下文交互。如果现代对话和辅助人工智能机器人能够采用复杂的决策技能,我们与它们的互动将会更加高效和有帮助。

展望未来,梅和他的团队希望将SpolinBot的改进能力与这一新项目的决策技能结合起来。主要的障碍是,目前的机器人只能在给定的一组决策中做出选择;为了将这两个项目结合起来,人工智能模型必须学会同时平衡创造力和决策能力。

随着像这样的研究的成功,人工智能越来越接近于类似人类特征,而这些特征以前是我们人类独有的。这项研究和其他类似的研究将把人工智能领域推进到一个真正了解人类来龙去脉的领域。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/kexuexinwen/1466.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~