物理科技生物学-PHYICA

比喻语言如何混淆聊天机器人

技术工程 2022-02-04 21:55:23

Want to throw off your chatbot? Use figurative language研究人员编写了一个简单的脚本来识别比喻性短语,并用它们的字面意思替换它们。因此,对话系统的性能提高了15%。学分:加州大学圣地亚哥分校计算机科学家最近检查了对话系统的性能,如个人助理和旨在与人类互动的聊天机器人。研究小组发现,当这些系统面对包含习语或明喻的对话时,它们的表现会下降10%到20%。研究小组还开发了一种局部疗法。他们写了一个简单的脚本来识别比喻性短语,并用它们的字面意思替换它们。因此,对话系统的性能提高了15%。

研究人员将在2021年11月7日至11日举行的2021年自然语言处理经验方法会议上展示他们的发现。

这项工作的应用程序不仅包括个人助理,还包括旨在汇总信息的系统,例如谷歌页面顶部的搜索结果汇总框。需要回答问题的自动化系统,例如当账单需要支付或预约时,也将从这项工作中受益。

该论文的第一作者Harsh Jhamtani说:“我们希望在人和对话系统之间实现更自然的对话。

Jhamtani是卡内基梅隆大学的博士研究生,目前作为访问研究员与资深作者Taylor Berg-Kirkpatrick一起工作,后者是加州大学圣地亚哥分校计算机科学与工程系的教员。

这项研究的灵感来自于贾姆塔尼自己与比喻性语言的斗争。他的母语是印地语,也说英语,这是印度的另一种官方语言。但是他必须学习他的同事们使用的许多美国习语和隐喻。

例如,当一位同事说他们饿了,因为在印地语中,这可能意味着医疗紧急情况时,他惊慌失措。他的同事随后解释说他只是饿了。那时,贾姆塔尼想知道人工对话系统是否会有和他一样的问题。

Want to throw off your chatbot? Use figurative languageCredit:University of California San Diego在这项研究中,研究人员测试了五种不同的设计用于与人类对话的系统,其中包括GPT-2,该系统被训练用来预测40GB互联网文本中的下一个单词,由研究公司OpenAI开发。

研究人员首先通过13.1千个对话数据集运行对话系统,这些对话涉及旅游、健康等口语话题。然后,他们从数据集中提取包含比喻性语言的对话,并仅在这些对话中运行系统。y观察到性能下降了10%到20%。

然后,他们编写了一个脚本,允许系统快速检查将比喻性语音翻译成字面语音的词典。这比重新训练系统来学习这些词典的全部内容更快、更有效。研究人员观察到性能提高了15%。

在文本可以转换之前,研究人员仍然必须部分依赖人类观察者来识别数据集中的比喻性语言。这方面需要进一步研究。

在研究人员开发的算法准备好实施之前,将需要几次迭代。例如,他们发现,在一些罕见的情况下,用字面语言代替比喻语言会扭曲句子的语法,以至于对话系统无法再理解。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/9565.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~