模型使计算机更接近理解人类的对话

Model moves computers closer to understanding human conversation 不同窗口大小的Longformer和XLNet对SWDA呼叫sw2229的预测时间。左侧曲线显示了预测单个窗口所需的时间，右侧曲线显示了处理整个对话框所需的时间。大于512的窗口大小意味着Longformer的子窗口，在这个实验中，long former只学习了512个位置嵌入。学分:DOI: 10.1162/ tacl_a_00420约翰·霍普金斯语言和语音处理中心的一名工程师开发了一种机器学习模型，该模型可以区分语言理解系统输出的对话文本中的语音功能，这种方法最终可以帮助计算机像人类一样“理解”口语或书面语。由CLSP助理研究科学家皮奥特·泽拉斯科开发的新模型可以识别单词背后的意图，并将它们组织成最终文本中的“陈述”、“问题”或“打断”等类别:这是一项名为“对话行为识别”的任务他说，通过为其他模型提供更有条理和分段的文本版本，泽拉斯科的模型可以成为理解对话的第一步。

“这种新方法意味着LU系统不再需要处理庞大的、非结构化的文本块，当试图对文本的主题、情感或意图等进行分类时，它们会疲于应对。相反，他们可以使用一系列表达方式，这些表达方式表达非常具体的事情，比如一个问题或打断。我的模型使这些系统能够在它们原本可能失败的地方工作，”Zelasko说，他的研究最近发表在《计算语言学协会会刊》上。

在那篇论文中，Zelasko采用了一些最近引入的语言理解模型，目的是对单词和短语进行组织和分类，并研究了标点符号等不同变量如何影响这些模型的性能。

Zelasko说:“我们发现标点符号为模型提供了非常强的线索，而这些线索似乎并不存在于文本中，比如对话的内容。

在从事人与人对话分析的行业工作期间，Zelasko注意到，许多自然语言处理算法只有在文本结构清晰的情况下才能很好地运行，例如当一个人用完整的句子说话时。然而，在现实生活中，人们很少这么正式地说话，这使得系统很难确切地确定一个句子的开头和结尾。塞拉斯科想确保他的系统能够理解普通的对话。

“这就是‘对话行为’框架的由来，”塞拉科说。“有了这些，我们至少可以找到一个谈话的‘单位’。这可能有助于完成大量任务，如总结、意图识别和关键短语检测。”

Zelasko认为，他的模型最终可以帮助使用语音分析的公司，一些企业利用这一过程从客户和呼叫中心客户服务代表之间的互动分析中获得见解。语音分析通常涉及对话的自动转录和关键词搜索，Zelasko说这提供了有限的洞察机会。

“用旧的方法，你可能可以说谈话的重点涉及客户拥有的任何类型的电话，‘技术问题’和‘退款’，但是如果有人只是在探索他们的选择，而实际上并没有要求退款呢？”塞拉科说。“这就是为什么我们需要真正理解对话，而不是简单地扫描其中的关键词。”

Zelasko预测，他的模型有一天也可以被医生使用，为他们节省宝贵的时间，他们现在可以在与患者互动时做笔记。相反，使用Zelasko模型的设备可以快速浏览谈话记录，填写表格，并自动写笔记，让医生专注于他们的病人。

塞拉科于2020年1月加入约翰·霍普金斯大学和CLSP大学，他认为创新和合作的研究环境是他工作取得进展的原因。

Zelasko说:“把这些事情做好，需要有空间让你的创造力得到释放，也需要时间消化实验的结果，从中学习，并在下次尝试时把它做好。“但在进行这类研究时，注意实际考虑和局限性也很重要。这就是为什么CLSP是一个很好的地方，因为我们与该行业有着良好的合作记录。”

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/11435.html