物理科技生物学-PHYICA

新工具可以帮助作者突破长篇小说我的爱就像火红的玫瑰的写作障碍

技术工程 2022-01-11 21:56:28

New tool could help authors bust writer's block in novel-length works在他们预测正在进行的书面故事的未来发展的方法中,研究人员首先使用1000多个不同的“语义框架”来表征叙事世界,其中每个框架代表一组概念和相关知识。然后,预测算法会查看前面的故事,并预测正在进行的故事中可能在接下来的10、100甚至1,000个句子中出现的语义框架。功劳:宾夕法尼亚州立大学的作家们经历了作家的阻碍,可能很快会有一种新的方式来帮助发展他们故事的下一部分。宾夕法尼亚州立大学信息科学与技术学院的研究人员最近引入了一项新技术,该技术可以预测正在进行的书面报道的未来发展。在他们的方法中,研究人员首先使用1000多个不同的“语义框架”来描述叙事世界,其中每个框架代表一组概念和相关知识。然后,预测算法会查看前面的故事,并预测正在进行的故事中可能在接下来的10、100甚至1000句话中出现的语义框架。

与当前的自动文本生成方法不同,研究人员的方法可以帮助作者为后续故事创作语言,而不仅仅是几个句子的范围,这是现有模型的一个局限。

“这些创造性的写作任务似乎几乎不可能完全自动化,”信息科学与技术助理教授Kenneth Huang说。“我们之所以要处理这些非常有创意的任务,是为了突破人工智能和自然语言处理的界限。开发具有挑战性的创造性任务的解决方案将教会我们当前计算技术的能力和局限性,这样我们就可以进一步提高计算机科学。”

虽然现有的模型可以生成完整的故事,但它们在15句或更少的短篇作品中被测试和证明是成功的。黄和他的团队想开发一种工具,可以帮助作家写小说,通常是50,000字或更多。

信息学博士生切赫-黄洋说:“当提供更长的文本预测时,我们本质上是提供后续的想法来帮助小说家规划他们的故事和设定目标,而不是为他们生成详细的故事。“我们设想,在未来,我们可以提供各种想法来刺激小说家头脑风暴出不同的故事弧线。”

研究人员的框架被称为语义框架预测,将一个长的叙述分解成一系列文本块,每个文本块包含固定数量的句子。然后计算每个语义帧出现的频率。然后,文本被转换成向量——机器能够理解的数字数据——其中每个维度表示一帧的频率。然后计算它来量化语义框架出现的次数,并表示其重要性。最后,模型输入固定数量的文本块,并预测即将到来的块的语义框架。

为了让人类用户能够理解输出,研究人员将结果向量从一组数字转换回单词云。在线人群工作者测试并确认了产生的词云的代表性和特异性。

作者可以使用这个工具,将他们已经写好的文本的一部分输入到系统中,生成一组单词云,这些单词云包含建议的名词、动词和形容词,以激励他们创作故事的下一部分。

研究人员在近5000本虚构书籍的数据集上测试了他们的模型,并测量了该工具对不同上下文长度的框架表示效果,故事块长度在5到1000句之间变化。此外,他们使用CODA-19数据集的人类注释摘要,对近8000篇学术文章进行了语义框架预测测试,突出了该工具在非虚构应用中的潜在影响。

“这显示了这项技术的可推广性。我们的方法不仅适用于故事,也适用于科学文章,”肯尼斯说。“如果我们能在科学论文和小说上做到这一点,我们可能会在新闻和其他体裁上做到这一点。”

杨杰补充道,“我们的实验表明,预测即将到来的语义框架是有挑战性的,但也是可能的。

研究人员计划将语义框架预测整合到他们之前开发的人群驱动系统中,该系统使作者能够从在线人群中引出故事想法,以进一步研究该工具如何用于支持作者。

肯尼斯说:“如果一个自动化系统能够增强人类的创造力,它将是有影响力的。“即使作者不直接使用生成的内容,机器的输出也能激发作者之前没有想到的东西。”

这项工作在6月初举行的计算语言学协会北美分会2021年年会上做了介绍。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/7850.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~