物理科技生物学-PHYICA

数据科学家构建了“巫师”的详细网络图

技术工程 2022-04-03 21:54:16

Data scientist builds a detailed network map of the Witcher巫师的社交地图。角色由节点表示,它们的大小对应于它们的节点度(连接的数量),它们的颜色和标签显示了那些已经在《巫师的网飞》电视改编第一季中出现的个体(红色)和其余尚未出现的角色(灰色)。网络链接与小说中两个相距五句话的人物被提及的次数成正比。鸣谢:米兰·雅诺索夫。安德烈·萨普克维斯基的奇幻小说系列《巫师》(The Witcher)越来越受欢迎,此前网飞推出了几款电子游戏和一个衍生系列。该节目的最新一季于2021年12月上传到网飞,仅在首播周,全球用户就观看了22亿分钟。Milán Janosov是Datopolis的首席科学家,拥有中欧大学网络科学博士学位,最近他试图用网络科学来总结《巫师》中的情节和人物关系。在Nightingale、arXiv和ResearchGate上发表的一篇论文中,他介绍了第一张概述幻想系列中隐藏模式、故事情节和人物关系的视觉网络图。

“去年早些时候,在我迷上《网飞秀》后不久,我就开始读《巫师》,故事情节深深吸引了我,”雅诺索夫告诉TechXplore这有点类似于几年前看《权力的游戏》,这也启发了我的一篇研究文章。当我即将看完《巫师》的新一季时,我开始想如何从中获得更多。"

虽然“巫师”电子游戏也非常受欢迎和具有标志性,但Janosov更喜欢书中概述的故事情节和关系以及网飞系列。为了更深入地了解这个标志性的系列电影《世界》,他着手创建了《巫师》的社交地图。"

他研究的第一步是收集数据,然后用来创建网络地图。他开始看网飞秀的字幕,但很快意识到他需要的不止这些,并决定也分析该系列丛书的全文。

“为了建立一个网络,我还需要一个完整的系列中出现的角色列表,”Janosov说。“收集了这些初始信息后,我的工作相当简单。我写了一个电脑程序,它会筛选所有书中的每一个句子,并在每次将一个人物的名字与一个句子匹配时做笔记。”

利用他的计算机程序,Janosov得出了句子中每个字符的提及次数。这使他能够确定两个字符的远近,即它们在文本的相似部分被提及的频率(例如,两个字符是否在同一个句子中被提及,相隔两个句子,等等)。

“事实证明,这些接近程度是两个角色是否真的相遇或出现在同一个情节中的很好的指标,”Janosov说。

Data scientist builds a detailed network map of the Witcher巫师的社交地图。字符由节点表示,它们的大小对应于它们的度中心性,它们的颜色编码它们所属的网络社区。网络链接与小说中两个相距五句话的人物被提及的次数成正比。标记了最重要的50个个体。鸣谢:米兰·雅诺索夫。在查看了人物提及之间的接近程度后,Janosov定义了他的网络中的元素。更具体地说,他决定用一个节点来表示每个字符,当字符在相同的“上下文”或文本的一部分中被提及时,就链接节点。

“虽然对人类来说,上下文相对容易解释,但对计算机来说,就没那么简单了,”Janosov解释道。“因此,为了捕捉提到的字符的上下文,我假设两个字符在相同的上下文中被提到,因为它们被提到的距离彼此不超过五句话。虽然数字5有些随意,但选择它是为了简单(和强迫症友好),因为3、4甚至6个句子距离也会导致非常相似的结果,也与书面文本中典型的段落长度保持一致。”

Janosov的论文是一个有价值的例子,说明网络科学如何用于揭示大量非结构化数据(如文本、小说或电影剧本)中的隐藏模式。在阅读了长达数千页的书籍或其他文本后,人类可以对故事的结构有一个大致的了解。但是,他们一般会记不住所有的角色,记不住所有的情节细节。

因此,如果他们要画一张这个故事的地图,这张地图很可能会有偏差。相比之下,网络科学工具可以帮助以定量和客观的方式总结一个传奇或系列丛书。

“看到不同的地块聚集成网络社区,我感到惊讶和兴奋,”Janosov说。“你知道那种突然之间一切都变得有意义的灵光一现——谁遇见了谁,谁在一起,主要冲突和较小的衍生情节在哪里出现,等等。,就像在侦探电影里一样。在这一点上,怀疑论者可能会问——为什么我们会如此关心一部奇幻小说?虽然《巫师》的例子确实很有趣,但一开始它似乎并没有那么重要的实际意义。”

虽然这项研究得出的“巫师”网络地图和Janosov过去创建的其他地图是独特而有趣的,但他的工作只是网络科学如何在现实世界中实施的一个例子。事实上,类似的数据分析工具也可以用来总结现实世界中的其他网络。

“在我们的日常生活中,我们被社交网络所包围:我们在社交媒体上的朋友,我们在工作中的同事,来自学校、家庭、运动和爱好的朋友,以及更多,”Janosov说。“所有这些社会系统都由网络交织在一起,而我们对这些网络几乎总是只有片面和主观的理解。为了克服这种知识的缺乏和信息的稀疏,网络科学非常方便,因为它提供了一套工具和思维框架,可以帮助我们更好地理解我们日常参与的这些社交网络,就像它帮助驱散了“巫师”周围的迷雾一样"

像Janosov所使用的网络科学工具也可以应用(或者已经在使用)于一系列现实世界的设置中。例如,人力资源专家可以使用它们来设计更好的工作环境或增强同事之间的协作,科学组织可以使用它们来优化不同研究小组之间的研究资金共享,甚至可以分析和改进国际贸易和电信。

“由于奥斯卡颁奖典礼将于下月举行,我现在正在考虑重温我以前的研究,捕捉运气在电影和音乐成功中的作用,看看今年运气有多重要,”Janosov补充道。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/13787.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~