物理科技生物学-PHYICA

一个开源的机鬼父全集在线看器学习框架来进行系统的回顾

科学新闻 2021-10-04 21:54:13

An open-source machine learning framework to carry out systematic reviews ASReview用于系统搜索关于CoV-19疫苗的文献。Credit: van de Schoot等人当科学家对一个给定的主题进行研究时,他们通常从回顾以前的研究发现开始。进行系统的文献综述或荟萃分析可能非常具有挑战性,而且耗时,因为通常有大量的研究集中在不同的主题上,这些主题可能并不总是与研究人员的工作相关。乌得勒支大学的研究人员最近开发了一种机器学习框架,通过自动浏览大量过去的研究并编辑高质量的文献评论,可以显著加快这一过程。这个被称为“回顾”的框架,可能对新冠肺炎大流行期间的研究特别有用。

参与这项研究的首席工程师乔纳森·德·布鲁因(Jonathan de Bruin)告诉TechXplore,“研究人员和专家面临着一个重大挑战,那就是跟上他们领域的最新发展。“阅读他们领域的所有新文献是一项非常耗时的任务,尤其是当你想系统地完成这项工作时。这些阅读文献的系统方法,称为系统综述,通常会产生有影响力的科学出版物,因为它们是当前证据的详尽总结。”

Rens van de Schoot教授是开发ASReview的研究人员之一,他在整个学术生涯中进行了几次文献综述,因此他非常清楚综述过程会有多耗时。他与乌得勒支大学的机器学习、工程和信息管理专家合作,着手开发一种工具,该工具将大大加快进行系统审查和元分析的过程。

德·布鲁因、范·德·肖特和他们的同事创建的机器学习框架经过优化,可以在干草堆中找到一根隐喻性的“针”或多根“针”。随着科学家对各种不同的主题进行大量研究,自动识别与给定主题最相关的研究可能非常有价值。为了做到这一点,de Bruin,van de Schoot和他的同事使用一种叫做主动学习的交互式方法来训练他们的机器学习模型。

An open-source machine learning framework to carry out systematic reviews基于系统文献综述的交互式机器学习的ASReview工作流。Credit: van de Schoot et al .“在经典的评论过程中,研究人员被手动呈现一篇文章,并需要决定它是否相关,人们通常会继续探索,直到他/她查看了所有相关的文章。”德·布鲁因说。“我们的机器学习框架面临的挑战是尽量减少研究者拥有的无关文章的数量,这可以节省大量的文献综述过程时间。”

大多数现有的机器学习系统被训练成精确地对单个图像、文本或其他数据进行分类(即,基于它们的特征将数据放置在不同的类别中)。相比之下,德·布鲁因和他的同事创建的系统被训练来分析几个文档,并确定哪些与给定的研究主题相关,哪些不相关。

德布鲁因说:“新冠肺炎大流行需要医学指南和寻找新的治疗方法,以创纪录的时间开发出来。“医生在医院不停地工作时不得不阅读文献,阅读文献的时间有限。对于这个项目,我们与艾伦人工智能研究所(Allen Institute for AI)合作,该研究所发布了最大的冠状病毒学术文献数据库。”

德·布鲁因、范·德·肖特和他的同事们在新冠肺炎大流行的头几周公开了他们进行系统审查的自动系统,因为他们认为这可以大大加快对非典病毒的研究,并有助于对它的理解。ASReview是他们系统的一个用户友好版本,此后被许多科学家用来回顾过去关于新型冠状病毒的研究,并为开发更有效的医疗指南提供信息。在未来,ASReview可以用于进行许多其他系统综述和元分析,这最终可以加快各种领域的研究。

德·布鲁因说:“像主动学习这样的交互式机器学习的使用在未来几年将会飞速发展。“确保交互式机器学习方法完全透明和可解释是至关重要的。在接下来的一段时间里,我们将展示这是可能的,以负责任的方式将交互式机器学习应用于其他应用,如法律文件和法院判决。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/kexuexinwen/1247.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~