物理科技生物学-PHYICA

利用机器学习预测高影响力研恋野恋究

技术工程 2021-11-13 21:54:28

Using machine learning to predict high-impact research麻省理工学院的研究人员设计了一个机器学习框架,通过在历史科学研究图上进行计算,能够预测科学研究的未来影响。功劳:麻省理工学院麻省理工学院研究人员建立的人工智能框架可以通过学习从以前的科学出版物中收集的模式,为未来的高影响力技术发出“早期预警”信号。在对其能力的回顾性测试中,德尔福(DELPHI)能够识别关键开创性生物技术专家名单上的所有开创性论文,有时早在发表后的第一年就能识别。

麻省理工学院媒体实验室的研究分支詹姆斯·w·韦斯(James W. Weis)和媒体艺术与科学教授、媒体实验室分子机器研究小组负责人约瑟夫·雅各布森(Joseph Jacobson)也利用德尔福(DELPHI)强调了他们预测到2023年将产生巨大影响的50篇最新科学论文。论文涵盖的主题包括用于癌症治疗的脱氧核糖核酸纳米机器人、高能量密度锂氧电池以及使用深度神经网络的化学合成等。

研究人员将DELPHI视为一种工具,可以帮助人类更好地利用科学研究的资金,识别可能会衰退的“原始钻石”技术,并为政府、慈善机构和风险投资公司提供一种更有效和高效地支持科学的方式。

“本质上,我们的算法是通过从科学史中学习模式,然后在新出版物上进行模式匹配来寻找高影响力的早期信号,”Weis说。“通过追踪想法的早期传播,我们可以预测它们以有意义的方式在病毒上传播或传播到更广泛的学术界的可能性有多大。”

这篇论文发表在《自然生物技术》杂志上。

寻找“未加工的钻石”

Weis和Jacobson开发的机器学习算法利用了自20世纪80年代以来随着科学出版物的指数级增长而获得的大量数字信息。但是,DELPHI没有使用诸如引用次数等一维度量来判断出版物的影响,而是在期刊文章元数据的完整时间序列网络上进行训练,以揭示它们在整个科学生态系统中传播的高维模式。

结果是一个知识图,其中包含代表论文、作者、机构和其他类型数据的节点之间的联系。这些节点之间复杂连接的强度和类型决定了它们在框架中使用的属性。“这些节点和边定义了一个基于时间的图,DELPHI使用它来学习预测未来高影响的模式,”Weis解释道。

这些网络特征一起被用来预测科学影响,发表五年后落在时间标度节点中心性前5%的论文被认为是DELPHI旨在确定的“高影响力”目标。这些前5%的论文占图表总影响的35%。作者说,DELPHI还可以使用to p 1、10和15%的时间标度节点中心性的截止值。

德尔福(DELPHI)认为,影响力大的论文几乎在他们的学科和较小的科学界之外传播。两篇论文可以有相同的引用次数,但是影响力大的论文可以覆盖更广更深的读者群。另一方面,影响力低的报纸“并没有真正被越来越多的人所利用和利用,”韦斯说。

他补充说,该框架可能有助于“激励团队成员一起工作,即使他们还不了解彼此——也许是通过向他们提供资金,让他们一起解决重要的多学科问题”。

与仅引用数量相比,DELPHI识别的高影响力论文数量是前者的两倍多,其中包括60%的“隐藏宝石”,即被引用阈值遗漏的论文。

雅各布森说:“推进基础研究就是要对目标进行大量的尝试,然后能够快速地将这些想法中最好的想法加倍。“这项研究是为了看看我们是否能以更具规模的方式来完成这一过程,通过将科学界作为一个整体来使用,就像嵌入学术图表中一样,并在确定高影响力的研究方向时更加包容。”

研究人员惊讶地发现,在某些情况下,一篇影响力很大的论文的“警告信号”会在使用DELPHI时提前出现。“在发布一年内,我们已经发现了隐藏的宝石,这些宝石将对以后产生重大影响,”韦斯说。

然而,他警告说,DELPHI并没有准确预测未来。“我们正在使用机器学习来提取和量化隐藏在已经存在的数据的维度和动态中的信号。”

公平、高效和有效的融资

研究人员表示,希望DELPHI能提供一种不那么偏向性的方法来评估论文的影响,因为引用和期刊影响因子数量等其他指标可以被操纵,就像过去的研究表明的那样。

“我们希望我们能利用这一点找到最值得研究的人和研究人员,不管他们隶属于什么机构,也不管他们之间的联系有多紧密,”韦斯说。

然而,和所有机器学习框架一样,设计者和用户应该警惕偏见,他补充道。“我们需要不断意识到我们的数据和模型中的潜在偏见。我们希望DELPHI能够帮助我们在一个不那么偏向的世界里找到最好的研究——因此我们需要小心,我们的模型并没有学会仅仅根据次优指标(如h-Index、作者引用数或机构隶属关系)来预测未来的影响。”

德尔福(DELPHI)可能是一个强大的工具,帮助科学资助变得更加高效和有效,也许可以用来创建与科学投资相关的新类别的金融产品。

实验基金会执行主任大卫·朗指出:“新兴的科学基金元科学正指向对科学投资组合方法的需求。“Weis和Jacobson对这种理解做出了重大贡献,更重要的是,他们用DELPHI实现了这种理解。”

这是韦斯在自己为生物技术初创企业推出风险投资基金和实验室孵化设施的经历后思考了很多的事情。

“我越来越认识到,包括我自己在内的投资者一直在相同的地点、以相同的先入为主的观念寻找新公司,”他表示。“我开始看到了一个巨大的财富,其中有很多才华横溢的人和惊人的技术,但这往往被忽视了。我想一定有办法在这个领域工作——机器学习可以帮助我们发现并更有效地实现所有这些未开发的潜力。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/4076.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~