物理科技生物学-PHYICA

研究人员为使用机器学习的暗芝居第七季研究提供标准

技术工程 2022-01-13 21:54:53

aiCredit:CC0 Public Domain根据今天发表在《自然方法》杂志上的一篇评论文章,生命科学领域中使用机器学习进行研究的研究人员应该采用允许其他研究人员复制其结果的标准。作者解释说,这些标准是推进科学突破、推进知识进步和确保研究发现在一组科学家之间可复制的关键。这些标准将允许其他科学家小组专注于下一个突破,而不是花时间重现最初研究的作者们制造的轮子。

美国科罗拉多大学医学院健康AI中心主任凯西·s·格林(Casey S. Greene)博士是这篇文章的对应作者,他与第一作者本杰明·j·海尔(Benjamin J. Heil)以及来自美国、加拿大和欧洲的研究人员共同撰写了这篇文章。

格林和他的合著者写道:“最终所有的科学都需要信任——没有一个科学家能够从他们阅读的每篇论文中重现结果。“那么,问题是如何确保生命科学中的机器学习分析是可信的。”

格林和他的合著者概述了获得三个无障碍级别之一的标准:铜牌、银牌和金牌。这些标准都为共享研究材料设定了最低标准,这样其他生命科学研究人员就可以信任这项工作,如果有必要,还可以验证这项工作并在此基础上再接再厉。

为了达到青铜标准,生命科学研究人员需要公开他们的数据、代码和模型。在机器学习中,计算机从训练数据中学习,获得这些数据使科学家能够寻找可能干扰这一过程的问题。该代码告诉未来的研究人员如何让计算机执行工作步骤。

在机器学习中,生成的模型至关重要。对于未来的研究人员来说,了解原始研究团队的模型对于理解它与要分析的数据之间的关系至关重要。没有获得模型,其他研究人员无法确定可能影响工作的偏见。例如,很难确定一个算法是否偏向于一组人而不是另一组人。

作者写道:“无法检查模型也会使信任变得困难。

白银标准要求在青铜级提供数据、模型和代码,并增加了更多关于运行代码的系统的信息。对于下一批科学家来说,这些信息使得他们在理论上有可能复制训练过程。

为了符合黄金标准,研究人员必须在他们的工作中添加一个“简单按钮”,以便未来的研究人员可以用一个命令来复制以前的分析。最初的研究人员必须自动化他们分析的所有步骤,以便“复制他们工作的负担尽可能小。”对于n ext科学家来说,这些信息实际上可以复制训练过程,并对其进行调整或扩展。

格林和他的合著者还提供了记录和分享这些步骤的建议。

《自然方法》这篇文章对于继续完善机器学习和其他数据分析方法在健康科学和其他领域的应用做出了重要贡献,在这些领域,信任尤为重要。格林是最近被加州大学医学院招募的几位领导者之一,他们建立了一个项目,开发和应用强大的数据科学方法来推进生物医学研究、教育和临床护理。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/7996.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~