物理科技生物学-PHYICA

机古典武侠亚洲器学习应用需要的数据比想象的要少

技术工程 2021-12-28 21:55:29

machine learningCredit:pix abay/CC0 Public Domain来自不列颠哥伦比亚大学和阿尔伯塔大学的联合研究团队发现,至少一些机器学习应用程序可以从远少于假设的例子中学习。在他们发表在《自然机器智能》杂志上的论文中,该小组描述了他们用机器学习应用程序进行的测试,这些应用程序是为预测某些类型的分子结构而创建的。机器学习可以用于各种各样的应用——其中最著名的是学习在照片中识别人或物体。这种应用通常需要大量的训练数据。在这项新的努力中,研究人员发现,在某些情况下,机器学习应用程序不需要如此大量的数据就能发挥作用。

研究人员最初在寻找预测非法设计药物结构的方法。如果食用它们的人开始出现在医院急诊室,这样做将有助于医学研究人员为它们做好准备。该团队意识到,如果他们能使用机器学习应用程序,他们的工作会容易得多;不幸的是,只有1700种已知的设计药物可以用来训练这样一个系统。研究人员毫不畏惧地想知道,是否有可能计算出这样一个系统需要多少数据才能有用,或者是否有办法修改算法或用于训练它的数据,以允许更少的可用数据。

为了找到答案,研究人员创建了8500个模型,并在不同大小的数据集上训练每个模型,这些数据集取自简化的分子输入线输入系统中的50万个分子。然后他们使用模型来预测可能的分子类型。通过这样做,他们发现许多模型在有限的数据集上运行得相当好。他们还发现,他们中的大多数人在仅仅记录了10,000到20,000条数据后,他们的预测能力开始趋于平稳。当他们使用表现最好的模型进行他们的初步研究时,他们发现结果大约有50%是正确的。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/6847.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~