机古典武侠亚洲器学习应用需要的数据比想象的要少

machine learning Credit:pix abay/CC0 Public Domain来自不列颠哥伦比亚大学和阿尔伯塔大学的联合研究团队发现，至少一些机器学习应用程序可以从远少于假设的例子中学习。在他们发表在《自然机器智能》杂志上的论文中，该小组描述了他们用机器学习应用程序进行的测试，这些应用程序是为预测某些类型的分子结构而创建的。机器学习可以用于各种各样的应用——其中最著名的是学习在照片中识别人或物体。这种应用通常需要大量的训练数据。在这项新的努力中，研究人员发现，在某些情况下，机器学习应用程序不需要如此大量的数据就能发挥作用。

研究人员最初在寻找预测非法设计药物结构的方法。如果食用它们的人开始出现在医院急诊室，这样做将有助于医学研究人员为它们做好准备。该团队意识到，如果他们能使用机器学习应用程序，他们的工作会容易得多；不幸的是，只有1700种已知的设计药物可以用来训练这样一个系统。研究人员毫不畏惧地想知道，是否有可能计算出这样一个系统需要多少数据才能有用，或者是否有办法修改算法或用于训练它的数据，以允许更少的可用数据。

为了找到答案，研究人员创建了8500个模型，并在不同大小的数据集上训练每个模型，这些数据集取自简化的分子输入线输入系统中的50万个分子。然后他们使用模型来预测可能的分子类型。通过这样做，他们发现许多模型在有限的数据集上运行得相当好。他们还发现，他们中的大多数人在仅仅记录了10，000到20，000条数据后，他们的预测能力开始趋于平稳。当他们使用表现最好的模型进行他们的初步研究时，他们发现结果大约有50%是正确的。

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/6847.html