平台教三轮池内非专家使用机器学习

machine learn Credit: CC0公共领域机器学习算法用于发现数据中的模式，否则人类不会注意到这些模式，并且正在被部署来帮助为大大小小的决策提供信息——从新冠肺炎疫苗接种的发展到网飞的建议。康奈尔大学安·鲍尔斯计算和信息科学学院的一项新获奖研究探索了如何帮助非专家有效、高效和合乎道德地使用机器学习算法，以更好地使计算领域以外的行业利用人工智能的力量。

“我们不太了解机器学习领域的非专家是如何来学习算法工具的，”信息科学领域的博士生Swati Mishra说。“原因是有一种炒作认为机器学习是为注定的人准备的。”

Mishra是《为ML非专家设计交互式迁移学习工具》的主要作者，该书在5月举行的年度ACM CHI计算系统中人的因素虚拟会议上获得了最佳论文奖。

米什拉说，随着机器学习进入传统上计算之外的领域和行业，对研究和有效、可访问的工具的需求是前所未有的，以使新用户能够利用人工智能。

对这些交互式机器学习系统的现有研究主要集中在理解用户和他们在导航工具时面临的挑战上。米什拉的最新研究——包括她自己的交互式机器学习平台的开发——通过研究逆向问题开辟了新的领域:如何更好地设计系统，使算法专业知识有限但领域专业知识丰富的用户能够学会将先前存在的模型整合到自己的工作中。

2021-2022年彭博数据科学博士研究员米什拉说:“当你完成一项任务时，你知道哪些部分需要手动修复，哪些部分需要自动化。“如果我们正确设计机器学习工具，并给予人们足够的代理来使用它们，我们就可以确保他们的知识被整合到机器学习模型中。”

米什拉在这项研究中采取了一种非常规的方法，将一个称为“迁移学习”的复杂过程作为起点，将非专家引入机器学习。迁移学习是一种高级且强大的机器学习技术，通常为专家保留，其中用户为新任务重新调整和调整现有的预训练机器学习模型。

这项技术减轻了从头开始建立模型的需要，这需要大量的训练数据，允许用户重新调整训练模型的用途，以识别狗的图像，例如，变成一个可以识别猫的模型，或者，如果有正确的专业知识，甚至可以识别皮肤癌。

“通过有意专注于将现有模型分配到新任务中，Swati的工作不仅帮助新手使用机器学习来解决复杂的任务，还利用了机器学习专家的持续发展，”信息科学系助理教授、该论文的资深作者Jeff Rzeszotarski说虽然我们的最终目标是帮助新手成为高级机器学习用户，但通过迁移学习提供一些“训练轮”可以帮助新手立即将机器学习用于自己的任务。"

Mishra的研究通过一个交互式平台揭示了迁移学习的内部计算工作，这样非专家就可以更好地理解mach ines如何处理数据集并做出决策。通过对没有机器学习开发背景的人进行相应的实验室研究，米什拉能够准确地指出初学者迷失方向的地方，他们对模型进行某些调整的理由是什么，以及哪些方法最成功或最不成功。

最后，两人发现参与的非专家能够成功地使用迁移学习，并根据自己的目的改变现有模型。然而，研究人员发现，对机器智能的不准确认知经常会减缓非专家的学习速度。米什拉说，机器不像人类那样学习。

她说:“我们习惯了类似人类的学习方式，直觉上我们倾向于采用我们熟悉的策略。“如果工具没有明确传达这种差异，机器可能永远不会真正学习。作为研究人员和设计人员，我们必须减轻用户对机器学习的认知。任何互动工具都必须帮助我们管理我们的期望。”

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/6995.html