物理科技生物学-PHYICA

研究人员开发新的协议来验证又色又爽又黄的视频还免费机器学习模型的完整性

技术工程 2021-11-02 21:54:11

ai Credit: Pixabay/ CC0公共领域机器学习广泛应用于图像识别、自动驾驶汽车、邮件过滤等各种应用。尽管取得了成功,但人们对模型预测的完整性和安全性以及准确性的担忧正在上升。为了解决这些问题,德克萨斯A&M大学计算机科学与工程系教授张予鹏博士和他的团队将被称为零知识证明协议的密码算法应用于机器学习领域。

“这些协议将允许机器学习模型的所有者向其他人证明,该模型可以在公共数据集上实现高精度,而不会泄露任何关于机器学习模型本身的信息,”张说。

研究人员的发现发表在计算机器协会2020年计算机和通信安全会议的会议记录上。

机器学习是人工智能的一种形式,它专注于算法,使计算机系统能够从数据中学习,并随着时间的推移提高其准确性。这些算法建立模型,在大量数据中寻找模式,从而在没有编程的情况下做出决策和预测。

多年来,机器学习模型经历了巨大的发展,在数据挖掘和自然语言处理等多个研究领域取得了重大进展。几家公司和研究小组声称已经开发了机器学习模型,可以在公共测试数据样本上获得非常高的精度。尽管如此,复制结果来验证这些说法对研究人员来说仍然是一个挑战。不知道他们能否达到这样的精度,也不容易证明。

网络安全和密码学的理论基础是通过一系列代码保护信息和通信的科学,因此只有发送者和预期的接收者才有能力查看和理解它。它最常用于开发工具,如加密、网络文本、数字签名和散列函数。

可以使用密码学之外的方法,其中之一就是向公众发布模型。然而,随着机器学习模型成为许多公司的关键知识产权,它们不能被发布,因为它们包含对业务至关重要的敏感信息。

“这种方法也有问题,因为一旦模型出来,网上就有一个软件工具,任何人都可以用来验证,”张说。“最近的研究还表明,该模型的信息可以用来重建它,并用于他们想要的任何目的。”

作为密码学的一个应用,零知识证明协议是一种数学方法,它允许机器学习模型的所有者产生一个简洁的证明,以压倒性的概率证明某事是真的,而不共享任何关于它的额外信息。

虽然在过去十年中,通用零知识证明方案的使用有了显著的改进,但是构建高效的机器学习预测和准确性测试仍然是一个挑战,因为生成证明需要时间。

“当我们将这些通用技术应用于常见的机器学习模型时,我们发现一家公司需要几天或几个月的时间来生成一个证明,向公众证明他们的模型可以实现他们声称的目标,”张说。

为了获得更有效的方法,张和他的团队设计了几种新的零知识证明技术和优化,专门用于将决策树模型(最常用的机器学习算法之一)的计算转化为零知识证明语句。

使用他们的决策树计算方法,他们发现生成证明需要不到300秒的时间,该证明将证明模型可以在数据集上实现高精度。

由于他们新开发的方法只解决生成决策树模型的证明,研究人员希望扩展他们的方法来有效地支持不同类型的机器学习模型。

该项目的贡献者包括计算机科学与工程系博士生方志勇;和加州大学伯克利分校博士生张嘉恒、宋黎明博士。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/3278.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~