物理科技生物学-PHYICA

新模型在保护隐私的同时提高了机器学习在新冠肺炎诊断中的准确性

技术工程 2022-02-25 21:54:10

New model improves accuracy of machine learning in COVID-19 diagnosis while preserving privacy Credit:美国能源部英国和中国的研究人员开发了一种人工智能(AI)模型,可以诊断新冠肺炎以及一组专业放射学家,同时保护患者数据的隐私。由剑桥大学和华中科技大学领导的国际团队使用了一种称为联合学习的技术来构建他们的模型。使用联合学习,一个医院或国家的人工智能模型可以使用另一个医院或国家的数据集进行独立训练和验证,而无需数据共享。

研究人员基于来自英国和中国23家医院约3300名患者的9000多份CT扫描建立了他们的模型。他们的结果发表在《自然机器智能》杂志上,提供了一个框架,可以使人工智能技术更加可信和准确,尤其是在隐私至关重要的医疗诊断等领域。

人工智能为简化新冠肺炎诊断和未来公共卫生危机提供了一个有希望的解决方案。然而,围绕安全性和可信赖性的担忧阻碍了大规模代表性医疗数据的收集,对训练可在世界范围内使用的模型提出了挑战。

在新冠肺炎疫情的早期,许多人工智能研究人员致力于开发能够诊断这种疾病的模型。然而,这些模型中的许多是使用低质量数据、“科学怪人”数据集以及缺乏临床医生的输入来构建的。当前研究中的许多研究人员强调,这些早期模型不适合2021年春季的临床使用。

“当涉及到新冠肺炎诊断时,人工智能有很多限制,我们需要仔细筛选和策划数据,以便我们最终得到一个可行且值得信赖的模型,”来自剑桥工程系的合著者陈晗·王说。“在早期的模型依赖任意开源数据的地方,我们与NHS和武汉同济医院集团的一大群放射科医生合作选择数据,所以我们是从一个强有力的位置开始的。”

研究人员使用了两个精心策划的适当大小的外部验证数据集来测试他们的模型,并确保它在来自不同医院或国家的数据集上运行良好。

来自阿斯利康和剑桥大学应用数学和理论物理系的合著者迈克尔·罗伯茨博士说:“在新冠肺炎之前,人们没有意识到你需要收集多少数据才能构建医学人工智能应用程序。“不同的医院、不同的国家都有自己的做事方式,所以你需要尽可能大的数据集,以便做出对最广泛的临床医生有用的东西。”

研究人员将他们的框架建立在三维CT扫描而不是二维图像的基础上。CT扫描提供了更高层次的细节,从而产生了更好的模型。他们使用了来自中国和英国23家医院的3336名患者的9573次电脑断层扫描。

研究人员还必须减轻不同数据集造成的偏差,并使用联合学习来训练更好的通用人工智能模型,同时在协作环境中保护每个数据中心的隐私。

为了公平比较,研究人员在相同的数据上验证了所有模型,没有与训练数据重叠。该团队让一组放射科医生根据同一组CT扫描进行诊断预测,并比较了人工智能模型和人类专业人员的准确性。

研究人员说,他们的模型不仅对新冠肺炎有用,而且对任何其他可以用电脑断层扫描诊断的疾病也有用。“下一次有疫情,而且有充分的理由相信会有,我们将处于一个更好的位置来快速利用人工智能技术,这样我们就可以更快地了解新的疾病,”王先生说。

“我们已经表明,加密医疗数据是可能的,因此我们可以构建和使用这些工具,同时跨内部和外部边界保护患者隐私,”罗伯茨博士说。“通过与其他国家合作,我们可以做得比单独做得更多。”

研究人员现在正与新成立的世卫组织疫情和疫情情报中心合作,探索推进隐私保护数字医疗框架的可能性。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/11078.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~