物理科技生物学-PHYICA

给予美女扒开尿口给男人看人工智能惩罚以获得更好的诊断

医学研究 2022-03-29 21:52:02

告诉病人他们是健康的,这可能发生在人类医生看病人的时候

当人工智能学会诊断疾病时也会发生这种情况

但是UJ的研究人员发现,对假阴性算法进行大的惩罚会导致更高的精度

这项研究发表在《医学信息学解锁》上

org/10

1016/j

(供烤肉或煮菜用的)浅炊坑

2021

100690

学分:约翰内斯堡大学特蕾莎·范怀克平面设计

基于Pixabay图像

任何等待医学测试结果的人都知道这个焦虑的问题:“当我知道的时候,我的生活会完全改变吗?”如果你的检测结果是阴性,那你就放心了

如今,人工智能越来越多地被用于预测威胁生命的疾病

但是,让机器学习算法足够精确仍然是一个巨大的挑战——特别是,让算法正确诊断某人是否生病

机器学习是人工智能的一个分支,算法从数据集学习,并在这个过程中变得更聪明

“假设有一个关于严重疾病的数据集

数据集有90名没有患病的人

但是10%的人确实患有这种疾病

伊博莫伊·多莫·米恩耶

米奈是约翰尼斯堡大学(UJ)的博士后人工智能研究员

“举个例子,一个ML算法说90后没有这种疾病

到目前为止,这是正确的

但它未能诊断出10个患有这种疾病的人

该算法仍然被认为有90%的准确性,”他说

这是因为精确度是这样定义的

但是对于健康结果来说,诊断这10名患者并让他们接受治疗可能是迫切的

他补充说,对于90名没有这种情况的人来说,这可能比完全准确更重要

对大赦国际的处罚 在发表在《医学信息学未锁定》上的一项研究中,米恩耶和孙艳霞教授展示了如何为医学目的显著改进最大似然算法

他们使用逻辑回归、决策树、XGBoost和随机森林算法

这些是有监督的二进制分类算法

这意味着他们只能从提供给他们的“是/否”数据集中学习

博士;医生

米奈和孙教授都来自大学电气与工程科学系

研究人员在每种算法中都建立了成本敏感性

这意味着该算法在告诉数据集中的病人他们是健康的时,得到的惩罚要比反过来大得多

在医学术语中,算法对假阴性的惩罚比假阳性的惩罚更大

博士;医生

Mienye和孙教授使用了糖尿病、乳腺癌、宫颈癌(858个记录)和慢性肾病(400个记录)的公共学习数据集

数据集来自大型医院或医疗保健项目

在这些二进制数据集中,人们被分为患有疾病或根本没有疾病

他们使用的算法也是二进制的

这些人可以说“是的,这个人有这种疾病”或者“不,他们没有这种疾病”

“他们在每个数据集上测试了所有算法,包括有无成本敏感性

显著提高了精确度和召回率 结果清楚地表明,惩罚在这些数据集中按预期工作

例如,对于慢性肾病,随机森林算法的精度为0

972并在0召回

946,满分1分

000

加入成本敏感性后,算法的精度显著提高到0

990,完美回忆1

000

对于CKD,其他三种算法的召回率从高分提高到完美的1

000

精度为1

000表示该算法没有预测整个数据集中的一个或多个误报

从1开始回忆

000表示算法没有预测整个数据集中的一个或多个假阴性

对于其他数据集,不同算法的结果是不同的

对于宫颈癌,成本敏感的随机森林和XGBoost算法从高分提高到完美的精度和召回率

然而,逻辑回归和决策树算法提高到更高的分数,但没有达到1

000

精度问题 米恩耶说,总的来说,算法在判断人们没有疾病方面比识别生病的人更准确

这是医疗AI领域的一个持续挑战

原因是算法的学习方式

这些算法从来自大型医院或国家医疗项目的数据集学习

但是这些数据集中的大多数人都不具备他们被测试的条件,米恩耶说

“在一家大医院,一个人进来接受慢性肾病的检查

他们的医生把他们送到那里,因为他们的一些症状是慢性肾病症状

医生想排除慢性肾病

原来,这个人没有慢性肾病

“很多人都会这样

数据集最终显示,没有CKD的人比有CKD的人多

我们称之为不平衡数据集

" 当一个算法开始从数据集学习时,它对慢性肾病的了解远远少于它应该了解的,并且在诊断患病患者时不够准确——除非该算法针对不平衡进行了调整

人工智能在船的另一边 米恩伊在大西洋附近的一个村庄长大,那里没有公路

“你必须从最近的城镇乘快艇到达那里

乘船需要两到三个小时,”他说

最近的诊所在更大的镇上,在船的另一边

他家乡的乡村环境启发他看到人工智能如何帮助那些很少或根本没有医疗保健的人

他说,他村里的一位老太太是一个很好的例子,说明了未来更先进的人工智能算法可能会有所帮助

一种成本敏感的多类ML算法可以评估她的血压、钠水平、血糖等测量数据

如果她的数据在计算机上被正确记录,并且算法从多类数据集中学习,未来的人工智能可以告诉诊所工作人员她处于慢性肾病的哪个阶段

然而,这个村庄的场景是在未来

与此同时,该研究的四种具有成本敏感性的算法在诊断疾病时,在数值数据集中要精确得多

他们学得很快,用的是人们可以在偏远城镇找到的普通电脑

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/yixueyanjiu/13431.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~