物理科技生物学-PHYICA

机器学习从根本上减少了疾病诊断中细胞计数的工作量

技术工程 2022-05-26 21:54:11

Machine learning radically reduces workload of cell counting for disease diagnosis细胞计数结果与预测计数结果的比较表明,新开发的训练方法允许机器学习更准确地计数血细胞。鸣谢:电子人和仿生系统使用机器学习来执行用于疾病诊断的血细胞计数,而不是昂贵且通常不太精确的细胞分析仪,这仍然是非常劳动密集型的,因为在机器学习模型的训练中需要大量的人工注释工作。然而,Benihang大学的研究人员开发了一种新的训练方法,可以自动完成大部分这种活动。他们的新训练计划在4月9日发表在《电子人和仿生系统》杂志上的一篇论文中有所描述。

血液中细胞的数量和类型通常在疾病诊断中起着至关重要的作用,但通常用于进行血细胞计数的细胞分析技术——包括检测和测量悬浮在液体中的细胞的物理和化学特征——非常昂贵,并且需要复杂的准备工作。更糟糕的是,由于温度、pH值、电压和磁场等各种因素的影响,细胞分析仪的准确度只有90%左右,这些因素会干扰设备。

为了提高准确性、降低复杂性和成本,最近对替代品的许多研究都集中在使用计算机程序对连接到显微镜的高清摄像机拍摄的血液照片进行“分割”。分割涉及对照片中出现的内容进行逐像素标记的算法,在这种情况下,图像的哪些部分是细胞,哪些不是——本质上是计算图像中细胞的数量。

对于只有单一类型细胞出现的图像,这种方法达到了相当好的准确度,但是当面对具有多种类型细胞的图像时,它们表现不佳。因此,近年来,为了解决这个问题,研究人员转向了卷积神经网络(CNN)——一种反映人类视觉皮层连接结构的机器学习。

对于CNN来说,要完成这项任务,它必须首先接受“训练”,以理解人类人工标记的成千上万张细胞图像中的细胞。然后,当输入一个新的、未标记的图像时,它可以识别并计算其中的细胞。

“但即使在专家的帮助下,这种人工标记也是费力和昂贵的,”论文的合著者、北京航空航天大学机械工程与自动化系教授广东展说,“这违背了替代物的目的,而替代物本应比细胞分析仪更简单、更便宜。”

因此,北京航空航天大学的研究人员开发了一种新的训练CNN的方案,在这种情况下,U-Net是一种完全卷积的网络分割模型,自2015年首次开发以来,已被广泛用于医学图像分割。

在新的训练方案中,CNN首先在一组成千上万的图像上进行训练,这些图像只有一种类型的细胞(取自小鼠的血液)。

这些单细胞类型的图像通过传统算法自动进行“预处理”,减少图像中的噪声,提高图像质量,并检测图像中对象的轮廓。然后,他们执行自适应图像分割。后一种算法计算黑白图像中的各种灰度级,如果图像的一部分超出了某个灰度阈值,该算法会将其分割为不同的对象。使该过程具有适应性的是,它不是根据固定的灰度阈值分割出图像片段的一部分,而是根据图像的局部特征来这样做。

在单个细胞类型的训练集被呈现给U-Net模型之后,使用一小组多种细胞类型的人工注释图像来微调该模型。相比之下,仍有一定数量的人工注释,需要人工标记的图像数量从以前的数千幅减少到了600幅。

为了测试他们的训练方案,研究人员首先使用传统的细胞分析仪对相同的小鼠血液样本进行独立的细胞计数,以此来比较他们的新方法。他们发现,他们的训练方案对多细胞类型图像分割的准确率为94.85%,这与用手动注释的多细胞类型图像进行训练达到的水平相同。

该技术还可以应用于更高级的模型,以考虑更复杂的分割问题。

由于新的训练技术仍然涉及某种程度的手动注释,研究人员希望继续开发一种全自动的算法来注释和训练模型。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/16996.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~