一站式机器学习平台将白濑真奈美医疗保健数据转化为见解

One-stop machine learning platform turns health care data into insights 通过一组不断增加的机器学习模型来引导医院数据，Cardea旨在帮助医院规划像全球大流行这样大的事件，以及像缺席预约这样小的事件。功劳:Arash Akhgari在过去的十年里，医院和其他医疗保健提供者投入了大量的时间和精力来采用电子医疗记录，将匆忙潦草的医生笔记变成了持久的信息来源。但是收集这些数据还不到战斗的一半。将这些记录转化为实际的见解需要花费更多的时间和精力，这些见解利用过去的经验来为未来的决策提供信息。由麻省理工学院数据到人工智能实验室(DAI Lab)的研究人员和软件工程师构建的软件系统Cardea就是为了帮助解决这个问题而构建的。通过不断增加的机器学习模型来引导医院数据，该系统可以帮助医院规划像全球大流行这样大的事件，以及像缺席预约这样小的事件。

有了Cardea，医院可能最终能够解决“数百种不同类型的机器学习问题”，DAI实验室的首席研究员、麻省理工学院信息和决策系统实验室(LIDS)的首席研究科学家Kalyan Veeramanchaneni说。因为该框架是开源的，并且使用了可推广的技术，他们还可以相互共享这些解决方案，从而增加了透明度并支持团队合作。

为人民自动化

Cardea属于一个叫做自动机器学习(AutoML)的领域。机器学习越来越普遍，用于从药物开发到信用卡欺诈检测的所有领域。Veeramachaneni说，AutoML的目标是使这些预测工具民主化，使人们——最终包括非专家——更容易构建、使用和理解它们。

像Cardea这样的AutoML系统不是要求人们设计和编码一个完整的机器学习模型，而是展示现有的模型，并解释它们做什么和如何工作。然后，用户可以混合搭配模块来实现他们的目标，比如去吃自助餐，而不是从头开始做饭。

例如，数据科学家已经为医疗保健建立了许多机器学习工具，但大多数都不太容易获得——即使是专家也无法获得。“它们被写在论文里并藏了起来，”LIDS的研究生Sarah Alnegheimish说。她说，为了建立Cardea，她和她的同事们一直在挖掘这些工具，并将它们整合在一起，旨在为医院问题解决者提供“一个强有力的参考”。

逐步地

为了将大量数据转化为有用的预测，Cardea引导用户通过一条管道，每一步都有选择和保障。首先迎接他们的是一个数据汇编器，它吸收了他们提供的信息。Cardea旨在与快速医疗互操作资源(FHIR)合作，这是电子医疗记录的当前行业标准。

Veeramachaneni说，医院在如何使用FHIR方面有所不同，因此Cardea的构建是为了“无缝适应不同的条件和不同的数据集”。如果数据中存在差异，卡达的数据审计员会指出这些差异，以便对其进行修正或剔除。

接下来，Cardea询问用户他们想要找到什么。也许他们想估计一下病人可能会在医院呆多久。Alnegheimish说，当涉及到医院的日常运营时，甚至像这样看似简单的问题也是至关重要的——尤其是现在，因为在新冠肺炎大流行期间，医疗保健机构管理着他们的资源。用户可以在不同的模型之间进行选择，然后软件系统使用数据集和模型从以前的患者那里学习模式，并预测在这种情况下会发生什么，帮助利益相关者提前计划。

目前，Cardea被设置为帮助解决四种类型的资源分配问题。但是因为管道包含了如此多不同的模型，它可以很容易地适应可能出现的其他场景。Alnegheimish说，随着Cardea的发展，目标是利益相关者最终能够使用它来“解决医疗保健领域的任何预测问题”。

该团队在2020年10月的IEEE国际数据科学和高级分析会议上提交了描述该系统的论文。研究人员针对一个流行的数据科学平台的用户测试了该系统的准确性，发现它超过了90%的用户。他们还测试了其功效，要求数据分析师使用Cardea在一个演示医疗保健数据集上进行预测。他们发现卡达显著提高了他们的效率——例如，特征工程，分析师说通常平均需要两个小时，而实际上需要五分钟。

相信这个过程

医院工作人员经常被要求做出高风险的关键决定。至关重要的是，他们要信任他们一路上使用的任何工具，包括Cardea。LIDS的博士后刘冬雨说，仅仅让用户输入一些数字，按下一个按钮，然后得到一个答案是不够的:“他们应该对模型有所了解，他们应该知道发生了什么”。

为了建立更大的透明度，卡达的下一步是模型审计。像所有的预测设备一样，机器学习模型有优点也有缺点。通过布局这些，Cardea让用户能够决定是接受这个模型的结果，还是重新开始一个新的模型。

今年早些时候，卡达被公之于众。因为是开源的，所以欢迎用户集成自己的工具。团队还努力确保软件系统不仅可用，而且易于理解和使用。Veeramachaneni说，这也将有助于再现性，这样在用该软件构建的模型上做出的预测就可以被其他人理解和检查。

刘说，该团队还计划构建更多的数据可视化工具和解释，以提供更深入的视角，并使非专家更容易访问软件系统。

“希望人们采纳它，并开始为此做出贡献，”阿尔内格海米什说。“在社区的帮助下，我们可以让它变得更加强大。”

来源：由phyica.com整理转载自PH，转载请保留出处和链接！

本文链接：http://www.phyica.com/jishugongcheng/2634.html