Credit: CC0公共域 加州大学圣地亚哥分校的研究人员创造了一种工具,可以使用可解释的人工智能系统和其他机器学习方法来分析糖组学数据集
在最近发表在《自然通讯》上的一篇论文中,该团队证明了糖组学数据需要格外小心才能正确用于统计分析或机器学习
他们还提供了一种新的预处理解决方案来准备糖组学数据,从而大大提高其在机器学习和人工智能中的应用能力
他们将这种方法命名为糖公司
它从系统的角度解释了样本内和样本间共享的多糖生物合成途径
为了介绍糖组学,该团队展示了他们通过揭示几种情况下多糖之间的隐藏关系来增强糖组学数据集比较的能力,包括胃癌组织
鉴于聚糖变化对癌症的重要性及其在早期诊断中的效用,癌症是一个有用的例子
加州大学圣地亚哥分校生物工程和儿科学教授内森·刘易斯(Nathan Lewis)是这篇论文的对应作者,他说:“我们将GlyCompare应用于癌症组织,并表明,虽然使用标准统计方法无法找到癌症特异性聚糖,但使用我们的方法处理后,新的生物标志物就会出现。”
刘易斯是CHO系统生物学中心的联合主任,糖工程化的CHO细胞系被用于生产研究中使用的各种蛋白质
在另一项分析中,该团队表明该方法大大提高了统计能力,因此需要一半的样本才能获得检测生物标志物的同等能力
在这篇论文中,研究人员概述了糖复合物背后的方法将如何改变糖组学进入临床
事实上,刘易斯是一家新成立公司的创始团队的一员,该公司正在授权相关知识产权,将这项技术商业化,用于高价值应用,包括癌症诊断
糖组学方法的关键之一是,它着眼于合成构成聚糖的亚单位所需的生物学步骤,而不仅仅是着眼于整个聚糖本身,这大大提高了糖组学数据统计分析的准确性
研究人员认为,这种方法将能够在许多应用中检测糖基化的更细微变化,包括早期癌症
此外,糖ompare可能导致对所观察到的存在的多糖变化背后的机制的新见解
鲍康如和本杰明·P
该论文的共同第一作者凯勒曼是生物信息学和系统生物学研究生项目的成员,也是加州大学圣地亚哥分校雅各布斯工程学院生物工程系的成员
来源:由phyica.com整理转载自PH,转载请保留出处和链接!