物理科技生物学-PHYICA

通过机器学习识今野夏美别复合类

生物 2022-03-10 00:03:18

耶拿弗里德里希·席勒大学 信用:Pixabay/CC0公共域 一切生物都有代谢产物,产生代谢产物,消耗代谢产物

这些分子是生物体新陈代谢过程中化学过程的中间产物和最终产物

因此,它们不仅对我们的生活有着巨大的意义,而且还提供了关于生物或环境状况的有价值的信息

例如,代谢物可用于检测疾病,或者在环境技术领域,用于检测饮用水样本

然而,这些化合物的多样性给科学研究带来了困难

迄今为止,只有很少的分子及其性质是已知的

如果样品在实验室中进行分析,只有相对小部分的样品可以被识别,而大部分的分子仍然是未知的

德国耶拿弗里德里希·席勒大学的生物信息学专家与来自芬兰和美国的同事一起,现已开发出一种独特的方法,利用这种方法可以将样品中的所有代谢物都考虑在内,从而大大增加了从检测这些分子中获得的知识

该团队在著名的科学杂志《自然生物技术》上报道了他们的成功研究

学习、识别和分配结构属性 “质谱分析是最广泛使用的分析代谢物的实验方法之一,它通过将分子与数据库进行匹配,只识别那些可以被唯一指定的分子

样本中包含的所有其他以前未知的分子都不能提供太多信息

耶拿大学的塞巴斯蒂安·博克

“然而,通过我们新开发的名为CANOPUS的方法,我们也可以从样品中未鉴定的代谢物中获得有价值的见解,因为我们可以将它们归入现有的化合物类别

" CANOPUS分两个阶段工作:首先,该方法从质谱测量的碎片光谱中产生“分子指纹”

这包含关于被测分子的结构特性的信息

在第二阶段,该方法使用分子指纹将代谢物归入特定的化合物类别,而无需对其进行鉴定

从数据中学习 “机器学习方法通常需要大量数据来进行训练

相比之下,我们的两阶段过程使得在第一步中训练数万个碎片质谱的相对少量的数据成为可能

然后,在第二步中,可以从数百万个结构中确定对一个化合物类别有意义的特征结构属性

耶拿大学的凯·杜尔科普

因此,该系统可识别样品中未知分子的这些结构特性,然后将其归入特定的化合物类别

“光是这些信息就足以回答许多重要问题,”博克强调说

“代谢物的精确鉴定要复杂得多,而且通常根本没有必要

“CANOPUS方法使用深度神经网络预测大约2500个化合物类别

用他们的方法,耶拿生物信息学家比较了,例如,一个实验组接受抗生素治疗的小鼠的肠道菌群

这些检查显示了小鼠及其肠道菌群产生的代谢产物

这样的研究结果可以提供关于人类消化和代谢系统的重要信息

通过他们在研究中提出的两个进一步的应用实例,耶拿科学家展示了CANOPUS方法的功能和威力

耶拿分子搜索引擎使用了数百万次 通过这种新方法,来自耶拿的生物信息学专家正在扩展分子结构搜索引擎“犯罪现场调查:指纹”的可能性,他们已经向国际研究界提供了大约五年的时间

世界各地的研究人员现在每天使用这项服务数千次,将样本的质谱与各种在线数据库进行比较,以便更准确地识别代谢物

“我们正在接近第一亿个请求,我们相信CANOPUS将进一步增加用户数量,”塞巴斯蒂安·薄克尔说

这种新方法加强了代谢组学领域——即对这些无处不在的小分子的研究——并增加了其在许多研究领域的潜力,如制药

很多使用了几十年的活性药物,比如青霉素,都是代谢产物;其他的可以在他们的帮助下发展

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/12057.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~