物理科技生物学-PHYICA

机器学习解决了有机晶体核磁共振谱中谁是谁非的问题

化学 2022-08-30 00:02:12

洛桑联邦理工学院 结晶士的宁13C核磁共振谱的概率赋值

信用:@ EPFL·曼努埃尔·科尔多瓦 固态核磁共振(NMR)光谱学——一种测量在强磁场中暴露于无线电波的一些原子的原子核发射的频率的技术——可以用来确定化学和三维结构以及分子和材料的动力学

分析中一个必要的初始步骤是所谓的化学位移分配

这包括将核磁共振谱中的每个峰分配给所研究的分子或材料中的给定原子

这可能是一项特别复杂的任务

实验性地分配化学位移可能具有挑战性,并且通常需要耗时的多维相关实验

通过对比实验化学位移数据库的统计分析进行分配将是一种替代解决方案,但是没有这样的分子固体数据库

一组研究人员包括EPFL教授林登·埃姆斯利,磁共振实验室负责人,米歇尔·塞里奥提,计算科学与建模和博士实验室负责人

D

学生曼努埃尔·科尔多瓦决定通过开发一种方法来解决这个问题,该方法可以直接从有机晶体的2D化学结构中概率性地分配有机晶体的核磁共振光谱

他们首先创建了自己的有机固体化学位移数据库,将剑桥结构数据库(CSD)与ShiftML结合起来,前者是一个包含20多万个三维有机结构的数据库,后者是他们之前共同开发的机器学习算法,允许直接从分子固体的结构预测化学位移

最初在2018年的《自然通讯》论文中描述过,ShiftML使用DFT计算进行训练,但随后可以对新结构进行精确预测,而无需执行额外的量子计算

虽然达到了密度泛函理论的精度,但该方法可以在几秒钟内计算出大约100个原子的结构的化学位移,与目前的密度泛函理论化学位移计算相比,计算成本降低了10,000倍

该方法的准确性不依赖于被检测结构的大小,并且预测时间与原子数量成线性关系

这为在以前不可行的情况下计算化学位移创造了条件

在新的科学进展论文中,该团队使用ShiftML来预测从CSD中提取的200,000多种化合物的位移,然后将获得的位移与分子环境的拓扑表示相关联

这包括构建一个代表分子中原子间共价键的图,将它从中心原子延伸给定数量的键

然后,他们将数据库中所有相同的图形实例汇集在一起,使他们能够获得每个基序的化学位移的统计分布

该表示简化了分子中原子周围的共价键,并且不包含任何三维结构特征:这使得他们能够通过结合分子中所有原子分布的m精氨酸化方案,直接从有机晶体的二维化学结构中获得有机晶体核磁共振谱的概率分配

在构建了化学位移数据库后,科学家们在一个模型系统上预测了这些分配,并将这种方法应用到一组有机分子上,这些分子的碳化学位移分配至少部分已经通过实验确定:茶碱、百里酚、可卡因、士的宁、AZD5718、赖诺普利、利托那韦和青霉素的钾盐

发现在大多数情况下,直接从分子的二维表示获得的分配概率与实验确定的分配相匹配

最后,他们在100个不同碳原子的晶体结构的基准集上评估了框架的性能

他们使用移位毫升预测每个原子的移位作为正确的分配,并从用于分配分子的统计分布中排除它们

在超过80%的情况下,在两个最有可能的任务中找到了正确的任务

科尔多瓦说:“通过简化这些研究的第一步,这种方法可以显著加快核磁共振对材料的研究。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/huaxue/22553.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~