物理科技生物学-PHYICA

常用原子指纹中的流形导致机器学习四体相互作用的失败

物理学 2023-03-10 17:00:41

由NCCR国家研究能力中心(MARVEL)的Carey Sargent撰写 在图1中,中心图显示了甲烷分子在准恒定肥皂指纹流形上的旋转和无平移运动轨迹

右侧面板中的蓝色点显示了该歧管上配置的指纹距离

它们是准零的事实表明SOAP指纹是准恒定的

然而,另一种重叠矩阵指纹可以识别结构差异

红点表示原子位移较小或相似的其他运动的更大的肥皂指纹距离

左侧面板显示了扭转能量的机器学习能力

扭转角在流形上变化,但是由于指纹是准恒定的,所以流形上的扭转能量也是准恒定的(蓝点),因此不能捕获扭转能量的正确变化

对于歧管外的点,如绿色/黄色所示,扭转能量的变化可以被很好地跟踪

信用:@ UniBasel Stefan Goedecker 原子环境指纹或结构描述符用于描述参考原子周围的化学环境

编码信息,如相邻原子的键长或配位数,这些指纹被用作,例如,机器学习方法中的输入或消除结构搜索中的冗余结构 为了更好地服务于它们的目的,这样的指纹在系统中相同原子的统一平移、旋转和排列下应该是不变的

它们也应该是唯一的,因为如果它们的指纹相同,那么两个环境必然是相同的

如果不是这样,在任何使用这种指纹作为输入的机器学习方案中,两个不同的非退化结构将被分配相同的能量

在数值上,为了在ML方案中使用,两个原子之间的指纹差异必须与环境之间的不同程度相关联:指纹差异非常小的两个结构应该非常相似

在最近发表在《化学物理杂志》上的论文“准常数SOAP和ACSF指纹的流形以及由此导致的机器学习四体相互作用的失败”中,巴塞尔大学的研究人员Stefan Goedecker和Behnam Parsaeifard表明,在两个常用的指纹中,这些条件并不总是满足,即所谓的以原子为中心的对称函数(ACSF)和原子位置的平滑重叠(SOAP)

ACSF和SOAP是势能面机器学习中常用的两种指纹

ACSFs由径向对称函数和角对称函数组成,径向对称函数是两个体项的和,描述原子的径向环境,角对称函数包含三个体项的和,描述原子的角环境

在SOAP指纹中,高斯分布在参考原子周围截止距离内的每个原子上

得到的原子密度乘以一个截止函数,该函数在某个特征宽度上的截止半径处平滑地变为零,然后用正交径向函数和球谐函数展开

在这项研究中,研究人员引入了一个灵敏度矩阵来研究原子坐标上微小变化下原子指纹的行为

然后,他们将该框架应用于三种小分子,H2O、NH3和CH4,分别研究中心原子所处环境包含2、3或4个相邻原子的情况

他们的研究表明,肥皂和ACSF指纹对某些运动不敏感,这意味着研究人员能够构建准恒定指纹的流形,也就是说,对于NH3和CH4,指纹的变化如此之小,以至于它们在数字上表现得像恒定指纹

这导致考虑具有不同扭转能量的不同配置的指纹是准相同的,从而防止了这些扭转能量的机器学习

这一级别的扭转能负责蛋白质和其他生物分子的折叠,因此这些四体相互作用被认为是所有经典力场中的重要部分

这些指纹的局限性意味着,在任何使用它们的ML方案中,它们只能以有限的精度被复制

研究人员说,与普遍认为的相反,肥皂指纹在解决这种四体术语方面并不比ACSF好

科学家们无法用所谓的重叠矩阵指纹方法为任何被研究的分子或构型找到任何这样的流形

他们说,这种指纹基于对角化,即在计算所有轨道之间的重叠矩阵b之前,将高斯轨道的最小基集放置在截止半径内的所有原子上,它总是能够识别结构差异,这使得它成为高保真解决结构差异以及用于各种其他应用的一个有吸引力的选择

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/wulixue/25862.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~