物理科技生物学-PHYICA

分子哈密顿量和N中心原子尺度性质的等变表示

化学 2022-09-17 00:04:07

由NCCR国家研究能力中心(MARVEL)的Carey Sargent撰写 充满随机数的苯的最小基哈密顿量(左)和在随机目标上学习后由对称适应模型预测的苯的最小基哈密顿量(右)

右边方框中预测哈密顿量的前两个本征态

荣誉:EPFL,米歇尔·塞里奥提 在化学和材料领域,过去十年中引入的最成功、最广泛使用的机器学习方案旨在模拟分子能量或原子间势

因此,用于将原子构型映射成用作模型输入的描述符或特征向量的表示反映了原子间势的基本性质,例如对相同原子之间置换的不变性、分子结构的刚性旋转或反转

它们还反映了局域性和近视的概念,即潜在的局域电子性质主要取决于原子间能量的许多成分的有效外电势,而有效外电势只存在于附近的点上

这种关注,尤其是对局部性和近视的关注,导致了以原子为中心的特征的使用,这些特征描述了特定原子周围的邻居的排列

这种以原子为中心的表示法已被用于建立诸如核磁共振化学屏蔽等性质的模型,这些模型与单个原子中心I相关联,但也用于将分子能量等整体性质表示为以原子为中心的贡献的总和

最近,需要为具有更复杂结构的原子属性(如偶极矩和极化率)构建数据驱动模型,这导致了对称不变模型的推广

尽管这导致了关于旋转和反转的等变行为,但是这些表示通常仍然与以原子为中心的框架一起使用

这是有问题的,因为几个性质,如核磁共振中的j耦合,描述了核自旋或单粒子有效电子哈密顿量ĥ的矩阵元素之间的磁相互作用,当写在原子轨道基础上时,本质上与多个原子中心相关联

然后,通过构建与显式电子结构计算更匹配的数据驱动模型,可以获得改进的半经验方法

例如,一个机器学习的ĥ可以允许研究人员访问诸如光激发的可观测值,或者可以用作一个新兴的ML模型家族的输入,该家族使用通过显式电子结构计算或相应的特征值计算的矩阵元素来预测分子性质

现有的试图预测分子哈密顿量的最大似然方法是通过对以原子为中心的特征进行特别修改或通过设计特征来实现的:它们没有明确地包括旋转对称性,而是依赖于数据扩充将它们结合到模型中

瑞士洛桑联邦理工学院计算科学与建模实验室(COSMO)的研究人员Michele Ceriotti、Jigyasa Nigam和Michael Willatt希望为预测这类性质的问题提供更坚实的数学基础,他们引入了一种对称化的N中心表示,为学习与N原子相关的性质提供了一个自然的、完全等变的框架

结合原子指数和几何等方差需要将哈密顿矩阵的条目分成具有明确对称行为的块,但是导致具有更少参考配置的更简单的模型,其足以实现对ĥ的稳健、准确的预测

值得注意的是,该模型既考虑了显式内置的一般对称性,也考虑了与特定点群对称性相关的对称性

也就是说,该模型是结合教科书分子轨道理论构建的

通过检验轨道基础对模型性能的作用,在简单的例子中演示了这些基本特性之后,研究人员继续在日益复杂的问题上对该方法进行基准测试

他们发现,该方法对于畸变H2O分子的同质数据集具有极好的精度,线性回归获得的精度与非对称适应深度学习模型相当,但只有训练集大小的一小部分

在乙醇或有机小分子数据集等更复杂的系统上的工作表明,将ML练习集中在电子能量状态的最相关部分——也就是说,忽略高能空态——至少与ML方法的细节一样重要

在他们的工作中探索的一种方法是引入一个适应对称性的投影哈密顿量,这是一个更小的矩阵,只再现价态和低的、未被占据的本征态,同时保留所有其他几何对称性

研究人员得出结论,尽管只使用了线性或核回归,但对称适应、原子排列和旋转等变表示与最先进的深度学习模型是有竞争力的,并且适用于描述与多个原子中心相关的量

N中心表示也可以很容易地应用于凝聚相

下一步,就构建N中心原子簇的完全等变描述符而言,将明确地或通过更复杂的非线性模型引入更高的体序项

研究人员说:“我们在这里展示的一般结构提供了一个易于扩展的框架来实现这一点,并解决了3中心积分和更高的N量的建模问题,使量子化学计算的所有组成部分都在等变机器学习方案的范围内。”

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/huaxue/23685.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~