物理科技生物学-PHYICA

用于材料发现的人工智能助手

技术工程 2022-03-26 21:55:09

An AI assistant for material discovery对于给定的材料性能指标,几个JARVIS(各种集成模拟的联合自动化库)组件可以一起工作,设计优化的或全新的材料。鸣谢:Kamal Choudhary,NIST在《钢铁侠》原著电影中,当托尼·斯塔克需要去太空旅行时,他要求他的人工智能(AI)助手J.A.R.V.I.S .制作一套可以在恶劣条件下生存的衣服。正如人工智能专家Kamal Choudhary解释的那样:“在我看来,J.A.R.V.I.S .所做的是,它有一个材料数据库,扫描数据库,找到合适的材料,测试它,然后合成一种可以在太空条件下生存的合金。

"这就是我们希望我们的系统做的事情,这也是我们把它叫做贾维斯的原因."

Choudhary是美国国家标准与技术研究所(NIST)的一名研究员,他是JARVIS(各种集成模拟的联合自动存储库)的创始人和开发者,JARVIS是一个开放的数据集,旨在实现材料发现和优化的自动化。

在2021年12月的npj计算材料中,Choudhary和Brian DeCost (NIST)描述了JARVIS的最新增强,这些增强将人工智能应用于加速发现。将图形神经网络与关于材料的化学和结构知识相结合,他们的原子线图神经网络(ALIGNN)在原子预测任务方面优于先前报道的模型,具有非常高的准确性和更好或相当的模型训练速度。

“ALIGNN可以在几秒钟内预测特征,而不是几个月,”Choudhary说。

除了钢铁侠的灵感,还有材料基因组计划。该计划于2011年由奥巴马总统发起,是一项多联邦机构的努力,旨在以两倍于传统方法的速度和一小部分成本发现、制造和部署先进材料。

NIST对该倡议的最初贡献是创建了一个材料及其特性的数据库,该数据库是使用标准化的尖端计算方法严格获得的。

已经建立了几个这样的数据库,但是“JARVIS数据库的特别之处在于,它包含各种计算方法的模块,”Rutgers大学物理学教授、国家科学院成员和该项目的贡献者David Vanderbilt说。“你可以在许多不同的理论层面上接近这个领域。JARVIS的与众不同之处在于,它跨越了比其他数据库更多的层次。

贾维斯的原始数据来自密度函数理论(或DFT)的计算。“密度泛函理论是大多数人在原子水平上计算材料性质的标准方法,”范德比尔特解释道。“它们是第一原理计算,没有实验输入,结果是根据量子力学定律从理论中推导出来的。”

这种范式非常有效,“然而,如果你看看元素周期表,有数十亿种可能的元素组合——比我们能够生成的数据还要多,”Choudhary说。“这就是机器学习的用武之地。”

Choudhary推断,如果量子力学计算可以作为物理实验的筛选工具,那么机器学习可以作为昂贵计算的筛选工具。

An AI assistant for material discovery原子线图神经网络(alignn)预测了high-CO₂吸附金属有机框架的例子。鸣谢:Kamal Choudhary,Taner Yildirim,Daniel Siderius,A. Gilad Kusne,Austin McDannald,Diana L. Ortiz-Montalvo但首先,这样的系统需要训练。像ALIGNN这样的神经网络需要大量的训练数据才能有效。Choudhary的尖端人工智能模型背后是对70,000种材料的DFT模拟,并且还在不断增加。这个不断增长的数据库用于训练神经网络,神经网络反过来可以快速表征新材料或筛选具有特定属性的材料。

“这是材料基因组计划的梦想成真,”Choudhary说。

Choudhary和他的合作者在arXiv中提供了一个系统如何加速发现的例子。他们使用alignn预测了金属有机框架的CO₂吸附特性,这是一种可以从大气中去除CO₂的多孔材料,并通过计算对实验合成的主要候选物进行排名。

贾维斯数据集主要是在NIST的超级计算机上生成的,这些计算机已经为此工作了近五年。最近,Choudhary获得了德克萨斯高级计算中心(TACC)的Frontera和Stampede2超级计算机的访问权,这些计算机也为数据集做出了贡献。

“机器学习领域自20世纪80年代以来就已经存在,但主要问题是精心策划的数据集,”Choudhary说。“我们的数据库中现在接近10万种材料,这是因为弗龙特拉和NIST才有可能实现的。这有助于我们弥合这一差距。”

有了大量可用的训练样本,以及硬编码到神经网络中的化学和物理知识,Choudhary能够大大提高他的机器学习模型的准确性。“你能使用的领域知识越多越好。我觉得物理和AI不应该是彼此的竞争对手;他们应该是朋友和合作者。”

ALIGNN工具,就像那些用于DFT计算和其他机器学习方法的工具一样,被集成到JARVIS中,并提供给全球的研究人员。Choudhary估计每年有8000名化学家和生物学家使用这个知识库。最近,它使阿贡国家实验室的科学家能够研究拓扑磁性材料,并帮助西北大学的研究人员研究材料的转移学习。

Choudhary还与David Vanderbilt合作开发“超越DFT”方法,将其应用于量子材料,并将这些方法和数据集集成到JARVIS中。

“DFT有一些重要的近似值,”范德比尔特说。“因为电子被视为独立的,所以你错过了量子材料中一些非常特殊和有趣的行为,这些行为导致了超出普通理论正常预期的效应。”

这些包括但不限于非传统超导、量子霍尔效应和拓扑磁结构。“对于这些种类的材料,普通的DFT不够好,”他继续说。“我们的数据库采用了三或四种更高层次的超越DFT方法,让社区了解基于底层方法的答案可能会有什么不同。”

通过建立可能材料的数据库和开发自动筛选工具,Choudhary希望加快发现的速度,使类似钢铁侠的能力更接近现实。

“想象有一天,一个模型可以预测一种新材料、一种新药物,并且说,‘在一百万个分子中,先试试这个。’”乔杜里说道那是材料科学的黄金时代。"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/13223.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~