阿尔贡国家实验室 人工智能模型学习的潜在空间提供了一种方法来理解与ACE2受体的尖峰蛋白复合物的构象变化
信用:图像制作人安达特里凡,阿尔贡/伊利诺伊大学厄巴纳香槟分校(UIUC);UIUC约翰斯通;洛伦佐·卡萨里诺和罗米·阿马罗,加州大学圣地亚哥分校;亚历克斯·布雷斯和阿尔温德·拉马纳森,阿尔贡
计算机械协会(ACM)将第一个ACM戈登·贝尔基于高性能计算的新冠肺炎研究特别奖授予了一个多机构研究团队,其中包括美国
S
能源部阿尔贡国家实验室
该小组因其工作“人工智能驱动的多尺度模拟阐明了SARS-CoV-2尖峰动力学的机制”而被选中,该研究揭示了SARS-CoV-2病毒是如何渗透到人类免疫系统中的,从而在全身引发了病毒链式反应。
该奖项于11月宣布
19在SC20上,高性能计算、网络、存储和分析国际会议于今年举行
阿尔贡计算生物学家、该项目的联合首席研究员阿尔温德·拉马纳森说:“我们很高兴获得这个声望很高的奖项。”
“关键是要突破人工智能的界限
这项工作的关键是能够缩放如此庞大的一组模拟,并使用人工智能来驱动一些因素
" 阿尔贡支持研究组织和科学学科的大型合作,探索使用人工智能和高性能计算资源来非常详细地研究尖峰蛋白的复杂动力学,尖峰蛋白是SARS-CoV-2病毒中的关键蛋白之一
这项研究得到了美国能源部国家虚拟生物技术实验室的部分支持,资金来自冠状病毒关爱法案
该团队由来自10个组织的近30名研究人员组成,试图理解这种蛋白质是如何与人类细胞的第一个接触点ACE2受体蛋白结合并相互作用的
这种结合开始了一连串的事件,最终让病毒和人类细胞膜融合,让SARS-CoV-2病毒进入并感染宿主
阿尔贡计算生物学家、该项目的首席研究员阿尔温德·拉马纳森(Arvind Ramanathan)指出,蛋白质不是静止的,它们有广泛的运动,跨越多个长度和时间尺度,而且人们并不总是知道哪些运动是重要的
理解和模拟这些动作需要大量的数据和计算资源
单独开发一个合理的尖峰蛋白模拟可以创建一个由大约1
800万个原子和模拟可以由巨大的数据集组成,即使是最大的超级计算机也要耗费资源
为了使这些数据更便于解释,该团队开发了一种机器学习方法,可以总结大量数据
“这种方法允许我们做的关键事情之一是确定什么是有趣的,什么是重要的,甚至是那些人眼不明显的东西,”拉马丹说
“因此,当你使用模拟程序深入观察时,你开始看到蛋白质结构的显著变化,这告诉我们一些关于尖峰蛋白如何打开,从而与ACE2受体相互作用的信息
" 随着他们所研究的系统规模的增长,该团队面临着扩展所有数据以在当今最大、最好的超级计算系统及其关键组件上流畅运行的挑战
因为他们在这些大型模拟中训练的许多机器学习模型需要有效地扩展才能在超级计算机上使用,他们与图形处理器和人工智能设计领域的领导者英伟达合作,在美国能源部橡树岭国家实验室的Summit上有效地运行这些模型
该团队还利用了许多顶级的美国
S
超级计算机,包括阿尔贡的Theta德克萨斯高级计算中心frontera/Longhorn;圣地亚哥超级计算中心的彗星;和美国能源部劳伦斯·利弗莫尔国家实验室的拉森,发现了处理海量数据的替代方法
“考虑到数据的复杂性,试图理解ACE2受体-尖峰信号的相互作用在这个规模上似乎几乎是不可能的,”拉马纳森透露
“我们清楚地展示的一件事是,我们可以启动这些动态配置的采样,推动我们可以使用人工智能来弥合这些不同尺度的想法
" 他说,到目前为止,产生的数据为尖峰蛋白的柄区如何在与ACE2受体相互作用时改变其整体运动提供了新的见解
最终,这些来自机器学习和模拟高度结合的见解将有助于抗体或疫苗的发现
该团队的文章,“人工智能驱动的多尺度模拟阐明了非典冠状病毒2型尖峰动力学的机制”,将发表在2020年《国际高性能计算应用杂志》上
来源:由phyica.com整理转载自PH,转载请保留出处和链接!