阿尔贡国家实验室的尼尔斯·海诺宁 带有配体的Nsp10/16表面
研究人员开发了一条管道,将ALCF的超级计算机与APS实验连接起来,实现对新冠肺炎蛋白质的实时分析,为阐明冠状病毒的重要蛋白质结构动力学铺平了道路
学分:芝加哥大学传染病结构基因组学中心Mateusz Wilamowski乔治·米纳索夫,西北大学传染病结构基因组学中心 阿尔贡研究人员在ALCF超级计算机和高级光子源实验之间开发了一条管道,可以按需分析新冠肺炎蛋白质的晶体结构
随着冠状病毒SARS-CoV-2及其相关疾病新冠肺炎的发展,并在全国和全球传播,美国
S
能源部阿贡国家实验室通过开始工作来更好地理解和治疗这种流行病,从而加入了全球斗争
在阿贡领导计算设施,一个美国能源部科学用户设施办公室,已经启动了几个这样的研究项目,以利用其大量的科学资源;其中一条线分析了与冠状病毒相关的蛋白质复合物的晶体结构
理解冠状病毒的关键是解开它的结构
为此,阿尔贡研究人员利用ALCF的太塔超级计算机分析了与非典冠状病毒-2相关的蛋白质复合物的晶体图像
这些图像来自阿贡的高级光子源(APS),这是美国能源部科学办公室的一个用户设施,在利用串行同步加速器结晶学技术进行实验后,该技术旨在阐明病毒蛋白质的复杂化学。
与传统晶体学技术的要求相比,系列同步加速器晶体学实验使用高强度x光,仅使用部分辐射剂量来揭示大分子的结构
因此,系列同步加速器结晶学允许研究人员用非常短的曝光时间对成千上万的微观晶体成像
该技术的高速导致产生大量的数据,这些数据的复杂性和密度要求进行复杂和计算要求高的分析
像太塔这样的大规模并行系统在满足串行同步加速器晶体学对快速、实时处理的要求方面具有独特的能力
使θ能够用于动态处理是围绕超级计算机构建的数据管道
该管道自动进行数据采集、分析、管理和可视化,将结果传输到存储库,从中提取元数据进行发布
由于芝加哥大学运营的数据管理服务Globus,该流水线以高速生成大量图像,数据传输速度达到每秒700兆字节
领导图像处理工作的阿尔贡的计算机科学家瑞安·查德说:“在美国物理学会和ALCF之间建立的按需分析管道取得了巨大的成功。”
“我们实现了高达每秒95幅图像的处理速度
“这种高速度使得向美国物理学会的实验人员提供即时反馈成为可能
管道始于Globus将图像从APS传输到Theta系统
然后使用FuncX对图像进行分析和处理,FuncX是一个功能即服务的计算系统,它组织将单个任务分派到可用的计算节点
FuncX随后还用于提取关于命中的元数据,识别晶体衍射,并生成描述样本和命中位置的可视化
之后,原始数据、元数据和相关的可视化内容被发布到ALCF的一个门户网站上,在那里它们被编入索引并可搜索以供重用
在APS光束上进行的三次10小时运行过程中,对近1500个流中的19个样本进行了分析,在此期间,在Theta上处理了700000多幅图像
结果数据被发布到数据门户,并用于进一步完善实验工作和配置
促进这种规模的研究所需的流程编排是由目前在Glob us平台上开发的研究数据自动化服务实现的,并以可靠的文件传输和安全的数据共享功能为基础,这些功能已经在APS波束线上广泛使用
这些能力将随着APS束线、ALCF超级计算机、Globus和APS到ALCF网络的未来计划增强而继续改进
即将到来的APS升级将使研究人员能够用基于存储环的x光以他们以前从未见过的规模看到东西,并将数据速率提高几个数量级
将ALCF和美国物理学会升级版的这些功能结合起来,将极大地促进科学发现
美国物理学会x光科学部的生物物理学家和束线科学家达伦·谢雷尔说:“同步加速器晶体学系列实验的生物相关性越来越强,这使得研究人员在未来几周内准备了大量进一步的实验。”
这项工作为阐明冠状病毒的重要蛋白质结构动力学铺平了道路
"
来源:由phyica.com整理转载自PH,转载请保留出处和链接!