物理科技生物学-PHYICA

机器学习模型有助于确定蛋色小姐白质结构

生物 2022-08-28 00:03:39

麻省理工学院 信用:Unsplash/CC0公共领域 低温电子显微镜允许科学家制作蛋白质等微小分子的高分辨率三维图像

这项技术最适用于只存在一种构象的蛋白质成像,但麻省理工学院的研究人员现在开发了一种机器学习算法,帮助他们识别一种蛋白质可以具有的多种可能结构

与仅根据序列数据预测蛋白质结构的人工智能技术不同,蛋白质结构也可以通过低温电磁实验来确定,低温电磁产生数十万甚至数百万个冻结在薄层冰中的蛋白质样品的二维图像

然后,计算机算法将这些从不同角度拍摄的图像拼凑成蛋白质的三维图像,这一过程被称为重建

在《自然方法》的一篇论文中,麻省理工学院的研究人员报告了一种新的基于人工智能的软件,用于重建成像蛋白质的多种结构和运动——这是蛋白质科学界的一个主要目标

研究人员引入了一种新的神经网络结构,可以在单个模型中有效地生成结构的完整集合,而不是使用传统的蛋白质结构表示作为三维晶格上的电子散射强度,这对于建模多个结构是不切实际的

麻省理工学院研究生、该论文的第一作者艾伦·钟(Ellen Zhong)说:“利用神经网络的广泛表达能力,我们可以从嘈杂的图像中提取结构信息,并可视化大分子机器的详细运动。”

通过他们的软件,他们从成像数据集中发现了蛋白质运动,在这些数据集中最初只识别出一个静态的三维结构

他们还观察到了拼接体的大规模灵活运动——拼接体是一种蛋白质复合物,协调转录的核糖核酸的蛋白质编码序列的拼接

“我们的想法是尝试使用机器学习技术来更好地捕捉潜在的结构异质性,并允许我们检查样本中存在的各种结构状态,”麻省理工学院生物系怀特海职业发展助理教授约瑟夫·戴维斯说

戴维斯和邦妮·伯杰是这项研究的资深作者,他们是麻省理工学院西蒙斯数学教授,也是计算机科学和人工智能实验室y的计算和生物小组组长,这项研究发表在今天的《自然方法》杂志上

麻省理工学院博士后特里斯坦·贝普勒也是这篇论文的作者

可视化多步过程 研究人员通过分析核糖体组装过程中形成的结构,展示了他们新方法的实用性。核糖体是负责阅读信使核糖核酸并将其翻译成蛋白质的细胞或细胞器

戴维斯在斯克里普斯研究所当博士后时开始研究核糖体的结构

核糖体有两个主要的亚单位,每个亚单位都包含许多在多步过程中组装的单个蛋白质

为了详细研究核糖体组装的步骤,戴维斯在不同的点停止了这一过程,然后拍摄了最终结构的电子显微镜图像

在某些情况下,阻塞组装导致仅单一结构的积累,这表明该步骤只有一种方式发生

然而,阻止其他点会导致许多不同的结构,这表明组装可能以多种方式发生

因为其中一些实验产生了如此多不同的蛋白质结构,传统的冷冻电磁重建工具不能很好地确定这些结构是什么

“总的来说,当你有一个粒子混合物时,试图计算出你有多少个状态是一个极具挑战性的问题,”戴维斯说

2017年在麻省理工学院开始实验室后,他与伯杰合作,利用机器学习开发了一个模型,该模型可以使用低温电磁产生的二维图像来生成原始样本中发现的所有三维结构。

在新的《自然方法》研究中,研究人员展示了这项技术的力量,用它来识别一种以前从未见过的新的核糖体状态

先前的研究表明,当核糖体被组装时,类似于建筑基础的大型结构元素首先形成

只有在这个基础形成后,核糖体的“活性位点”才被添加到结构中,核糖体读取信使核糖核酸并合成蛋白质

然而,在新的研究中,研究人员发现,在核糖体的一个非常小的子集(约1%)中,通常添加在末端的结构实际上出现在基础组装之前

为了说明这一点,戴维斯假设,对于细胞来说,要确保每个核糖体都以正确的顺序组装起来,能量可能过于昂贵

“这些细胞很可能进化到在它们所能忍受的(可能是这些潜在有害结构的一小部分)和将它们完全从组装途径中移除所需的成本之间找到平衡,”他说

病毒蛋白 研究人员现在使用这种技术来研究冠状病毒尖峰蛋白,这是一种与人类细胞受体结合并允许它们进入细胞的病毒蛋白

尖峰蛋白的受体结合域(RBD)有三个亚单位,每个亚单位都可以指向上或下

“对我来说,观察过去一年大流行的发展强调了一线抗病毒药物在对抗未来可能出现的类似病毒方面的重要性

当我们开始思考如何开发小分子化合物来迫使所有的红细胞进入“向下”状态,这样它们就不能与人类细胞相互作用时,准确理解“向上”状态是什么样的,以及构象的灵活性有多大,将为药物设计提供信息

我们希望我们的新技术能够揭示这些结构细节,”戴维斯说

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/22438.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~