物理科技生物学-PHYICA

解读基因爱情新呼吸下载组生物学的可解释人工智能

生物 2022-10-02 00:03:37

斯托斯医学研究所 研究人员使用高分辨率实验中的DNA序列来训练一个名为BPNet的神经网络,然后揭示其“黑盒”内部工作,以揭示序列模式和基因组调控代码的组织原则

学分:插图由斯托斯医学研究所的马克·米勒提供

斯托斯医学研究所的研究人员与斯坦福大学和慕尼黑技术大学的同事合作,开发了先进的可解释人工智能技术,以破译编码在脱氧核糖核酸中的调节指令

在2021年2月18日在线发表在《自然遗传学》上的一份报告中,该团队发现,一个在蛋白质-脱氧核糖核酸相互作用的高分辨率地图上训练的神经网络可以揭示整个基因组中微妙的脱氧核糖核酸序列模式,并提供对这些序列是如何组织起来调节基因的更深入理解

神经网络是强大的人工智能模型,可以从不同类型的数据(如图像、语音信号或文本)中学习复杂的模式,以令人印象深刻的高精度预测相关属性

然而,许多人认为这些模型是不可解释的,因为学习的预测模式很难从模型中提取出来

这种黑盒性质阻碍了神经网络在生物学中的广泛应用,在生物学中,预测模式的解释是最重要的

生物学中一个尚未解决的大问题是基因组的第二个代码——它的调控代码

脱氧核糖核酸碱基(通常由字母A、C、G和T表示)不仅编码如何构建蛋白质的指令,还编码在生物体中何时何地制造这些蛋白质的指令

调控代码由称为转录因子的蛋白质读取,转录因子结合到称为基序的短段DNA上

然而,特定的基序组合和排列如何指定调控活动是一个非常复杂的问题,很难确定

现在,一个由生物学家和计算研究人员组成的跨学科团队,由斯托斯研究员朱莉娅·泽特林杰博士领导

D

,Anshul Kundaje,博士

D

,来自斯坦福大学,设计了一个神经网络——碱基对网络的BPNet可以解释为通过预测转录因子与DNA序列的结合来揭示调控代码,精确度前所未有

关键是以最高的分辨率进行转录因子-脱氧核糖核酸结合实验和计算建模,直到单个脱氧核糖核酸碱基的水平

这种分辨率的提高使他们能够开发新的解释工具来提取关键的基本序列模式,如转录因子结合基序和组合规则,基序通过这些规则一起作为调控代码发挥作用

“这非常令人满意,”泽特林杰说,“因为这些结果与现有的实验结果非常吻合,也揭示了令我们惊讶的新见解。”

" 例如,神经网络模型使研究人员能够发现一个惊人的规则,该规则控制着被广泛研究的转录因子Nanog的结合

他们发现,当Nanog的多个基序以周期性的方式出现时,它们会与DNA协同结合,从而出现在螺旋DNA的同一侧

蔡特林格说:“有大量实验证据表明,这种模体周期性有时存在于调控代码中。”

“然而,确切的情况是难以捉摸的,Nanog不是一个嫌疑人

发现Nanog有这样的模式,并看到其相互作用的更多细节,令人惊讶,因为我们没有专门搜索这种模式

" “这是使用神经网络来完成这项任务的关键优势,”博士说

D

,该论文的第一作者

阿夫塞和昆达耶创建了第一个版本的模型,当时阿夫塞在朱利安·加涅尔博士的实验室进行博士研究期间访问了斯坦福大学

D

德国慕尼黑技术大学

“更传统的生物信息学方法使用基于现有知识的预定义严格规则对数据进行建模

然而,生物学是极其丰富和复杂的,”阿夫塞说

“通过使用神经网络,我们可以训练更灵活、更细致的模型,在没有先前知识的情况下从头开始学习复杂的模式,从而实现新的发现

" BPNet的网络结构类似于用于图像中面部识别的神经网络

例如,神经网络首先检测像素中的边缘,然后学习边缘如何形成面部元素,如眼睛、鼻子或嘴,最后检测面部元素如何一起形成面部

BPNet不是从像素中学习,而是从原始的脱氧核糖核酸序列中学习,并学习检测序列基序,最终检测元素预测碱基分辨率结合数据的高阶规则

一旦模型被训练得非常精确,学习到的模式就可以用解释工具提取出来

输出信号被追溯到输入序列,以揭示序列基序

最后一步是把这个模型当作神谕,用特定的脱氧核糖核酸序列设计系统地查询它,类似于实验性地测试假设,以揭示序列基序以组合方式发挥作用的规则

蔡特林格说:“美妙之处在于,该模型可以预测更多我们可以进行实验测试的序列设计。”

“此外,通过预测实验扰动的结果,我们可以确定最有助于验证模型的实验

“事实上,在CRISPR基因编辑技术的帮助下,研究人员通过实验证实了该模型的预测非常准确

由于这种方法是灵活的,适用于各种不同的数据类型和细胞类型,它有望导致对调控代码和遗传变异如何影响基因调控的理解迅速增长

蔡特林格实验室和昆达杰实验室已经在使用BPNet来可靠地识别其他细胞类型的结合基序,将基序与生物物理参数联系起来,并学习基因组中的其他结构特征,例如与DNA包装相关的结构特征

为了使其他科学家能够使用BPNet并根据自己的需要进行调整,研究人员已经通过文档和教程提供了整个软件框架

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/24537.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~