物理科技生物学-PHYICA

研究人员程彤颜使用神经网络来研究脱氧核糖核酸

生物 2022-05-12 00:03:06

国立研究大学高等经济学院 信用:Pixabay/CC0公共域 健康、安全和环境科学家提出了一种方法来提高寻找脱氧核糖核酸的准确性,即扭曲到左边而不是右边的脱氧核糖核酸区域

为此,他们使用了神经网络和由世界各地不同实验室进行的30000多个实验的数据集

这项研究的细节发表在《科学报告》上

自从发现脱氧核糖核酸的结构以来,已经过去了67年,科学家们已经发现了这种分子的许多结构变异

有时候,脱氧核糖核酸结构根本不像通常所说的双螺旋,双螺旋被称为B-脱氧核糖核酸:它们与B-脱氧核糖核酸的不同之处在于链的数量(从两条到四条)、链的密度和厚度、含氮碱基的连接方式以及螺旋的扭曲方向

其中一种结构,Z-DNA,由一个双螺旋组成,扭曲不同——向左而不是向右

众所周知,在各种生物(从细菌到人类)的细胞中发现了Z-DNA区域,该区域在特定条件下出现(例如,在超螺旋DNA或高盐浓度中),并且可以与一个分子中的其他DNA结构结合

例如,如果由于某种原因,乙脱氧核糖核酸分子被超螺旋到使转录变得复杂的程度(基于脱氧核糖核酸的核糖核酸合成),它的一些部分可以向相反的方向扭曲,从而减轻不必要的压力

“科学家还提出,Z-DNA可以调节转录,增加突变的可能性

一些研究表明,脱氧核糖核酸的形成可能与某些疾病有关,如癌症、糖尿病和阿尔茨海默氏症

最近,越来越多的研究显示了脱氧核糖核酸在先天免疫反应中的作用——细胞本身对病毒和其他病原体的反应

为了了解更多的形成条件和Z-DNA区域的生物学作用,有必要找到它们在基因组中的位置的方法。

1997年,基于连续核苷酸结构结合的实验数据,第一个带有标记的基因图谱被编辑出来

近年来,已经出现了使用计算机算法来预测非B-DNA区域的位置的方法

机器学习的进步使得使用另一种强大的工具来完成这项任务成为可能——神经网络

与大多数方法不同,神经网络可以考虑许多因素,并且不需要科学家预先选择几个最有可能产生影响的因素

但是,即使对于神经网络来说,寻找Z-DNA仍然是一项困难的任务,因为没有足够的实验数据:Z-DNA出现和消失,而一项实验只记录了这些区域的一小部分

研究人员决定测试神经网络的准确性是否随着组学数据信息的增加而增加,或者关于细胞中基因活性和蛋白质合成是如何调节的信息的增加而增加

科学家们首先比较了三种类型的神经网络——卷积神经网络、递归神经网络和前两种网络的组合——如何处理这项任务

卷积神经网络最常用于图像处理,而递归神经网络最常用于文本分析

所有三种类型的神经网络都已经在与基因组研究相关的问题上进行了测试

总之,该研究的作者在由组学数据放大的DNA数据集上训练和评估了151个模型

其中一个递归神经网络,作者命名为DeepZ,产生了最好的结果,他们用它来预测人类基因组中新的Z-DNA区域。

它的精确度大大超过了现有的Z-Hunt算法的精确度

在DeepZ的帮助下,科学家绘制了人类基因组的整个序列,确定了每个核苷酸最终进入Z-DNA区域的可能性

概率超过某个阈值的几个核苷酸的序列被标记为潜在的靶位点

“这项研究的结果很重要,因为在神经网络的帮助下,我们不仅能够复制实验,而且能够预测基因组中Z-DNA形成的潜在位点,”该研究的领导者、健康与环境大学计算机科学学院生物信息学实验室的负责人玛丽亚·波普斯多娃说

“脱氧核糖核酸信号的丰富表明,它们被积极地用来打开和关闭基因

这是一个比基因组基序更快的信号

例如,澳大利亚科学家小组的研究表明,在抑制恐惧的训练中,Z-DNA是一种信号

显然,在需要对事件做出快速反应的情况下,脱氧核糖核酸进化地出现了

我们计划与实验小组启动联合项目来测试预测

" 作者展示了一种使用omix数据和深度学习方法预测Z-DNA区域的新方法

神经网络生成的基因组标记将帮助科学家进行实验来检测Z-DNA,其全部光谱刚刚开始出现

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/16093.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~