物理科技生物学-PHYICA

计算机科学家开发程序寻找序列数据中的“低频”变异

技术工程 2022-04-14 21:56:00

Computer scientists develop program to find ‘low-frequency’ variants in sequence data插图定义了单个宿主内的单核苷酸变异体(iSNVs)与宿主间传播的单核苷酸多态性之间的区别。莱斯大学的计算机科学家已经引入了Variabel,它使用测序数据从公共数据集中识别SARS-CoV-19的低频宿主内变异。鸣谢:特伦根实验室关于隐藏在大量基因新型冠状病毒序列中的变异体的细节将会是很好的了解,只要研究人员能够得到它们。莱斯大学乔治·布朗工程学院开发的一项新计划将使这成为可能,至少对于“宿主内变异”,即出现在同一新冠肺炎阳性者基因组数据中的变异。

由计算机科学家托德·特伦根和研究生李运喜领导的赖斯团队开发了Variabel,它可以准确识别导致新冠肺炎病毒的“低频变异”。

特伦根说,找到这些线索可能是在潜在的毁灭性变异有机会传播之前识别它们的关键。

这些数据可以免费获得,但是数量太多了。这项研究使得低频变异挖掘可用于牛津纳米孔技术公司(ONT)收集的约50万新型冠状病毒基因组,该公司为DNA或RNA的单个长分子的快速测序提供了一个负担得起的平台。

“Variabel直接实现了使用负担得起的纳米孔测序技术来识别病毒感染后的宿主内变异,”Treangen说,他的工作早在新冠肺炎疫情之前就专注于传染病监测。

该实验室在根据感染埃博拉病毒和诺如病毒的患者的序列数据测试Variabel方面取得了类似的成功。

《自然通讯》详细介绍了这个开源程序,可以在https://gitlab.com/treangenlab/variabel.网站下载

研究人员声称,Variabel的关键是它能够在ONT过程中区分真正的变异和测序错误。

为了验证Variabel,他们比较了单个阳性患者的数据以及ONT和另一种测序技术Illumina产生的跨患者数据集的序列。随着时间的推移,一个病人可以拥有多达10亿份病毒。

通过比较Variabel应用于数据前后的结果,他们发现该程序能够纠正大多数测序错误。

“Variabel为便携式、可负担得起和快速表征宿主内变异打开了大门,这最终可能有助于发现未来针对相关变异的变异,”Treangen说,他的实验室与赖斯的肯肯尼迪研究所(Ken Kennedy Institute)一起主办了3月11日的研讨会,讨论疫情推动的科学进步。

论文的共同作者是莱斯大学本科生约书亚·科尔尼(Joshua Kearney)和软件工程师布莱斯·基尔(Bryce Kille),以及贝勒医学院博士后梅德哈特·马哈茂德(Medhat Mahmoud)和人类基因组测序中心副教授弗里茨·塞德拉泽克(Fritz Sedlazeck)。特伦根是计算机科学的助理教授。

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/jishugongcheng/14561.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~