物理科技生物学-PHYICA

评估病毒数据质量的自动化工葵司在线具

生物 2022-05-21 00:03:05

能源部/联合基因组研究所 CheckV评估环境样本中病毒基因组序列的艺术解读

学分:伯克利实验室的佐西亚·罗斯托米恩 通过测序技术和计算方法的进步,越来越多的病毒序列被从环境样品(宏基因组)中回收和鉴定出来

然而,集合基因组病毒序列的质量和完整性差异很大

在之前的一项工作中,一个国际联盟推荐了描述未培养病毒特征的具体指南和最佳实践

根据这些指导方针,JGI的研究人员现在已经开发了CheckV(发音为“Check-Vee”)来帮助研究人员评估和提高集合了宏基因组的病毒基因组的质量

在循环碳、氮和硫等营养物质中起关键作用的微生物本身受其环境中病毒的调节

环境脱氧核糖核酸测序可以帮助科学家恢复这些病毒的基因组,并将它们与微生物宿主联系起来

然而,从集合基因组中组装病毒基因组是具有挑战性的,并且经常导致高度碎片化的数据,这限制了研究人员准确执行功能评估、宿主预测和系统发育分析的能力

CheckV的开发有助于研究人员评估这些序列的完整性,并补充了社区开发定义病毒数据质量的指南和最佳实践的努力

描述病毒基因组片段可能很困难,类似于盲人第一次遇到大象的故事

根据每个盲人触摸的单一身体部位——象牙、耳朵或尾巴——他们分别决定大象是危险的,类似于地毯,还是一根无害的绳子

同样,基因组片段可以提供病毒的不完整图像,对于已经整合到宿主基因组中的病毒,这些序列可能被非病毒基因的存在所污染

到目前为止,研究人员还缺乏快速、准确的工具来评估由宏基因组组装的病毒基因组的质量,包括估计基因组的完整性和去除宿主生物的污染

据《自然生物技术》报道,一个来自美国的团队

S

能源部联合基因组研究所(JGI),位于劳伦斯·伯克利国家实验室(伯克利实验室)的能源部科学办公室用户设施,已经开发了一个名为CheckV的命令行工具,可以自动完成这两项工作

这项工作由研究科学家斯蒂芬·内法希领导,他是尼科斯·基尔皮德斯领导的微生物组数据科学组的第一位作者

为了证明其实用性,纳法赫将CheckV应用于来自IMG/VR的未培养病毒序列(来自环境宏基因组样本),该数据库是整合微生物基因组和微生物组(IMG/M)套件的一部分,以及来自全球海洋病毒2号的序列

0基于公海样本的数据集

CheckV在两个数据集上共鉴定了44,652个完整或接近完整的病毒基因组,将这些基因组与绝大多数不完整片段的其他序列分开

此外,CheckV能够识别出17,000多个邻接序列(重叠群),这些序列的一侧或两侧带有来自宿主生物的基因

使用功能注释方法清楚地定义了病毒-宿主边界,就有可能区分在病毒基因组中发现的代谢基因和来自宿主生物体的代谢基因

如果没有这个预测步骤,许多抗生素抗性和次级代谢的基因将被错误地归因于病毒

该工具可被研究团体广泛用于衡量病毒数据质量,并将帮助研究人员遵循最佳实践和指南,为未培养的病毒基因组提供最少量的信息

CheckV已经应用到2以上

400万个病毒基因组在IMG/虚拟现实的最新版本中可用

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/16649.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~