威康信托桑格研究所 信用:CC0公共领域 一种新的软件工具允许研究人员快速查询单细胞测序产生的数据集
用户可以识别任何基因组合在哪些细胞类型中是活跃的
3月1日发表在《自然方法》杂志上的这款开放存取的“scfind”软件能够在一台标准计算机上,由众多用户对包含数百万个细胞的多个数据集进行快速分析
此类数据集的处理时间仅为几秒钟,节省了时间和计算成本
该工具由韦尔科姆桑格研究所的研究人员开发,可以像搜索引擎一样使用,因为用户可以输入免费文本和基因名称
过去10年来,对单个细胞的遗传物质进行测序的技术发展迅速
单细胞RNA测序(scRNAseq)用于评估哪些基因在单个细胞中是活跃的,可以同时用于数百万个细胞,并产生大量数据(2
《人类肾脏图谱》2 GB)
包括《人类细胞图谱》和《疟疾细胞图谱》在内的项目正在使用这种技术来揭示和表征生物体或群体中存在的所有细胞类型
广泛的研究人员必须能够方便地访问和查询数据,以从中获得最大的价值
为了实现快速高效的访问,一种叫做scfind的新软件工具使用两步策略将数据压缩到100倍
高效的解压缩使得快速查询数据成为可能
由韦尔科姆桑格研究所的研究人员开发的scfind可以在没有特殊硬件的标准计算机上对涉及数百万个细胞的数据集进行大规模分析
过去需要几天才能返回结果的查询现在需要几秒钟
这种新工具还可以用于多组学数据的分析,例如通过将测量表观遗传活性的单细胞ATAC序列数据与单细胞序列数据相结合
医生
该研究的主要作者、韦尔科姆·桑格研究所博士后吉米·李说:“多组学方法的进步为欣赏基因调控网络的景观和动态提供了前所未有的机会
Scfind将帮助我们识别调节基因活动的基因组区域——即使这些区域远离它们的目标
" Scfind还可用于识别与细胞类型相关或定义细胞类型的新遗传标记
研究人员表示,与人工管理的数据库或其他可用的计算方法相比,scfind是一种更精确的方法
为了使scfind更加用户友好,它结合了自然语言处理技术,允许任意查询
医生
马丁·亨伯格曾是韦尔科姆·桑格研究所(Wellcome Sanger Institute)的组长,现就职于哈佛医学院和布里格姆女子医院,他说:“单细胞数据集的分析通常需要基本的编程技能以及遗传学和基因组学方面的专业知识
为了确保大范围的用户可以访问大的单个单元数据集,我们开发了一个功能类似于搜索引擎的工具——允许用户输入任何查询并找到相关的单元类型
" 医生
陈·扎克伯格倡议的科学项目官员乔纳·酷说:“新的、更快的分析方法对于在单细胞数据中找到有希望的见解至关重要,包括在人类细胞图谱中
像scfind这样的用户友好型工具正在加速科学的步伐,并提高研究人员在彼此工作的基础上进行构建的能力,陈·扎克伯格倡议为支持开发这项技术的团队而感到自豪
"
来源:由phyica.com整理转载自PH,转载请保留出处和链接!