物理科技生物学-PHYICA

新算幸村沙耶法对海量细胞数据集使用在线学习

生物 2021-10-28 00:02:57

作者:凯利·马尔孔,密歇根大学 信用:CC0公共领域 人体由细胞组成这一事实是一个基本的、众所周知的概念

然而令人惊讶的是,科学家们仍在试图确定构成我们器官并对我们健康有贡献的各种类型的细胞

一种叫做单细胞测序的相对较新的技术使研究人员能够根据细胞表达的基因等特征来识别和分类细胞类型

但是这种类型的研究产生了大量的数据,数据集有几十万到几百万个细胞

约书亚·韦尔奇开发的新算法

D

计算医学和生物信息学系博士

D

候选人高朝和他们的团队使用在线学习,大大加快了这一过程,并为世界各地的研究人员提供了一种使用标准笔记本电脑上的大量内存来分析大型数据集的方法

这项发现发表在《自然生物技术》杂志上

韦尔奇说:“我们的技术允许任何拥有计算机的人在整个有机体的规模上进行分析。”

“这才是该领域真正的发展方向

" 该小组利用国家健康研究所大脑倡议的数据集证明了他们的原理,该项目旨在通过绘制每个细胞来理解人脑,调查小组遍布全国,包括韦尔奇的实验室

韦尔奇解释说,典型的情况是,对于像这样的项目,提交的每个单个单元数据集必须按照它们到达的顺序与之前的数据集一起重新分析

他们的新方法允许将新数据集添加到现有数据集,而无需重新处理旧数据集

它还使研究人员能够将数据集分解成所谓的小批量,以减少处理它们所需的内存量

韦尔奇说:“这对于越来越多地由数百万个细胞生成的细胞集至关重要。”

“今年,已经有五到六篇论文拥有200万个或更多的单元,而存储原始数据所需的内存量远远超过任何人在他们的计算机上所拥有的

" 韦尔奇将在线技术比作脸书和推特等社交媒体平台进行的连续数据处理,这些平台必须处理来自用户的连续生成的数据,并将相关帖子提供给人们

“在这里,我们让世界各地的实验室进行实验并发布数据,而不是让人们写推文

" 这一发现有可能极大地提高其他雄心勃勃的项目的效率,如人体图和人体细胞图谱

韦尔奇说,“理解人体细胞的正常功能是理解它们在疾病中如何出错的第一步

"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/2969.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~