物理科技生物学-PHYICA

机器学习イヴ(神代弓子)工具精确定位疾病相关基因、功能

生物 2022-08-21 00:03:32

哈佛医学院的斯蒂芬妮·达奇恩 信用:CC0公共领域 哈佛医学院遗传学研究员罗伯特·伊茨瓦特在试图确定一种实验药物是如何减缓肺癌细胞生长的时候,想到了这个主意

他发现这种药物在细胞中引发了一连串的分子和基因变化,但他需要缩小许多激活基因中的哪一个实际上在对抗癌症,而不是做无关的工作

而且,考虑到单个基因经常做不止一件事——有些甚至执行100多种不同的任务——他需要弄清楚关键基因在这些细胞中做哪些工作

有如此多的选择,以至于伊茨瓦亚特不知道从哪里开始

处于这一位置的研究人员通常依靠经验,有时还依靠软件,来筛选候选基因的淤泥,并找出导致或促成疾病或放大药物效果的金块

然后他们通过研究科学文献档案来研究这些基因是如何运作的

这有助于他们建立一个更好的跳板,从这里开始进行实验

然而,接受过计算生物学训练的伊茨瓦特有一个更好的主意:创造一个工具,可以自动搜索和识别最重要的基因和基因功能

现有的工具可以衡量哪些生物过程与实验相关,但不能对单个基因或功能进行排序

“我意识到许多研究人员都在为同样的问题纠结,”伊茨瓦特说

“所以,我决定建立一些不仅对我有用,而且对更广泛的科学界有用的东西

" 这项工作的成果——英国皇家科学院遗传学家斯特灵·丘奇曼和系统药理学家彼得·索格尔的实验室合作——于2月16日发表

基因组生物学2

该工具被称为基因行走,它结合了机器学习和自动文献分析来指出哪些基因和功能最有可能与研究人员的项目相关

“这是当今许多生物实验室面临的难题:我们有一份1000个基因的清单,我们需要弄清楚下一步该做什么,”英国皇家科学院布拉瓦茨尼克研究所遗传学副教授、该论文的资深作者丘奇曼说

“我们有一个工具,它不仅能帮助你找出要追踪的基因,还能帮助你找出这些基因在你所研究的系统中的作用

" 作者说,通过处理大量数据,并在用户进行昂贵、耗时的实验之前提供基于证据的指导,基因行走有望提高研究人员获得疾病遗传学新见解和设计治疗方法的速度和效率

该论文的第一作者伊茨瓦特说:“它产生了可以测试的基因特异性机制假说。”

“这应该会给人们节省很多时间和金钱

" 鹤立鸡群 基因行走与其他可用工具的区别在于它使用了INDRA数据库,该数据库包含了从大量自动化文献搜索中合成的信息

INDRA是综合网络和动态推理汇编程序的缩写,它从所有已发表的生物医学文献中积累发现,分析文本以提取因果关系,生成模型和预测,并将丰富的信息转换成可搜索的数据库

印度药物研发机构及其数据库是由英国卫生研究院系统药理学实验室的治疗科学研究助理本杰明·戈里和约翰·巴赫曼开发的;索尔格,英国皇家海军系统药理学教授奥托·克拉耶;和同事

丘奇曼说:“彼得的团队对因陀罗所做的是惊人的和变革性的。”

“以一种新的方式使用他们卓越的生物医学工程,帮助更多人掌握相关的生物医学知识,这是一种特殊的体验

" 利用INDRA数据库的力量,基因行走是第一个帮助研究人员深入了解他们所研究的生物环境中最相关的基因功能的工具——以伊茨瓦为例,就是肺癌

作者说,大多数研究人员没有意识到基因功能搜索自动化是可能的,这样就不需要花无数个小时阅读论文

“我们正在填补一个很多人认为不可能填补的空白,”丘奇曼说

“机器学习在生物医学研究中的价值很大程度上是让一路上的每一步都变得更容易,”伊茨瓦特补充道

该团队将基因行走软件写成开源代码,并免费提供该工具

它也被设计成便于科学家使用

丘奇曼和伊茨瓦特已经从英国皇家科学院和其他机构的许多实验室那里听说了他们自己的项目

“我喜欢基因漫步有广泛的普遍用途,”伊茨瓦说

“你不是每天都能想到对科学界有帮助的事情

"

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/shegnwu/22012.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~