物理科技生物学-PHYICA

穿越丛林:GA4GH和无缝基因组数据共享的全球基础设施

医学研究 2022-09-04 21:51:55

信用:里卡多·乔布-里斯,广泛传播 在过去的十五年里,生物医学领域见证了基因组和健康相关数据的数量和种类的爆炸式增长

一方面,这对促进人类健康有着不可思议的好处;随着我们对健康和疾病遗传学知识的增长,研究人员在疾病预防、诊断和治疗方面取得显著进展的机会也在增加

然而,这种爆炸也带来了巨大的挑战

数据集分布在研究中心、大学、医疗保健系统、政府机构等,通常存储在不能直接相互对话的系统中,或者以不能容易地从一种格式转换到另一种格式的系统中

缺乏基础设施,使得研究人员难以共享和分析这些数据,并将其转化为有利于患者的知识

全球基因组与健康联盟(GA4GH)成立于2013年,旨在应对这一挑战,由来自90多个国家的650个组织和1,000名个人成员组成,致力于制定标准、政策和方法,促进有效和负责任的基因组和健康相关数据共享

GA4GH正在构建通用管道、语言和规则,以便研究人员能够以一致的方式共享和分析基因组和临床数据

在最近一期的《细胞基因组学》杂志特刊上,GA4GH成员发表了10篇论文,描述了该组织迄今为止的目标、原则和工作,包括在国际上联合数据访问的建议以及数据访问和监督的标准

这些评论和技术论文共同提供了GA4GH的历史和未来几年其工作发展的路线图

我们与在GA4GH社区中扮演关键角色的四位Broad成员坐在一起——软件工程师和GA4GH变体表示标准(VRS)项目的联合领导者Lawrence Babb软件产品经理和GA4GH数据使用部联合领导乔纳森·劳森;Broad首席数据官、Eric和Wendy Schmidt中心联合主任,以及GA4GH指导委员会成员Anthony Philippakis和研究所成员、GA4GH副主席Heidi Rehm——谈论组织的进步和未来

在过去十年中,临床基因组学的数据共享格局发生了怎样的变化? JL:在2000年代后期,基因组学研究变得越来越普遍,存储在大型数据库中的数据有可能与病人联系起来

这些问题提出了控制数据访问的必要性

好处是这带来了强烈的数据管理意识

问题是,许多机构走在前面,做着自己的事情,这导致了不同数据访问流程的激增

在更高层次上,我们现在看到的是一种愿望,即制定一些清晰的路径,以便研究人员能够在这个过程的丛林中导航,并以可控的方式访问数据

这是GA4GH真正提升的一个领域,它帮助实现了数据访问的一致性

事物的互操作性越强,研究人员就越容易获得他们想要或需要的所有数据来回答一个科学问题,并最终产生积极影响人类健康的创新科学成果

《人力资源》:现在全球都认识到,如果不广泛共享基因组和健康数据以及精选的知识,我们就无法支持临床基因组学

NCBI ClinVar中自愿知识共享的成功以及像媒人交流这样的联合平台的广泛使用向我们表明,临床实验室和罕见病社区已经接受了这样一种理念,即我们必须共同努力来理解因果变异,并将基因组学应用于罕见病患者的护理

你认为将基因组数据带入临床最大的挑战是什么? LB:要达到我们能够可靠地代表遗传发现和知识,并具有必要的临床精确度来告知患者护理的程度,需要付出巨大的努力

这种情况已经开始在各个领域出现,但是仍然没有一个共同的基础,让每个领域的人都能够可靠地建立使用这些宝贵数据的方法

我们需要标准、工具和资源来达到医疗保健系统所要求的水平

JL:我们仍然需要解决的首要问题是,有哪些数据,我们如何共享,以及我们如何分析这些数据

政府、基金会和公司花费了数百万美元来生成基因组数据,通常是为了一个单一的研究项目

在最初的项目之后,这些数据基本上被放在仓库的后货架上,没有人知道它们在那里或者它们如何被使用

所有这些数据都非常有用,我们需要找到合适的激励结构来鼓励数据所有者解决这个问题

美联社:我们正处于一个关键时刻,基因组学正开始从一项纯粹的研究活动转向一项越来越受临床护理驱动的活动

但是,尽管在基础研究中已经真正接受了患者级的数据共享,但在临床中这一点就不那么清楚了

例如,通过肿瘤护理生成的患者级癌症基因组数据的数量使研究环境中生成的数据相形见绌

为什么我们不分享每个癌症患者的基因组和临床数据,这样我们就可以从我们正在进行的治疗的结果中学习?我们需要将研究环境中常见的数据共享扩展到临床环境

我们还需要建立证据基础来证明了解个体的基因组构成可以改善结果

例如,癌症多基因风险评分(PRS)高的患者是否应该接受更积极的筛查?我们应该更早地开始服用他汀类药物吗?为了让基因组学成为护理的标准,我们需要做一些研究来解决这些问题

HR:当试图跨越国际边界进行协作和共享时,仍然有很多关于数据隐私和安全的担忧

我们需要与基因组学社区合作并对其进行教育,让他们了解共享基因组数据的风险和好处,让个人而不是监管者来推动决策,同时应用最先进的方法和深思熟虑的政策来保护个人的隐私权和数据安全

GA4GH推出以来有什么变化?它最大的成功是什么? LB:我参与GA4GH已经有五年左右了

在那段时间里,GA4GH对其组织进行了重大磨砺,使其能够处理对任何一个组织来说都太大或太复杂的关键领域,将他们的工作划分为工作流,并依靠与现实世界驱动程序项目的合作来构建开放的解决方案

GA4GH领导层的“粗略共识运行代码”座右铭有助于驱动程序项目围绕常见问题产生和共享解决方案

JL:社区主导的模式非常成功,超过了我2017年第一次加入GA4GH时的预期

看到管理一个社区主导的标准需要什么真的很有趣

最终需要有仲裁者,但当对需要做什么和如何做达成共识时,这通常是显而易见的

GA4GH是一座桥梁,它为我们提供了一个在全球范围内解决数据共享和数据访问问题的理由和框架

如果你不在全球范围内协调,你注定只能在美国内部,或者在有限的机构网络内解决这些问题

我与新加坡、南非、澳大利亚、巴西和英国的同事交谈,这些人在我的日常工作中可能永远不会和我一起工作,但我可以和他们一起集中精力解决这些问题

那是巨大的

美联社:在过去的十年中,GA4GH开发了一套优秀的流程来观察标准的创建

《细胞基因组学》这本精彩的论文集证明了这一进展

人力资源:我们已经成功地让各国、资助者和组织相信了为基因组和健康数据共享制定共同标准和框架的重要性

我们已经从一个分散的基层组织变成了一个强大的组织,它知道如何在全球范围内开展工作

这些细胞基因组学论文代表了大量的工作

你能描述一些关键的带回家的信息吗? JL:我看到数据共享和数据访问是一个突出且反复出现的主题

前景论文关注数据共享,这是我们在GA4GH中所做的一切的主要目标

我认为这是因为数据共享是基因组发现的力量倍增器

GA4GH参与者可以改善其家庭机构中的数据存储和分析,但构建联合和标准化的系统可以确保每个人的数据都更容易共享和访问,从而使分析结果更强大、更快速

美联社:它们清楚地表明了标准在推动进步方面的力量

以数据使用监督的自动化方法为例

如果你问任何想利用大量基因组数据的研究人员,他们最大的痛点是什么,几乎每个人都会说这是获取数据的过程

数据使用本体和数据使用监督系统可以通过自动化验证研究人员的目的是否与给定数据集的知情同意条款相一致的许多步骤来显著简化这一过程

人力资源:一个共同的主题是有许多人、机构和国家代表的长作者列表,展示了社区共识和广泛参与对推动GA4GH工作的重要性

另一个是认识到我们需要广泛的参与,以确保我们的工作被关键项目和观点所借鉴,并最终被整个社区所采纳

参与我们的驱动程序项目是我们实现这一目标的一种方式

另一个是通过我们在2020年发起的健康基因组实施论坛,该论坛将澳大利亚基因组学和英格兰基因组学等大规模基因组数据倡议聚集在一起,共享资源和知识,并支持我们工作的实施

GA4GH的下一步是什么? LB:我们正在致力于“轻接触”的过程改进工作,这将确保我们工作的质量、一致性和传播

我们还从其他有兴趣参与这项大规模但重要的工作的组织那里获得了捐助

我们还将继续让各组织共同创造和支持各种方法,通过这些方法,可以以标准和可互操作的方式获取和分解关于基因变异的知识,并以有意义的方式与医生和患者分享实验室结果及其解释

这是将基因组学更直接地融入医疗保健的一个基础

JL:在数据使用方面,我认为我们正在从防守转向进攻

我们更加积极主动,谈论创造新事物,而不仅仅是解决老问题

我们可以进行哪些创新来释放巨大的潜力?其中的一个主题是联邦:创建标准,如果我是一名研究人员,每次我连接到一个新的数据库或新的机构时,我不必一遍又一遍地重复相同的过程

在政策发展和技术发展中有这种舞蹈;他们必须协同行动

通过GA4GH,Broad能够帮助美国、欧洲及其他地区的监管机构进行大量政策宣传

除此之外,我们还能够构建适合新制定的政策的软件,或者证明我们提议的政策实际上是可行的,并为我们提供反馈以完善它

人力资源:我们开始更加注重已经批准的标准的实施

我们希望与我们的驱动程序项目和更广泛的社区合作,对我们的标准和政策进行压力测试,并证明它们符合目的,同时将多个标准拼接在一起,以支持端到端的工作流

我认为Broad已经做好了充分的准备,将继续为GA4GH的工作做出贡献,实施GA4GH标准,并帮助展示在我们的领域可以取得的成就

来源:由phyica.com整理转载自PH,转载请保留出处和链接!

本文链接:http://www.phyica.com/yixueyanjiu/22888.html

发表评论

用户头像 游客
此处应有掌声~

评论列表

还没有评论,快来说点什么吧~