人类基因组计划的遗产

在人类基因组计划的第一稿序列发布 20 年后,人类基因组计划 (HGP) 对生物医学研究产生了深远的影响——无论是在工作台上、计算机上还是整个科学界。大型数据集和参考图谱现在是指导科学和临床研究、药物开发和医疗实践的宝贵资源。

人类基因组计划的遗产

HGP 还给我们留下了一项重大使命——20 年后仍未完成——了解基因组信息如何导致细胞和生物体的发育、功能和故障,并充分利用这些知识来促进人类健康和治疗疾病。

在 1980 年代,科学家们使用越来越精细的基因图谱工具来查明孟德尔疾病(如囊性纤维化和亨廷顿病)的潜在基因。但要充分了解常见人类疾病的遗传基础,其中有多个基因在起作用,这些基于基因组标记的作图技术是不够的。

相反,理论分析表明需要一个无限密集的物理图谱——即人类基因组的完整序列。这一认识与测序技术的新进展和其他动机(例如识别癌症驱动突变)相结合,推动了 1990 年启动了一项对全基因组进行测序的协调计划——HGP——在 2000 年提供了初稿和2003年参考序列“完成”。

许多人最初怀疑进行这项代价高昂的努力的效用,声称它可能会破坏了解单个基因功能的尝试,同时不能直接揭示疾病生物学。然而,参考基因组的第一个直接结果之一是能够研究人类遗传变异,包括疾病,最初是通过全基因组关联研究 (GWAS),此后已经确定了数万个特定性状和疾病的位点(www.ebi.ac.uk/gwas)。正如现代遗传学预测的那样,GWAS 主要发现效应量较小的基因,但这些仍然是致病机制的重要线索,否则可能无法获得。

人类参考基因组还促成了破译疾病生物学的其他重要工作,例如癌症基因组分析以绘制肿瘤中的体细胞遗传驱动程序,绘制罕见疾病基因图,以及利用大规模生物库检查与多种基因相关的变异的全表型关联研究。

人类基因组计划的遗产

该参考进一步允许比较基因组学注释功能元素,以及古代 DNA 技术来跟踪人类迁徙和特征发展,包括对疾病的易感性。

参考人类基因组序列本身已被证明是一种重要的研究工具。没有它,当今的基本实验室实验是不可想象的:从设计用于分子克隆的引物到通过小干扰 RNA (siRNA) 或基于 CRISPR-Cas9 的引导 RNA 进行基因操作。

HGP 本身和参考的可用性推动了用于快速和廉价测序的强大新技术的发展。下一代测序是 21 世纪的显微镜,它支持一系列强大的基于测序的功能基因组学方法,例如分析单个细胞中的基因表达以及表征细胞和组织的空间背景。这些方法依赖于参考基因组,在实现 HGP 的承诺方面发挥着越来越重要的作用,即阐明基因功能并使各个实验室能够做出以前需要大规模努力的关键贡献。

建立参考文献也迎来了现代计算生物学的发展,以及人们对计算思维通过利用以前不存在的大型数据集来解决生物学问题的力量的认识。基因组项目期间产生的数据规模需要新的数据处理和分析方法,吸引了一代计算机科学家研究生物问题并推动了组装算法的发展。随着基因组数据的数量在随后的几十年中迅速增长,生物学利用数学、统计和计算的进步来扩展对这些数据和其他数据的分析,最近使用的是深度学习模型。

HGP 面临的另一个计算挑战是让研究人员可以访问原始形式的数据——同时保持个人基因组信息的安全性和机密性——以及以允许有效查询和可视化的方式。对数据门户的需求(HGP 中相对较晚的实现)推动了一些第一批大型生物数据库和创新平台的创建,以访问、分析、搜索和可视化数据,特别是加州大学圣塔分校的“基因组浏览器”。“基因组浏览器” 的“轨道”概念和持续的软件工程为未来的努力设定了标准,并且是其经久不衰的遗产之一,既是必不可少的研究资源,也是对其他基因组数据平台的启发。

人类基因组计划的遗产

HGP 通过展示大数据和参考地图的价值,并通过开创创建和运营大型国际联盟所需的原则,迅速改变了主要是小规模合作和有限的出版前数据共享的氛围。1996 年的百慕大原则及其在 2003 年扩展为劳德代尔堡协议,自那时以来一直是有关生物数据共享和信用归属的重要指导。HGP 成为许多公开共享数据以加速科学发展的联盟的蓝图,例如 1000 基因组计划、癌症基因组图谱 (TCGA)、国际癌症基因组联盟、ENCODE、gnomAD、BRAIN Initiative 和人类细胞图谱——- 每个人都为作为公共产品的不同挑战组装参考图谱。

HGP 的最终承诺是改善人类生活,从对疾病的生物学理解转变为诊断、治疗甚至预防。参考基因组已经开始产生这种影响,尤其是在罕见的新生儿疾病和癌症中。例如,研究人员现在可以更容易地确定支持罕见遗传疾病的特定突变,并开始发展机制理解和治疗方案,同时使家庭能够计划未来的怀孕,并通过共享数据资源将他们与其他类似患者联系起来。在癌症中,遗传标记和谱通过常规标准检测、精确治疗以及通过液体活检以较小侵入性监测疾病进展和治疗反应的新方法来改善诊断,而单细胞分析有助于以前所未有的细节揭示肿瘤异质性。

此外,对大量人群的人类遗传学研究对疾病治疗的影响越来越大——根据人类遗传学选择的基因靶标导致成功药物的可能性高达两倍。现在还可以通过针对多种疾病(包括流行的复杂疾病)开发和实施多基因风险评分,使用来自大量人群的数据来评估个体水平的风险。

人类基因组计划的遗产

尽管 HGP 在研究生物学以及最近的临床实践中造成了无可争议的巨变,但它是否完全实现了其使命并兑现了承诺?HGP 核心的两个核心问题仍然悬而未决:生物学中的完整参考是什么,它的价值是什么?如何翻译参考图谱以造福人类健康?这两个问题的答案正在出现,扩展和重塑 HGP 的遗产。

绘制参考基因组图表只是揭开其影响健康的秘密的漫长道路的第一步。尽管早期的 HGP 批评者严重错误地估计了其巨大的科学价值——尤其是对于个体基因功能的研究——但他们是正确的,即破译基因在人体内发挥作用时的功能,无论是单独的还是集体的,不能仅用人类基因组来解决。相反,这需要更新的方法,例如功能基因组学,它生成和梳理大型数据集以梳理编码和非编码序列的功能,表征分子表型,并为功能筛选提供动力(www.icda.bio)。单细胞生物学,了解遗传变异对人类生物学基本单位的功能影响;以及计算方面的进步,尤其是机器学习。

此外,参考的概念在生物学中具有挑战性——因为进化和生理学总是导致保守或不变特征与发散或动态特征之间的张力。HGP 最初专注于最小差异特征,同时着手在共享参考的上下文中映射常见(然后越来越罕见)的变体。[在保守特征中,最后 8% 的重复异染色质序列仅在 2021 年交付] 捕捉人类不断增长的遗传多样性需要分析更多样化的基因组,同时从静态转向统计,利用算法进行预测。当前的绘图工作面临类似的挑战,例如健康和疾病细胞图谱。

人类基因组计划的遗产

这种持续的紧张局势带来了社会挑战。HGP 及其遗产必须为全人类服务,不能忽视目前在生物研究、研究对象和科学家中代表性不足的人。最终,虽然非常有用,但单个参考基因组固有地存在偏见,可能会破坏这一目标。这种偏见和缺乏多样性目前也更广泛地反映在人类遗传学研究中,现有基因组学数据集中非欧洲血统的人的广泛代表性不足限制了我们对人类遗传变异、健康和疾病的理解。它还破坏了健康公平,因为它可能导致针对世界大部分地区不发生的疾病变异的诊断模型或疗法。

解决这种情况的显着努力正在进行中,例如非洲人类遗传与健康(H3Africa)倡议。但要使 HGP 实现其为人类健康服务的最终目标,需要更加有意识地将历史上代表性不足的社区的研究人员和参与者作为平等的研究伙伴参与进来,控制他们自己的数据并有机会直接从中受益。

考虑到这些问题,并且随着基因组测序的广泛使用,单一参考可能不再有意义,但是将每个个人序列作为自己的参考会引入新的隐私问题,尤其是在开放数据共享方面,这可能需要新的隐私保护算法。测序技术已经渗透到日常生活的许多方面,从临床诊断(包括无创产前诊断)到流行的个人基因组学,用于评估潜在疾病风险和通过商业试剂盒进行家谱追踪,以及法医学。

这些用途带来了他们自己的伦理问题——从个人到社会。例如,基因组分析可以揭示出乎意料的家族关系或迟发疾病风险;执法部门可能会在不知情或未经同意的情况下访问它,或者将其用于跟踪和压迫。在 HGP 期间,对基因或基因组序列的可专利性进行了激烈的辩论,当前的倡议,如全球基因组学与健康联盟 (GA4GH),继续评估道德障碍。国家和国际法律和道德框架应应对这些挑战。随着基因组数据及其用途的不断增加,遏制潜在的滥用并确保 HGP 的遗产有助于改善全人类生活至关重要。

原文链接:The legacy of the Human Genome Project

https://www.science.org/doi/full/10.1126/science.abl5403

展开阅读全文

页面更新:2024-02-27

标签:基因组   遗传学   图谱   生物学   序列   癌症   遗产   基因   细胞   特征   人类   疾病   生物   功能   计划   数据   健康

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top