人类基因组计划20年
撰文 | 计永胜
责编 | 叶水送
2021年2月,《科学》(2月5日)和《自然》(2月11日)杂志出版人类基因组计划专刊,以纪念人类基因组草图发表20周年。
1953年,克里克和沃森发现DNA的双螺旋结构;1977年,沃特·吉尔伯特(Walter Gilbert)和弗雷德里克·桑格(Frederick Sanger)发明了DNA测序的方法。
基因组学研究里程碑事件,图片来自lehigh.edu
随后,包括EBV病毒在内的一些简单生物的DNA序列被测序成功。虽然有一些科学家建议对人类基因组进行测序,但面对人类基因组30亿碱基对的庞大规模,持续性的研究经费成为摆在研究人员面前的难题。
1986年3月,美国能源部(DOE)在新墨西哥州的圣塔菲(Santa Fe)召开会议,讨论人类基因组测序计划。诺贝尔生理或医学奖获得者罗纳托·杜尔贝科 (Renato Dulbecco)在《科学》杂志发表文章指出,对人类基因组的测序将成为肿瘤研究的关键转折点。
同年6月,加州理工学院莱诺·伊·胡德(Leroy E. Hood,1987年的拉斯克医学奖获得者)和劳埃德·史密斯(Lloyd Smith)改进了程序繁琐的Sanger测序法,发明了世界上第一台DNA自动测序仪。
可以说,不管是从现实需要还是技术支持,对人类基因组进行测序的时机已经相对成熟。
1990年4月,美国国立卫生研究院(NIH)和能源部共同发布人类基因组5年计划,该计划包括人类及模式生物基因组的测序和图谱绘制、数据收集和分析支持(算法改进、软件设计开发等)、技术研发和转让等。
同年8月,NIH开始对四种模式生物进行基因组大规模测序,包括山羊支原体(Mycoplasma capricolum)、大肠杆菌(Escherichia coli)、秀丽隐杆线虫(Caenorhabditis elegans)和酿酒酵母(Saccharomyces cerevisiae)。两个月后,NIH和能源部“对了对时钟”,正式宣布10月1日为“人类基因组计划”官方正式起始时间。
自此,先后由美国、英国、法国、德国、日本和我国科学家共同参与、被誉为生命科学“登月计划”的“人类基因组计划”正式踏上征程,这一走就是将近13年。
当然,这期间也出现一些“插曲”,例如生物学家、“科学狂人”克雷格·文特尔(John Craig Venter)因为与“人类基因组计划”团队在基因组测序数据分享政策方面存在分歧,一气之下离开了NIH,并于1998年5月成立赛莱拉(Celera)生物技术公司,宣称将在3年内完成人类基因组测序工作。于是NIH不得不提高效率,加快进度,以免被文特尔抢先。实际上,这种“竞争”也推动了“人类基因组计划”更加快捷地进行。
最终的结果还是皆大欢喜的(注:在很多人看来,赛莱拉赢得了这场竞赛),国际人类基因组测序联盟和赛莱拉生物技术公司分别于2001年2月15日和2001年2月16日在《自然》和《科学》杂志发表人类基因组草图。
克林顿宣布人类基因草图完成,图片来自heterodoxology.com
“人类基因组计划”最终完成是在2003年4月,宣告“后基因组时代”到来。那么,“人类基因组计划”对当今科学研究有哪些影响?
美国西北大学网络科学研究所亚历山大·盖茨(Alexander J. Gates)等人在2月11日《自然》杂志撰文指出,“人类基因组计划”大大提升了我们对基因及其调控元件的认识,并协助研究人员确定众多药物的靶点[1]。
“人类基因组计划”最显著的特点就是数据量庞大,项目实施的13年中,得到“注释”的基因数量迅猛增加。自2001年开始,每年关于蛋白编码基因的学术论文数量在10000到20000篇,只要集中在CD4、TP53、TNF和EGFR等明星基因上。这都得益于“人类基因组计划”将数据获取方式由“单钩钓鱼”改为“细网捞鱼”。
“人类基因组计划”还进一步确定了基因组中非编码序列的生物重要性。这些序列的改变不会影响蛋白的序列,但会干扰蛋白表达的网络,进而影响生物学功能。
在2001年之前,明确某种药物全部蛋白靶点的概率不到50%。“人类基因组计划”完成后,美国每年通过的药物几乎都有清楚的作用靶点说明。
“人类基因组计划”不仅促进了生物学和生物医学的发展,而且积极深化了多学科合作的“大科学”融合。
自本世纪初,信息科学和计算机科学的发展更加迅速,“人类基因组计划”就是遗传学、生物化学、分子生物学和信息科学深度合作的成功案例,此后各类“组学”出现,共同构建生命科学的“大数据”时代。
与此同时,随着计算机算法的不断更新迭代、测序成本的逐渐降低,个人基因组学正在走进人们的日常生活。基因组测序的大众化更有助于我们了解人类自身遗传的多样性,最终服务医学发展,保障人类健康。
20年后,当我们回顾人类基因组计划时,人类已不再满足发现基因,而是修饰基因、编辑基因,甚至是创造一个此前从未出现过的基因。下一个20年,我们还能对这些人类基本的遗传单元做些什么呢?至少我们已感受到了当下基因治疗正如日中天地发展着,我们正在收获“人类基因组计划”当年播撒的果实。
作者简介
计永胜,中国科学技术大学生命科学与医学部青年讲师,曾担任安徽医科大学副教授,威斯康星医学院癌症中心做博士后。
来源:赛先生