《基因组学核心实验方法》:如何利用基因组学技术揭示生命的奥秘
《基因组学核心实验方法》中文译本由中国科学院北京基因组研究所副所长于军研究员亲自领衔主译,并由所内四名青年科研学者共同翻译而成。该书原著由Mike Starkey和Ramnath Elaswarapu于2011年共同编写。中文译本共计287页,分为13个章节约42.5万字。书中描述了基因组学中关键性的实验步骤和数据分析方法,是一本非常适合于从事基因组学及其在生命科学领域的各个衍生学科研究的研究生和青年学者阅读的研究指南。
当传统的遗传生物学研究进入到分子水平发展阶段后,研究表明:基因留有祖先深刻烙印,基因组学的研究逐渐发展起来。科学家们不再以单个基因作为研究对象的单位,而是以整个基因组为研究单位,认识基因组的结构、功能和演化,阐明整个基因组包含的遗传信息和相互关系,利用基因组学的知识和成果来解码生命之书和治疗疾病。
回顾历史,1990年,美国正式启动了被誉为“人体阿波罗计划”的“人类基因组计划”,这项计划预算投资30亿美元,预期在2005年要破译人体4万个基因的30亿个碱基对的全部遗传信息,还包括对大肠杆菌、酵母、线虫、果蝇和小鼠等5种“模式生物”基因组的研究。中国于1999年9月积极参加到这项研究计划中并承担其中1%的任务,即人类3号染色体短臂上约3000万个碱基对的测序任务,成为参加这项研究计划中唯一的发展中国家。2000年6月26日宣布,人类基因组工作框架图完成,2003年4月,提前完成了人类基因组完成图的发表。
人类基因组计划耗资巨大,是一项浩瀚的工程,在当时很难想象家庭测序将成为今后基因研究和疾病治疗方面的一个新工具。近几年,随着新一代测序技术的广泛使用,测序速度越来越快,成本则大大降低,今后“千美元基因组”甚至“百美元基因组”的设想也将成为可能。2008年,“千人基因组计划”启动,将揭示来自全球27个族群的2500个人的全部基因组信息,计划的成本最终将降低至3000万到5000万美元。这项计划是人类基因组计划的延续,旨在绘制迄今为止最详尽、最有医学应用价值的人类基因组遗传多态性图谱。
现在,基因组学的影响力日益扩大,在完成基因组图谱构建以及全部序列测定的基础上,科学家们进一步研究全基因组的基因功能、基因之间的相互关系和调控机制。
在《基因组学核心实验方法》一书中,主要介绍了热衷于生命科学研究的科学家们所设计的各种研究策略和平台。阐明了基因组学技术的基本原理和方法,主要包括遗传变异探测技术、基因表达分析、酵母菌双杂交系统、基因工程等技术、蛋白质组学分析以及基因疗法的应用。同时还分享了从事实验室研究专家们的实验报告,充分考虑了实验和分析过程中的疑难点并给出解决方案,大大增加了本书的实用性和可操作性。
两个不同人类个体的全基因组相似程度可以高达99.9%,大规模分析人群中的DNA拷贝数变异和SNP位点可以研究人类基因组的遗传变异并进行基因分型,从而发现很多新的与复杂疾病相关的基因位点,帮助我们认识遗传信息和疾病表型直接的关系,揭示人类疾病(如肿瘤)发病机制。本书前几章重点介绍了分析DNA拷贝数的几种策略、靶向DNA重测序技术、高通量基因分型芯片、软件分析杂合性缺失方法、关联分析和连锁分析等,描述了各技术的优缺点,给出了部分家系样本和群体样本的分析应用实例。
为了方便、稳定、准确地分析表达谱研究细胞中基因表达的复杂过程,本书主要阐述了实时定量聚合酶链反应技术,介绍了基因转移载体系统,讨论和描述几种基因转移、基因组修饰的策略,同时以哺乳动物细胞为例提供了两种基因表达的研究方法,每一种方法给出了详细的实验方案。基因工程的实验还可以阐释基因功能,其主要思想是操纵小鼠基因组,依赖基因敲除技术和基因转移技术,观测由于基因改变引起的表型结果变化来探索基因功能。但由于基因组数据的大量积累,很难用传统的实验手段研究单个蛋白功能来完成蛋白功能注释。全自动的功能预测方法已经阐述,这是生物信息学和计算生物学中研究较多的领域。本书描述了几种主流的预测策略,如序列同源性、系统发生关系、序列衍生出的化学和功能性质和蛋白质-蛋白质相互作用谱等,另外还简要概述了其他预测方法如蛋白质结构和文本挖掘等。
解码全基因组不仅是探索生命起源,研究生命体相互关系,更重要的意义还是在于预防和治疗疾病。本书最后介绍了构建AAV特洛伊木马进行基因治疗的常规策略,这将会使疾病的治疗更直观更有效。基因疗法受到广泛生命科学界的关注,如果引起疾病的根本是基因组的变异,那么通过调节一个或多个特定基因的表达或者阻断一个或多个基因产物就能控制疾病,也就是说,基因治疗为什么不能代替传统的治疗。