《基因组蛋白质组与生物信息学报》2010年第1期内容推介
分子进化计算软件KaKs_Calculator 2.0
在分子进化中,Ka (nonsynonymous substitution rate)和Ks (synonymous substitution rate)作为评估不同进化距离物种的直系同源基因之间或者同一物种内的旁系同源基因之间选择压力的基本进化动力学参数,对于理解DNA序列水平的进化分歧和达尔文自然选择的作用具有重要意义。随着测序技术水平的提高和海量基因组数据的产出,基因组进化分析对计算方法和软件也提出了新的要求。
在中国科学院北京基因组研究所基因组科学与信息重点实验室于军研究员的指导下,博士生王大鹏、张宇宾等所在小组于近期升级开发了评估分子序列水平选择压力的软件——KaKs_Calculator 2.0。这次升级是在1.0版本的基础上进行的扩展与完善,整体上采取“工具箱”的策略,分别由核心模块和扩展模块整合而成。
核心模块侧重于同源序列的Ka和Ks值的评估。它在原有的7种计数方法、1种极大似然方法和2种基于模型选择和模型平均的方法的基础之上,增加了7种gamma系列新方法。这些方法分别在原有的核酸替代模型的基础上引入了序列不同位点原始突变率的变异参数,并且已被证明在特定情况下会比原有方法具有更加精确的评估值。新版本总共有17种选择压力(非同义替代率和同义替代率)的计算方法,可以广泛应用于不同亲缘关系物种间的进化动力学研究;同时,可以通过比较来评估基于不同模型的各种方法在计算进化生物学中的性能和各种进化参数的引进对解决具体生物学问题带来的不同影响。
扩展模块着力于解决序列正选择位点的检测问题。编码DNA序列的绝大部分位点由于功能约束而趋于保守,选择压力会随位点发生变化,基于整个基因的Ka/Ks计算对于检测受到适应性选择的位点是不够的。我们采用移动窗口的策略,通过计算窗口范围内序列承受的选择压力来检测正选择信号;需要特别指出的是,用户可以设定窗口大小和位移步长,灵活选择适合于特定同源基因集合的预设参数。
该软件由C++,java和R语言撰写,可以同时读入存于单个文件的大规模的数据进行批量处理,并可在Windows和Linux两个平台上运行。下载网址:https://sourceforge.net/projects/kakscalculator2/.
文章全文发表在《基因组蛋白质组与生物信息学报》2010年第1期,网上全文可在Elsevier出版集团的ScienceDirect数据库(www.sciencedirect.com/science/journal/16720229)浏览下载。
磁珠微卫星富集文库的构建
微卫星由于分布广泛,具有丰富的多态性、共显性等特点而被广泛应用于分子遗传学、法医学、生态学等各个领域,因此对于微卫星位点的识别是各学科研究的迫切需要。在中国科学院北京基因组研究所基因组科学与信息重点实验室胡松年研究员的指导下,博士生耿佳宁、李克欣等开发了一种利用构建磁珠富集文库来获取新物种或者稀有物种的微卫星位点的方法。
本文构建的磁珠富集文库方法具有高效富集微卫星DNA的作用,我们在传统的富集方法的基础上做了一些改进,具体改进和方法的优缺点如下:
首先,用超声破碎基因组DNA是本方法的一个主要的改进。传统富集文库的构建常用酶切的方法得到基因组DNA片段,其片段长度依赖于基因组DNA的G+C含量和酶切位点的分布,因而得到的片段有偏向性,而且在基因组上分布也不均匀。当然,也有一些研究者注意到这个问题,并且提出了用多种内切酶共同切割基因组DNA的方法。此方法可以产生比较理想的片段,得到足够的侧翼序列来设计引物,但是如果用多酶切会产生不是平端的酶切产物,产物需要进行末端补平。而且这个方法可以产生多拷贝的一些片段,克隆后有很大一部分克隆含有相同的插入片段,因此减少了有用的微卫星位点的数量。而本文采用超声的方法可以克服酶切方法的这些不足,还可以根据实验需要的DNA片段大小选择超声的条件,并且用超声的方法可以节省时间,对温度也没有特定要求,且由于是随机切割,不会完全损害某一类微卫星。只要控制一定的功率和时间,片段大小就基本确定,不需要进行预实验。
杂交是本方法改进的另一个步骤。本文的方法用了二次杂交,第二次的杂交温度比第一次提高了2-3度。采用严格的二次杂交,可以去除第一次杂交中的非特异DNA片段,明显提高了阳性克隆率。在文库构建过程中,杂交、亲和捕捉得到单链DNA之后进行了一次PCR, 而且对PCR的循环数也做了严格的预实验,挑选合适的循环数,这样就避免PCR扩增改变基因组本身的微卫星位点的含量和各种类型微卫星之间的比例关系。这些改进使得我们能够高效、快速构建出稳定性好的微卫星富集文库。
通过构建微卫星富集文库和对微卫星位点多态性验证,最终筛选出高原鼠兔的13对多态性信息含量较高的微卫星位点。同样,也得到了中国地鼠16对高度多态的微卫星位点。分析结果表明我们建立的富集文库流程能找到用于遗传学、生态学等领域的多态性微卫星标记,并且可以通过多态性分析软件进行后续的种群遗传学和生态学分析。
当然我们建立的磁珠富集文库的方法也有缺点,这个方法容易破碎AT区域,而且在我们构建的几个文库中没有找到GC重复的微卫星位点。造成GC位点不容易得到的原因可能是我们杂交的温度没有调整好或者是GC区域存在着二级结构,所以我们的方法有待进一步完善。
文章全文发表在《基因组蛋白质组与生物信息学报》2010年第1期,网上全文可在Elsevier出版集团的ScienceDirect数据库(www.sciencedirect.com/science/journal/16720229)浏览下载。