基因组所开发“编码蛋白质DNA序列并行比对工具—ParaAT”

中国科学院北京基因组研究所基因组科学与信息重点实验室章张研究员,带领其团队成功开发“编码蛋白质DNA序列并行比对工具—ParaAT(Parallel Alignment and back-Translation)”,该研究成果发表在Biochemical and Biophysical Research Communications杂志。

 

同源序列比对是生物信息学普遍采用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,在比较基因组学、分子进化学、系统发育等领域具有重要的基础作用。为获取相应的比对结果,通常采用的方法是先比对后回译(back-translate),此方法比直接进行DNA序列比对更可靠、准确。然而,现有相关的工具每次只能处理一组同源序列,无法实现多组同源序列的比对工作。

 

鉴于传统工具所产生的弊端,基因组所科研人员采用并行计算(Parallel Computing)策略开发ParaAT,实现了多组同源编码蛋白质DNA序列的并行比对。经验证,ParaAT可大大降低运行时间,获得较好的并行加速比(speedup),因此,适合大规模、同源序列的比对工作。

 

ParaAT可在不同操作系统下运行,支持多种不同的输出格式,方便后续相关的生物信息学分析(诸如:用于检测自然选择压力的KaKs_Calculator)。

文章链接:http://dx.doi.org/10.1016/j.bbrc.2012.02.101

软件链接:http://cbb.big.ac.cn/software

 

附件下载: