基因组所成功构建“脊椎动物进化分支共调控基因数据库”
近日,中国科学院北京基因组研究所基因组科学与信息重点实验室,成功构建“脊椎动物进化分支共调控基因数据库”,该研究成果在《Evolutionary Bioinformatics》杂志发表。
脊椎动物,尤其是哺乳动物,其基因组的序列特征和基因位置关系具有良好的共线性关系,这些复杂且动态的基因排列和染色体结构对于维持体形发育和细胞分化具有重要意义。但其中几个基本问题却一直困扰着科研人员,如:不同进化分支物种(灵长目、啮齿目、食肉目和偶蹄目等)基因组的保守和变异的基因聚类的最小单位是什么?这些基因聚类与核小体定位和染色体折叠的关系?这些基因的聚集是随机的还是有所偏好的?哪些是随机的,哪些是功能相关的?
基于以上科学问题,在中科院北京基因组研究所副所长、基因组科学与信息重点实验室主任于军研究员的指导下,王大鹏博士、张宇宾和樊中华所在小组收集了广泛范围物种的基因组注释信息,包括哺乳动物、鸟类、爬行类、两栖类和鱼类,并且选择有代表性的昆虫、线虫和真菌作为外群。研究以人类基因组为参照,将其它各物种的基因组以同源基因为原则,以保守的两个“核心基因”为单位(保持转录方向保守的“头对头”、“尾对尾”或者“头对尾”)对应到人类基因组上。并且提供了多种研究共调控机制的工具,如共进化、共表达、基因功能富集和启动子分析等模块。
该数据库及相关工具的构建,为解析具体一个基因或者几个基因在不同进化树分支内保守性和分支间变异性相关的基因复制、丢失、插入、倒位以及染色体水平的多倍化等基因组变异事件提供了有力的支持。
全文请参见:http://la-press.com/article.php?article_id=2956
LCGbase数据库结构和构建流程
附件下载: