近日,中国科学院北京基因组研究所生命与健康大数据中心表观基因组数据库—Methbank升级版,以“MethBank 3.0: a database of DNA methylomes across a variety of species”为题在国际学术期刊Nucleic Acids Research在线发表。3.0版在原有基础上整合了多个物种的数百个高质量DNA甲基化组并为用户在线浏览、查询与可视化甲基化数据信息提供了友好的界面。
DNA甲基化作为表观修饰的重要组成部分,在人类疾病与衰老、动物胚胎发育以及植物生长发育过程都起着重要作用。Methbank 3.0整合了大量DNA甲基化数据,对系统探索DNA甲基化特征具有重要意义。Methbank 3.0收录了4,577个健康人外周血样本的450K芯片数据,编审成34个不同年龄组的参比甲基化组(consensus reference methylomes,CRMs),并提供了不同年龄组健康人基因组胞嘧啶位点甲基化水平的分布范围,整合了5个重要经济作物(水稻、大豆、木薯、菜豆和番茄)不同发育阶段多个组织的336个单碱基精度甲基化组(single-base resolution methylomes,STMs)和两个模式动物(斑马鱼和小鼠)的配子与早期胚胎发育的18个单碱基精度甲基化组。相比于之前版本,MethBank 3.0进行了更加详细、系统的注释与分析,识别了692个年龄相关甲基化位点、2,371个与年龄无关的位点、304,886个差异甲基化启动子(DMPs)、53,680个年龄特异的甲基化位点(age-specific DMCs)、1,716个年龄特异的甲基化区域(age-specific DMRs)以及693,825个甲基化的CpG岛。此外数据库还提供了两个分析工具(Age Predictor和IDMP)分别用于预测人的甲基化年龄和识别差异甲基化启动子。
Methbank 3.0配备了友好的浏览、查询与可视化功能,用户可通过基因ID/symbol、基因组位置等检索甲基化信息,浏览指定物种差异甲基化启动子或高甲基化CpG岛,通过ftp下载所有相关注释数据与分析结果。
该研究得到了中国科学院战略性先导科技专项、中国科学院国际合作计划、国家科技攻关计划、国家863计划等项目基金的资助。
论文链接