近日,中科院北京基因组研究所生命与健康大数据中心开发了国际上第一个全基因组核小体定位图谱数据库——NucMap(Nucleosome positioning map)。该数据库在研究所高性能计算平台和大数据存储平台的支撑下,基于人工审编整合了大量全基因组核小体测序数据,识别多物种不同条件下的核小体定位图谱,并提供相关的RNA-seq、DNA甲基化、组蛋白修饰、转录因子 ChIP-seq数据信息。研究成果以“NucMap: a database of genome-wide nucleosome positioning map across species”为题在国际学术期刊Nucleic Acids Research在线发表。
核小体是真核生物中DNA包装的基本单元,由一段围绕八个组蛋白核心序列缠绕的DNA组成。已有研究发现核小体在染色体上并非均匀分布。核小体位置会影响转录起始和延伸,进而通过控制转录因子结合位点的活性来影响基因活性。随着近年来关于核小体定位研究的不断增加,在不同物种中产出了大量的全基因组核小体测序数据,然而,目前世界范围内仍缺少一个全面有效的核小体定位图谱资源平台。NucMap数据库的开发完成,填补了这一空白。
NucMap整合从酵母到人类的15个物种的477个样本中798个全基因组核小体测序数据,包含搜索、浏览、分析和下载等主要功能模块。数据库提供的样本搜索功能帮助用户查找特定的样本并查看样本的Meta信息及相关的其他组学数据信息,基因搜索功能则有助于用户查看指定基因相关的核小体定位信息。NucMap整合JBrowser浏览器,帮助用户快速浏览样本的核小体定位图谱和上传其他相关组学数据进行多组学图谱比较。数据库中的分析模块能够对核小体定位模式进行全局分析,绘制核小体占据谱。NucMap提供所有数据的直接下载。
NucMap是跨物种核小体定位数据的第一个开放资源平台。作为大数据中心的重要数据库资源之一,NucMap将不断收集和整合已发布的核小体定位数据。为深入了解染色质生物学特征,未来NucMap将与MethBank,Cistrome和ENCODE等其他公共表观基因组学数据库兼容。基于对跨组学数据的综合分析,有助于生物学家了解染色质调控的更多信息。
该研究得到了国家重点研发项目、国家发改委项目、国家自然科学基金等基金的资助。
论文链接
数据库链接