北京基因组所(国家生物信息中心)发布热带作物组学数据库TCOD

  热带作物是热带农业的重要组成部分,具有资源稀缺性、功能多样性和广泛的市场需求,为全球热带农业生产国提供了相当可观的经济收入。测序技术的飞速发展推动了热带作物研究领域里程碑式的发展,积累了海量的多组学数据。然而,大量的数据分散在不同的数据中心或网站,给数据利用带来了不便。因此,亟需开发一个综合数据整合与共享平台,为研究人员提供良好的数据查找和在线分析服务。

  近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心赵文明研究团队与海南大学王文泉研究团队等合作开发的热带作物组学数据库(TCOD)正式上线。该研究成果以“TCOD: an integrated resource for tropical crops”为题在国际学术期刊Nucleic Acid Research 在线发表。

  TCOD整合了木薯、橡胶树、咖啡、可可、香蕉等15种热带作物的多组学数据,包括34个染色体级别的基因组序列、1,255,004个基因的功能注释、来源于2,048个全基因组重测序样本的282,436,992个变异位点、88个全转录组测序项目的基因表达谱以及13,381条种质描述信息,以基因为桥梁关联多种组学数据,为用户提供便捷的数据浏览、检索和下载等一站式服务。同时,TCOD还提供了不同物种基因组间的同源基因关系,支持根据基因功能、通路注释、基因组变异和基因表达等信息深入探索不同物种之间共有的生物学特征,促进跨物种研究开展。此外,为了方便用户开展数据挖掘,TCOD提供了一系列在线工具,具体包括序列相似性比较、下游引物设计、文献检索、基因通路富集、同源基因查找和基因组共线性可视化。

  随着育种4.0时代的到来和人工智能技术的兴起,TCOD集成多物种、多组学数据和在线工具,将为热带作物选择育种和性状改良研究提供支撑。

  中国科学院北京基因组研究所(国家生物信息中心)博士研究生康海龙、硕士研究生黄天昊和博士研究生段光亚为本文共同第一作者,赵文明正高级工程师和王文泉研究员为共同通讯作者。本工作得到了国家重点研发计划、中科院战略性先导科技专项和国家自然科学基金等项目的资助。

   TCOD数据库结构框架

  论文链接

附件下载: