国家生物信息中心发布甘蔗多组学整合数据平台
甘蔗(Saccharum spp.)是重要的经济作物,贡献了全球约80%的食糖和40%的乙醇产量,但因其基因组高度复杂(多倍体、高杂合性及非整倍体),且遗传背景狭窄,严重制约了基因功能解析与育种发展。近年来,甘蔗遗传学研究取得显著进展,亟需一个整合多维组学数据的资源平台,支撑提高其科研与育种应用的效率。
2025年8月,国家生物信息中心发布甘蔗多组学数据整合资源平台SugarcaneOmics,旨在为全球甘蔗研究者提供一站式多组学数据查询、分析与可视化服务,支撑甘蔗功能基因组学研究及分子育种,助力开启甘蔗"组学驱动育种"新时代。该研究成果以"SugarcaneOmics: An integrative multi-omics platform for sugarcane research"为题在Plant Communications 期刊在线发表。
SugarcaneOmics平台突破传统单组学分析壁垒,整合了甘蔗及其近缘属种的基因组、转录组、变异组、特征基因、种质资源等五大核心数据模块。在基因组模块,汇集了包括甘蔗、蔗茅、芒及高粱在内的多个物种染色体级别的基因组组装,并提供了全面的基因功能注释和泛基因组结果查询。在转录组模块,该平台基于标准化的转录组定量流程,刻画了1256个甘蔗样本(涵盖14种组织和6个发育阶段)的全景式基因表达图谱,首次实现甘蔗全生育期基因调控网络的系统性解码。用户可检索目标基因在不同组织、发育时期及多种种质群体中的表达模式,获取不同处理条件下的差异表达信息。在变异组模块,SugarcaneOmics 鉴定了来自322份甘蔗种质的大约1.45亿个单核苷酸多态性(SNPs)和3000万个短插入/缺失(InDels),构建了目前为止全球最大的甘蔗群体遗传变异图谱库,并支持选择清除信号的可视化,为破解甘蔗复杂种群动态历史和驯化育种背景难题提供关键支持。特征基因模块,则系统注释了甘蔗转录因子家族,并通过文献审编和比较基因组学方法鉴定了参与关键农艺性状调控网络的候选功能基因,为甘蔗基因功能研究提供线索。在种质资源模块,平台还整合了1096 份甘蔗种质的育种信息和基本统计数据,以支持种质筛选。
此外,SugarcaneOmics 还搭载 CRISPR脱靶预测、引物设计、蛋白互作网络分析、BLAST、序列提取、基因组浏览器和GO/KEGG富集分析等七大高效易用的在线工具,显著提升了数据挖掘与功能研究的效率,为甘蔗“两高三抗”育种目标提供候选基因筛选和育种靶点筛查能力。该平台通过一体化、交互式的多组学数据与工具集成,预期能为甘蔗遗传学及育种研究提供基础数据支撑和全新的观察视角。
国家生物信息中心数据资源部工程师罗洪、白雪及硕士研究生吴子珊为本文共同第一作者,田东梅高级工程师和宋述慧研究员为共同通讯作者。“优质甘蔗新品种培育”先导专项总工程师、中国科学院微生物研究所张杰研究员对文章提供了指导和建议。该研究得到了中国科学院前瞻战略科技先导专项等资助。
SugarcaneOmics数据模块及在线工具概览