近日,由基因组所开发的国际上首个动植物基因组变异-表型关联知识库(GWAS Atlas)正式上线发表,该项研究成果以“GWAS Atlas: a curated resource of genome-wide variant-trait associations in plants and animals”为题在国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。
全基因组关联分析(GWAS),即指在全基因组范围内找出存在的序列变异,从中筛选出与疾病、表型性状等相关联的遗传位点,是挖掘生物复杂性状遗传基础的关键技术。随着高通量测序技术的快速发展,多个物种产生了越来越多的高质量基因型数据,并已解析了与许多动植物复杂性状相关联的遗传位点。但这些知识信息都分散在不同文献中,不利于知识整合、挖掘与再利用。为此国家基因组科学数据中心的科研人员通过关键词检索、人工审编、词条比对注释等技术手段,结构化整理了现有主要农作物和畜牧动物的基因型-表型关联知识,开发了世界上首个动植物基因组变异-表型关联知识库GWAS Atlas。
GWAS Atlas知识库整合了9个物种(包括棉花、梅花、玉米、油菜籽、水稻、高粱、大豆7种植物和山羊、猪两种动物)与614个性状关联的75467条基因型-表型(G2P)信息,并通过语义比对等映射到五个不同的性状本体上(植物性状本体PTO,家畜性状本体ATOL,作物本体CO等),方便用户通过基于本体的层级结构来查找感兴趣的性状及对应的G2P关联信息。此外,研究人员还分析并定义了与多个性状相关联的多效基因及遗传位点,支持用户通过不同模块在线浏览、检索与下载。
GWAS Atlas作为首个综合多物种的变异-性状关联知识库,是全基因组变异信息数据库(GVM)的延伸,将为未来重要农艺性状的模块化遗传研究和育种应用提供重要资源和平台。该研究得到了中国科学院战略性先导科技专项、中国科学院国际大科学计划等项目基金的资助。
论文链接
GWAS Atlas 资源信息统计