北京基因组所(国家生物信息中心)发布全转录组关联研究知识库TWAS Atlas
近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(NGDC)开发的全转录组关联研究知识库正式上线。该研究成果以“TWAS Atlas: a curated knowledgebase of transcriptome-wide association studies”为题在国际学术期刊Nucleic Acids Research 在线发表。
全转录组关联研究(Transcriptome-Wide Association Study, TWAS)技术的兴起为探索人类复杂性状或疾病相关的关键基因提供了有效手段。近年来,国内外大规模TWAS研究陆续开展,相关数据也呈现逐年增长趋势,亟需相应的标准化整合、挖掘及可视化分析。为应对这一需求,国家基因组科学数据中心开发了TWAS Atlas知识库系统,为基因-性状关联知识的创建和挖掘提供重要参考。
TWAS Atlas为用户提供多渠道的数据浏览、检索和下载功能。目前,TWAS Atlas 1.0版本共计整合来自200篇TWAS研究的分析数据,通过人工审编获得401,266条高质量的人类基因-性状关联条目,涉及257种性状,22,247个基因及135种组织类型,并同步收集了研究相关元数据和注释信息。此外,通过系统整合基因-性状关联信息与来自GTEx数据库的SNP-基因关联信息,数据库从头构建了一个综合性的交互式SNP-基因-性状关联知识图谱,实现了多疾病、多组织、多组学层次关联调控关系的在线解析和可视化,可为相关研究人员的个性化研究提供可靠参考和有益信息。
中国科学院北京基因组研究所(国家生物信息中心)博士研究生路明明、特别研究助理张亚东、中国医学科学院医学信息研究所杨丰春、北京基因组研究所(国家生物信息中心)硕士研究生麦嘉琳为本文共同第一作者,中国医学科学院医学信息研究所李姣、北京基因组研究所(国家生物信息中心)曾瀞瑶助理研究员和肖景发研究员为共同通讯作者。本研究得到中科院战略性先导科技专项、国家自然科学基金、国家重点研发计划、中科院青促会等项目资助。
TWAS Atlas关联知识图谱分析示例(分别以上皮性卵巢癌(A)、上皮癌卵巢癌相关基因MAPT(B)及上皮性卵巢癌与帕金森病共享基因(C)为中心)