北京基因组所(国家生物信息中心)发布脑疾病知识库BrainBase
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的脑疾病知识库BrainBase正式上线。该研究成果以“BrainBase: a curated knowledgebase for brain diseases”为题在国际学术期刊Nucleic Acids Research在线发表。
脑是人体的神经系统中枢,也是最复杂的人体器官,不仅控制思想、记忆、语言、运动,也调节许多其它器官的功能。脑神经元、胶质细胞或脊髓病变会引发脑疾病,如阿尔兹海默症、胶质瘤、帕金森综合征、抑郁症等,严重威胁人类生命健康。国内外已开展实施多项“脑研究计划”,如中国“脑科学与类脑研究”、美国“BRAIN Initiative”、欧盟“Human Brain Project”等,旨在加深人类对脑疾病、结构和功能的理解,加速在脑健康、类脑计算及智能技术方面的应用。
为促进脑疾病知识整合、组学数据挖掘与再利用,国家生物信息中心研究团队开发BrainBase知识库,致力于提供脑疾病-基因关联知识及药物-基因互作信息,鉴定脑“特异”表达基因,挖掘胶质瘤的特征基因并提供多组学数据可视化图谱,为揭示脑疾病的发生发展机制提供重要的数据资源。基于2,768篇已发表文章的文献审编和公共数据库的信息提取,整合了123种脑疾病的7,175条疾病-基因关联信息,2,118种药物/化合物与623个基因的16,591条药物-靶点互作信息,鉴定了在脑组织、脑区域、脑脊液、脑细胞水平上的“特异”表达基因。此外,考虑到胶质瘤具有致死率高、预后差、复发率高等特点,BrainBase整合21套公开发表的胶质瘤多组学数据集,分析挖掘不同组学层面、胶质瘤类型、临床组别、生存差异的关联信息,提供多场景多维度的基因分子特征可视化图谱,鉴定4组具有重要临床指导意义的特征基因,并通过建立结构化审编模型和受控词表,对已发表的胶质瘤高质量文章进行了详细的多组学水平注释和描述。
BrainBase知识库提供检索、浏览、可视化等功能,方便用户通过不同脑疾病、基因进行检索和浏览,以模块化的结构突出不同研究主题,并以FTP下载形式提供所有相关注释信息与分析结果的开放共享,为脑疾病研究提供重要数据资源和共享平台。
北京基因组所(国家生物信息中心)特别研究助理(博士后)刘琳,博士研究生张阳及牛广艺为本文共同第一作者,马利娜副研究员与章张研究员为共同通讯作者。该研究得到了中科院战略性先导科技专项、国家重点研发计划、中科院青促会等项目资助。
BrainBase知识库主要内容