近期,由基因组所开发的长非编码RNA研究领域特色数据库LncRNAWiki被国际RNA数据库联盟(RNAcentral)收录。近些年长非编码RNA成为国际研究的新热点,与人类癌症、神经系统等疾病发生密切相关,在疾病诊疗方面表现出了潜在的重大应用价值。长非编码RNA的数量与种类均快速地增长,大量相关研究不断丰富着我们对长非编码RNA功能与作用机制的认识。与此同时,长非编码RNA相关的数据库也在不断增长。2014年,基因组所生命与健康大数据中心章张研究员带领的科研团队采用Wiki技术开发了基于群体审编(Community Curation)的人类长非编码RNA知识库LncRNAWiki,该知识库作为一个信息丰富的人类长非编码RNA知识库受到了国际RNA联盟(RNAcentral)的关注,相关研究人员也将应邀参加由其举办的年度联盟会议。
LncRNAWiki整合了来自于Gencode、LNCipedia、NONCODE、lncRNAdb的十万多条人类长非编码RNA序列及信息,并根据基因组位置对长非编码RNA进行分类。利用Wiki系统的优势,建立多人协同注释的结构与模式,根据参与人员的编辑数量与质量,对参与人员的贡献进行量化打分,且根据分值大小给予作者身份,以此促进长非编码RNA研究领域科研人员共同完善LncRNAWiki的相关信息和数据更新。相关成果于2014年11月在国际生物信息学领域期刊《Nucleic Acids Research》在线发表后,该研究团队继续重点收集了有文献报道的人类长非编码RNA,并进行了人工编辑与注释。目前LncRNAWiki共收录719个文献报道的人类长非编码RNA,其中290个与癌症等疾病相关,同时还开发了相应的算法对长非编码RNA编码的小蛋白或短肽进行预测,共获得九千多个潜在的由长非编码RNA编码的小蛋白或短肽。
LncRNAWiki的后续工作仍将重点解析已知的人类长非编码RNA,确保有功能报道的人类长非编码RNA的及时收集与注释。基于实验证据深入研究与解析长非编码RNA的功能与作用机制,同时对长非编码RNA的序列特征进行深度挖掘及注释。随着该项工作的不断深入与完善,将对科研人员更加全面的研究和掌握疾病发生发展的机制机理打下坚实基础。
数据库链接:http://lncrna.big.ac.cn
RNAcentral链接:http://rnacentral.org/