国家生物信息中心发布首个泛癌单细胞转座子数据库TE-SCALE
近日,国家生物信息中心开发的首个人类泛癌单细胞转座子表达数据库TE-SCALE正式上线,并以“TE-SCALE: a comprehensive database for exploring transposable element expression across human cancers at single-cell resolution”为题在学术期刊Nucleic Acids Research在线发表。
转座子(Transposable elements, TEs)是人类基因组中广泛存在的可移动DNA序列。它们在正常组织中往往处于沉默状态,但在癌症中可以被异常激活,从而促进肿瘤的发生发展。近年来的多项研究表明,TEs的特异性表达已经成为癌症的重要标志,并有望成为免疫治疗的新型靶点。然而,由于其序列具有高度重复性,TEs常被排除在以基因为中心的主流单细胞分析之外,这限制了研究人员对肿瘤微环境中TE表达和调控机制的理解。
TE-SCALE是全球首个以单细胞分辨率探索TEs在人类癌症中表达模式的综合数据库。它涵盖了20种癌症类型、12种组织来源,共计330个样本,整合高质量细胞数超过130万个。TE-SCALE基于团队构建的scTEfinder流程,该流程兼容所有主流10x Genomics建库化学方法(包括3’ v1/v2/v3及5’)产生的scRNA-seq数据,稳健地量化了1051个TE亚家族的表达水平。TE-SCALE提供了用户友好交互式框架,支持从泛癌尺度到组织、个体样本乃至单细胞水平的多层级数据探索;同时提供了以TE为中心的浏览界面,用户可在多种生物学背景下获取每个TE亚家族的详细注释及其表达谱。在数据分析和可视化方面,TE-SCALE提供了包括差异TE表达、TE-基因共表达网络和功能富集分析在内的三个核心模块,支持灵活的浏览、搜索、分析和数据下载。TE-SCALE还鉴定出了383个肿瘤特异性TE亚家族,包括已报道和全新发现的元件。其中大多数在特定癌症类型或疾病状态下表现出高度特异性。这些TE在区分肿瘤细胞与正常细胞方面的性能可与经典癌症标志基因相媲美,为开发诊断生物标志物和临床免疫治疗靶点提供了重要候选。
总之,通过准确的TE定量、深入的单细胞分析和交互式多维度可视化框架,TE-SCALE为研究人员提供了一个用户友好的一体化平台,使用户能够从细胞机制与临床诊疗的双重角度,深入探究TEs在癌症中的重要功能。
国家生物信息中心硕士研究生孟熹霓、博士研究生聂致为本文共同第一作者,高级工程师曾瀞瑶、李国超副研究员和蒋岚研究员为共同通讯作者。肖景发研究员对本研究提供了关键的指导。本研究得到了国家自然科学基金、中科院战略性先导科技专项、中科院青年交叉团队等项目资助。

TE-SCALE结构及功能模块概览






