近日,基因组所所级中心基因组平台三代单分子实时测序PacBio完成技术升级优化,实现了数据产量和读长的双重提升,一个SMRT Cell芯片可产出高达1Gb数据, reads平均长度达到14kb,N50超过19kb,为基因组学相关研究提供了有力支撑。
PacBio 测序read和subread长度分布
利用三代单分子实时测序仪PacBio系统,平台提供的技术支撑服务包括:
1.基因组de novo测序组装
PacBio测序read超长的特点,适合于基因组de novo组装。例如一个5Mb大小的细菌基因组,只需一个SMRT Cell测序即可完成基因组finish,周期小于5天。对于复杂基因组,预期Contig N50超过100kb,推荐de novo组装需50ⅹ以上的PacBio测序覆盖,二代测序数据和PacBio测序数据混合组装,推荐30ⅹ以上的PacBio测序覆盖,如用于基因组scaffold构建,推荐10ⅹ以上的PacBio测序覆盖。
2.全长转录本测序
受传统测序技术短读长的限制,较难获得全长转录本序列。在PacBio测序平台上,我们开发了全长cDNA测序和分析技术流程。PacBio测序产生的read长度远大于绝大部分cDNA长度,因此无需经过后续序列拼接组装,即可获得准确全长cDNA序列,分析基因转录后可变剪切信息以及LncRNA表达等。
3.碱基修饰检测
PacBio测序另一个优势是可获得DNA聚合酶促反应的分子动力学数据,分析碱基修饰信息。因为碱基基团修饰后的位阻作用,DNA聚合酶在带有修饰碱基的核苷酸位置前后,表现出延滞效应,经计算分析得到IPD ratio差异,不同修饰的IPD ratio值不同,从而获取碱基修饰信息。目前测序比较准确的修饰类型是m6A,另外5mC、5hmC、4mC等修饰信息也可得到,但需要特殊的样品处理或数据处理。
此外,基于PacBio系统,平台还提供基因组BAC克隆混合测序、长扩增子测序、极端GC含量DNA测序等技术开发服务。