美国爱荷华大学区健辉(Kin Fai Au)博士来基因组所交流访问
3月9日,美国爱荷华大学大学内科医学系和生物统计学系的区健辉(Kin Fai Au)博士,应Genomics, Proteomics & Bioinformatics (GPB)编辑部邀请,到基因组所进行学术访问交流,与基因组所胡松年、雷红星、陈非、孙英丽、张治华及张兵博士等进行了深入的交流与探讨,并在基因组所为相关科研人员做了题为“Hybrid-Seq, Gene Isoform Identification in hESCs, Gene Fusion Identification in Breast Cancer”的学术报告,胡松年博士主持了本次报告会。
区博士从第二代和第三代测序各自的优劣点入手,提出了Hybrid-Seq测序方法的独特优势:即利用三代测序产生的长片段低精度序列作为骨架,通过二代测序产生的短片段高精度序列进行校正,从而实现提高序列的精密度和基因组架构准确性的目标。为了解决具体操作中因为同聚体碱基个数判读错误率而引发的同源比对困难,区博士组巧妙地利用了同聚体压缩的方法(homopolymer compression),将来源相同的长短序列分别进行压缩,匹配,架构,再还原,从而节约了计算资源,确保了序列精确和架构准确(LSC软件)。以这种精确作业为基础,区博士开发的算法有助于鉴别基因组中的基因异构体(IDP软件)。
以人类胚胎干细胞(human embryonic stem cells)基因组为例,区博士通过降低可变剪切外显子连接区排列组合的自由度来构建可操作的剪切变体库,基于测序量,以先验概率为罚函数对未被发现的剪切变体进行预测。他们将开发的软件应用在预测人类胚胎干细胞的基因剪切变体工作中,在已知的剪切变体中有很好的捕获率,且给出的假阳性率比同类软件算法有非常显著的改善。这种改善将使接下来的实验室操作有极大的可操作性,因此具有重大意义。此外,得益于基因组的精确性,他们还发现了23个新基因,将在接下来的实验中进行验证。
区博士作报告并与科研人员互动
最后,区博士介绍了他们最近用IDP算法在基因组中融合基因研究的进展,并将之应用于乳腺癌的研究中以发现融合变体并确定融合位点(IDP-fusion软件)。
会后,区博士回答了来自学生和研究员们的提问,进行了积极地讨论。有近八十名学生老师参与了讲座,反响热烈。报告后区博士和多位PI进行座谈并参观我所基因组测序平台。
为进一步提升期刊国际影响力、促进本所科研人员与国际专家学者进行学术交流, GPB编辑部策划了“GPB杰出学者论坛”系列学术讲座活动。编辑部邀请领域内优秀学者来本所进行学术访问,为科研人员做学术报告并与PI进行一对一或多对一的当面交流,为日后的科研合作打下良好基础。GPB是由我所和遗传学会共同主办的开放获取的英文学术期刊。