“领雁金奖”获得者章张:建立生物大数据中心
2018年7月,炎夏初至,蝉鸣骤起,牛广艺完成了她在Nucleic Acids Research 杂志的投稿。同年,牛广艺所在的中国科学院北京基因组研究所共在该杂志发表7篇重要研究成果,在这张优异的成绩单中,有4篇是在牛广艺师从的章张老师带领下完成的。
章张,曾在美国耶鲁大学从事博士后研究、在沙特阿卜杜拉国王科技大学担任研究科学家,是首位入选国际生物审编学会执行委员会的中国学者,丰富的海外科研经历让章张成为他人口中“年轻有为”的代表。2011年,章张通过中科院海外优秀人才引进计划回到祖国,现为国家基因组科学数据中心副主任、中国科学院大学岗位教授。
回国伊始,刚好赶上国家开始重视生物大数据的阶段,在个人兴趣和国家需要的双重动力作用下,章张和生物大数据这一领域结下了不解之缘。“生物大数据的海量激增和人工智能的快速发展,使得生物信息学领域正在发生着翻天覆地的变化”,拥有扎实的计算机学科基础的章张说道。
如今,围绕国家基因组科学数据中心和国家生物信息中心的建设工作已步入正轨,这其中,离不开章张及其团队坚持不懈的努力。“在生物大数据的海洋中乘风破浪”,既是章张回国几年的日常写照,也是我国生物信息领域不断发展的缩影。
赶上国际步伐
在世界上,被国际认可的生物信息中心有三个,分别是美国国家生物技术信息中心NCBI、欧洲生物信息研究所EBI和日本核酸数据库DDBJ,他们共同掌握着国际上主要的生物数据资源。上世纪90年代,我国的老一辈院士开始呼吁建设国家级的生物数据中心,直至今日,历经20年,这个愿望终于实现。
“提起生物大数据,也许很多人会感到陌生,它看不见、摸不到。但其实,生物大数据和石油一样,属于国家基础性战略资源,在生物学、医学甚至农学等学科都起着非常重要的作用。”章张提到,传统的生物学是观察型学科,随着人类基因组计划的完成,生命科学和医学将过渡到数据科学,所以在未来,生物医学领域的数据也会因此而呈爆炸式增长。“我们的地球上有近75亿人,每个人的生理状况各不相同,使用生物大数据,就能针对每个病人的具体情况给出最精准的治疗方案,或者在人们健康的时候,能提前预知身体可能出现的病变,为预防工作提供一个可靠的指导”。比如华为、腾讯等公司已开始使用生物大数据来观察人们的健康状态,例如判断病人是否患了肿瘤,通过基因组观察肿瘤患者的潜在特征,为疾病预防、诊断、预后等精准治疗提供分子依据等。
我国的生物大数据中心与国际相比起步较晚:2015年酝酿,2016年中国科学院北京基因组研究所成立“生命与健康大数据中心”,2019年,国家批准成立“国家基因组科学数据中心”和“国家生物信息中心”,这表明我国对生物大数据等领域的建设越来越重视。
建立生物大数据中心
说到生物大数据中心的成立,章张用了“一穷二白”和“摸索前行”两个词来形容。筹建前期,研究所里相关领域的几个课题组在不同的方向积极开拓,虽然建立了一些数据库,但还不够完善,却为以后的发展积攒了重要的经验和技术。2016年,才有了“生命与健康大数据中心”的诞生。
既然要做,就要做到最好。在生命与健康大数据中心成立初期,章张及其团队就将目标锁定为国际三大数据中心,开始了艰难“创业”。首先是梳理数据、查漏补缺,章张把每个课题组的前期基础进行了优化整合,从数据的不同层次、类型和角度把数据资源体系建立起来。之后,又采取“请进来、走出去”的方法,积极向国际三大数据中心学习,成立国际科学咨询委员会,邀请国际知名专家给予宝贵建议和意见,团队成员多次赴美国NCBI、欧洲EBI等多个机构学习交流经验,正如章张所说:“我们把口号喊出来了,就得拼尽全力。”
科研之路从来都不会是一帆风顺的。在生命科学领域发表文章时,按惯例需要把所有的数据提交到国际三大生物数据中心,但这些数据对于我国的科研工作者来说,是极其宝贵的资源。尤其是生物数据具有“海量”的特点:普通的电脑硬盘是1TB,1TB等于1024GB,一篇论文的数据可能就会有几十TB甚至上百TB之多。抛开复杂多变的国际形势不谈,一旦遭遇自然灾害等意外,就会严重影响到我国相关领域的科研进程。
比如在2006年,一场地震造成了太平洋海底光缆故障,导致了我国学者在一段时期内无法访问国外数据库的情况出现。“科学无国界,但科学家有祖国”。我国的学者一直希望把这些珍贵的研究成果和数据保留一份在国内,用于祖国建设和民生福祉。为此,在中心筹建伊始,章张团队就未雨绸缪,与各大期刊及学者沟通合作,把科学数据管理的本土化工作做到了前面,为我国数据安全管理和共享利用提供了有力保障。
是学者,亦是师者
2020年秋天,章张成为国科大“领雁金奖”的获得者,这既是对他身为一名“学者”,怀抱信念、学识扎实的肯定,也是对他作为一位“师者”,以身作则、仁爱仁心的认同。
谈到人才培养,章张娓娓道来:“我认为学生培养最重要的一条就是因材施教、因人而异,因为每个学生的学科背景和兴趣方向都不一样。每当招收新生时,我都会告诉他们,这几年你们在学业方面最重要的一个人就是我,所以一定要把个人诉求和想法告诉我,充分沟通后,我可以把实现的途径以及前景勾画出来,避免你们走太多弯路和错路。”
章张很愿意花更多时间去陪学生,和他们沟通科研问题、了解他们的学习生活。在章张眼中,判断一个人热爱的标准,是看他是否愿意为之付出时间。而用大量精力引导学生,就是章张爱学生最好的证明。
对于团队建设,章张认为一支队伍,最重要的就是团结和合作。章老师经常鼓励学生在完成自己课题的同时,多多参与组内其他课题的研究。“把自己项目做深,是深度;和其他项目合作,是广度。同时拥有两个维度的锻炼,对于学生来讲是大有好处的。”章张希望,从自己团队走出来的学生,在经历了双维度训练后,都能成为个人水平突出、协作能力优秀的全能型人才。
之所以说章张是才兼文武的“神仙”导师,是因为除了学术,章老师还是一位体育健将。工作之余,章张经常通过带学生踢球、爬山、散步等方式,来缓解大家科研方面的压力。刘琳是章张的博士研究生,然而,擅长学术研究的她对户外运动方面兴趣全无。“老师经常会带我们去奥林匹克公园散步,我是一个很宅的人,老师有时候看我太懒了,就会来我们办公室,‘抓’我们出去锻炼。”后来,章张在和另一位学生散步时,偶尔讨论出了一个新的课题方向,“这个消息让我们都特别振奋,这下都愿意和老师出去散步锻炼了,哈哈。”
“人生最巧妙的事情莫过于缘分”,刘琳回忆道,在一次西山秋游中,章张走到一处山坡,突然觉得似曾相识,赶紧掏出手机翻看,“章老师在手机里找到一张照片,是他2012年回国不久,带学生在这里春游拍下的,于是我们就在原处,按照原来的动作又留念了一张。”七年光阴,岁月流转,章张已褪去了初回国时青涩的外表,学生也培养了一批又一批,而不变的是对育人和科研的热爱与执着。
“北京有家烧烤叫柳叶刀,如果能在《柳叶刀》期刊发表一篇文章,就可以在那里免费吃一顿”,章张说道,“有时候学生发了文章,我就会带着他们去那里聚一聚,边吃边‘立志’。”这家饭店会根据发表论文的影响因子给予相应的折扣,虽然现在已经不提倡关注文章的影响因子,但师生间的乐趣在于科研压力之余的一期一会,和久违小聚时的一谈一笑。
人能尽其才则百事兴,如今,国家基因组科学数据中心在章张及其团队的努力下已初具规模,但由于我国在这方面起步较晚,要做的事情还有很多。对于未来,章张期望国家可以对生物信息学的作用给予持续的关注与支持,希望包括数学、计算机、物理、化学、医学等不同学科背景的人才,可以投身到生物信息学研究领域来。(原标题:章张:才兼文武的“神仙”导师 作者系国科大记者团成员)