《高通量核酸序列比对分析专用机开发》项目现场测试会在基因组所召开
——迈出海量生物数据的绿色计算之路
11月8日,由中科院北京基因组研究所承担的中科院仪器设备功能开发技术创新项目——《高通量核酸序列比对分析专用机开发》现场测试会在基因组所召开。自动化所王宇心高级工程师、植物所郭亚龙研究员和遗传发育所梁承志研究员组成专家测试组,在区域中心杜承航博士的全程指导监督下,对该项目专用机进行了全程测试、分析和验收。基因组所副所长李俊雄、研究员吕雪梅、所级中心凌少平等出席测试会并进行现场测试。
会上,李俊雄首先向专家组成员介绍了该项目的相关背景及整体情况,并对各位专家评委的到来表示欢迎。凌少平对项目进度、项目优势等作了简要介绍,并带领研发小组完成全部测试工作。经过将近三小时的测试和评审,专家测试组不仅认证了该仪器的性能,还高度评价了基因组所研发团队的合作及攻关精神,而且呼吁应对具有自主知识产权的技术研发给予大力支持。
随着基因组高通量测序技术的飞速发展,生物数据量的不断激增,海量生物数据分析在生物医学领域面临着前所未有的挑战。运用已有算法已很难满足现有速度要求,并成为阻碍基因组学发展和应用的技术瓶颈;另一方面,很多软件算法对计算网络存储需求量大且能耗较高,计算资源耗资巨大。目前以CPU 为核心的计算构架提升空间有限,亟需探索新的绿色计算策略。针对这一问题,中科院北京基因组研究所于2010年,由院“引进杰出技术人才”吕雪梅研究员牵头、联合研究所所级中心生物信息分析部凌少平等重测序小组骨干成员组成研发团队,与中科院软件所合作,开展海量生物数据的绿色计算研发。该项目得到基因组所高度重视和经费支持,并获得了中国科学院仪器设备功能开发技术创新项目的资助。经过两年多的攻关和努力,项目取得阶段性成果。
此次研发的高通量核酸序列比对分析专用机(CASmap)支持高通量测序各种数据应用类型(基因组、外显子组和转录组)并具有丰富的参数设置。测试数据显示一台CASmap能满足~200Gbp/天的数据比对处理,是目前最快且功能完备的高精度、低能耗的序列比对系统。CASmap的产生表明中科院北京基因组所在仪器设备功能开发技术上又迈进了一大步,正如李俊雄副所长指出:CASmap对基因组研究和个体化医疗的发展都有着深远意义。
李俊雄副所长讲话
高通量核酸序列比对分析专用机(CASmap)
测试现场
专家评审