基因组所生物信息高性能计算机正式投入使用

随着中科院北京基因组研究所第二代测序仪陆续投入使用,海量的数据日益产出,原有基因组所的计算能力和数据存储能力已经远远不能满足新的需求,为此,2008年10月基因组所启动了采购计划。2009年2月下旬,基因组所生物信息高性能计算机到位,经过紧张的安装调试,已正式投入使用。这次选用的浪潮服务器,属于国产自主品牌高性能计算系统,其运算分析能力达到每秒10万亿次,数据存储能力达到400TB,随着高性能计算系统的投入使用,加之2008年,3台SOLiDTM系统基因分析仪的安装运行,基因组所在硬件环境系统实施了更新换代,全力搭建的基因组测序和生物信息处理平台初步完成。

   基因组学是当今世界上发展最快的学科之一,作为基础科学研究,对于先进的科学仪器的要求尤为突出,科学仪器和技术方法的突破往往是重大科学原始创新的先导,高通量测序仪和高性能的生物信息处理器是基因组学研究的重要工具和手段,进入21世纪,伴随着生命科学的飞速进展,科学仪器每年都在发生具有革命性的变化。

   2月6日,随着大型计算机的到位,基因组所的工作人员开始紧锣密鼓的设计与安装系统,初步完成了计算集群硬件和软件的安装,目前已经进入整个系统测试和调优阶段,该大型计算机计划在2月底将全部投入使用。此次到位的高性能集群式服务器主要采用了浪潮的刀片服务器以及存储,分为计算节点和存储节点两部分:计算部分采用12台刀片中心,配置了112片刀片,每颗刀片配置了两颗2.83G Intel Xeon 5440 CPU,有92片配置了16GB 内存,20片配置了32GB内存并配置了infiniband 高速交换网络,总体的运算速度达到10万亿次/秒。存储部分采用9套48 TB的盘阵,达到432 TB的总容量,满足海量生物数据存储的需求。网络部分集中了万兆、千兆、Infiniband、FC等多种网络环境搭建而成。系统将集群监控软件、生物信息软件、数据库等集成,构成高性能生物信息专用集群系统。

   2008年引进的SOLiDTM (Sequencing by Oligonucleotide Ligation and Detection)的高通量测序系统。其每轮运行可以产生超过30亿碱基(相当于一个人类基因组全序列)的可定位数据。可对多种菌株进行极高覆盖度的测序分析;能够对包括特殊疾病或者药物表型等在内的完整基因进行精确的序列分析;也能用于高通量的基因表达研究,而其成本和时间消耗大大低于传统测序技术。特别是在开展靶基因重测序研究、基因表达分析、MicroRNA(非编码小分子RNA)的发现、染色质免疫共沉淀研究以及其它物种全基因组序列测定等相关研究方面将给予强大的支持。

   基因组所作为北郊生命科学园区的核心团队成员,将充分发挥高通量测序仪和高性能生物信息处理系统平台的作用,积极开展与兄弟院所广泛的交流和科研项目合作。建立信息沟通和共享机制,建立科研技术人员的交流平台,努力营造开放、共享的实验研究环境。目前,基因组所的高通量测序仪和高性能生物信息处理计算机已经被列入北京生命科学大型仪器共享系统,实施平台资源共享。

附件下载: