6月5日,科技部、财政部联合发布了《关于国家科技资源共享服务平台优化调整名单的通知》,公布了不同学科领域的20个国家科学数据中心。其中,“国家基因组科学数据中心”(以下简称国家中心)依托中国科学院北京基因组研究所建设,共建单位包括中国科学院上海生命科学研究院和中国科学院生物物理研究所。
国家中心是针对我国基因组数据“存管用”的实际需求以及“数据孤岛”、“数据主权”等重大问题而组建,围绕人、动物、植物、微生物等基因组数据,重点开展基因组科学数据管理,建立基因组数据资源体系与开放共享平台,开展数据服务、数据管理、数据挖掘、技术研发等工作,提供基因组科学数据统一存储、整合挖掘、共享应用的一站式数据服务。
北京基因组所在基因组科学数据领域具有良好的前期基础和雄厚实力,已建成具有一定国际影响力的生命与健康大数据中心,拥有中国科学院生命科学领域排名第一的生物大数据高性能计算环境,CPU计算能力超过150万亿次每秒,数据存储能力达到12PB;建成国内首个基因组数据汇交、管理与共享系统(GSA),保障我国数据主权和数据安全,支撑服务国家重点研发计划、国家自然科学基金、中科院战略先导专项等200多个科研项目的数据存储、管理和共享,为国内外130多家单位提供数据管理服务,支撑用户在近100家国际学术期刊发表重要研究成果,被国际领域同行评价为“国际主要生物数据中心”之一。
北京基因组所将根据相关管理办法要求,制定国家中心五年建设运行实施方案,进一步明确中心功能定位和目标任务,力争经过3-5年努力,切实解决我国基因组数据存管用难问题,建成汇聚PB级科学数据、服务万家机构、引领大数据技术创新的国际一流基因组科学数据中心。