新华社北京3月8日电(记者余晓洁)政府工作报告提出,国家科技投入要向民生领域倾斜。全国政协委员、中国科学院北京基因组研究所所长薛勇彪8日表示,生命健康大数据是关系到国家人口健康和生物安全的重要基础资源。当前亟待加快建设国家级共享平台,存好、管好、用好生命健康大数据。
有效利用生命健康大数据有助于推动精准医学研究,催生医疗模式变革。“随着健康中国战略的实施和健康医疗技术的不断发展,生命健康领域数据迎来爆发式增长,预计今后五年我国将产生300PB以上的基因组数据。”薛勇彪说。
薛勇彪调研分析发现,我国生命健康数据面临两大“痛点”。一是流失严重。国际学术期刊通常要求论文递交者把发表的数据在学界认可的数据库公开。由于国内缺乏生命健康大数据管理公共平台,我国学者大部分的数据都只能递交到美国NCBI和英国EBI等国际知名数据库。据估计,NCBI数据库中30%以上的数据来自中国。二是“孤岛”现象严重,利用效率低。由于缺乏管理共享机制,宝贵的生命健康数据分散“沉睡”在实验室和机构内形成数据“孤岛”,严重制约我国生物大数据的转化应用。
“生命健康大数据是现代生命科学产生新知识、提出新假说、开发新应用的引擎,是支撑我国‘健康中国’战略的重要基础性战略资源。”薛勇彪呼吁,加快建立国家级生命健康大数据共享平台。
薛勇彪认为,这个共享平台应面向我国人口健康和经济社会发展的重大战略需求,通过多元主动的数据收集新方法、互利共赢的数据共享新机制、高效智能的数据解析新技术,建立生命健康大数据的汇交、管理、共享、应用体系,维护数据主权、保障数据安全和加速数据应用,服务科研院所、高校、医院、企业和广大人民群众,为我国经济社会发展和人民生活改善做出重大贡献。