科学数据共享 让科技创新和经济发展比翼齐飞

2019年,科技部和有关部门立足前期工作基础,在高能物理、基因组、气象、地震、海洋等领域组建了20个国家科学数据中心。在实现数据共享、支撑科技创新、加强国际合作方面,这些数据中心成为了重要的基础设施和载体。

近日,高能同步辐射光源(HEPS)首台科研设备开始安装,国家高能物理科学数据中心为高能光源研究开发的科学数据管理服务系统也取得重要进展。科学数据管理服务系统的测试平台开始运行,实现了从数据获取、传输、分析、长期保存到成果发布的全生命周期的数据服务。

2019年,科技部和有关部门立足前期工作基础,在高能物理、基因组、气象、地震、海洋等领域组建了20个国家科学数据中心。在实现数据共享、支撑科技创新、加强国际合作方面,国家高能物理科学数据中心、国家对地观测科学数据中心、国家地球系统科学数据中心、国家海洋科学数据中心、国家冰川冻土沙漠科学数据中心等成为了重要的基础设施和载体。

工作前移打通数据共享堵点

科学数据共享是我国国家科技创新体系建设的重要内容,也是大数据时代科技创新和经济社会发展的重要基础。

在高能物理领域,大部分项目涉及国家重大科技基础设施及大型实验。这些项目往往周期很长,并且数据量巨大,需要进行大规模的数据共享传输和数据处理。

国家高能物理科学数据中心在项目建设之初就开始参与数据产生、数据处理、数据汇交与共享、软件工具等方面的设计和规划,与科学家(数据生产者和数据用户)共同协商确定数据的格式、存储访问模式以及数据长期保存的策略、数据共享的机制等,同时根据数据使用特点设计和建立数据处理所需的计算资源平台以及数据传输共享所需的高速网络链路。工作的前移,确保了科学项目从一开始就将数据生产、数据汇交和数据服务形成一个整体。

2019年度,国家高能物理科学数据中心在专家委员会指导下,组织高能物理领域相关学科专家,对比国际相关数据中心的发展方向,根据国内高能物理领域实验装置特性,评估并建设国家高能物理科学数据中的数据资源目录体系。数据资源包含了高能物理数据、中子科学数据、光子科学数据、天体物理数据4个主要部分。根据合作组研究统计,国家高能物理科学数据中心直接或间接服务科研机构和团队来自74个国家,超过1000家,为发现迄今为止人类观测到能量最高的光子、破解快速射电暴的起源之谜及新材料研发等提供了重要支撑。

与此同时,国家高能物理科学数据中心与国内外同行合作,建立了分布式的数据管理和共享系统。针对大型强子对撞机LHC的实验数据,与国际上100多个数据中心联合建立了数据网格。

为科学研究提供充足“粮食”

为提升科学数据资源和共享服务能力,建立科学数据共享的可持续发展机制,为科学研究提供基础支撑,科学数据中心作为公益性的国家级科学大数据设施按不同领域陆续成立。

国家地球系统科学数据中心主要为地球系统科学的基础研究和学科前沿创新提供科学数据支撑和数据服务。截至2020年12月底,国家地球系统科学数据中心已开放共享数据集3.6万余个,数据资源量超过2.14PB,为9935个重大科研项目/课题提供了数据服务。

从服务的科研产出来看,数据开放共享主要服务于科研项目(课题)、学术论文、专著与图集等,也包含支撑软件著作权专利、获奖、标准规范等相关成果。如2018—2019年期间,中国工程院刘旭院士的科研团队面向两山理论实践、发展环境综合治理等区域关键问题开展战略研究,国家地球系统科学数据中心持续跟踪项目进展,协助团队完成构建生态资源资产核算指标体系等研究,支撑项目出版专著5部。

国家对地观测科学数据中心依托中国科学院空天信息创新研究院组建,由十几个国家级和行业性遥感数据中心共同参与建设,目前有18个数据资源分中心单位,基本覆盖了我国规模以上的民用、商用、科研类卫星数据管理和信息产品生产单位,初步建立了覆盖遥感数据全生命周期的数据治理和服务规范体系。

国家对地观测科学数据中心和国家综合地球观测数据共享平台发起和主导的国际重大灾害数据援助机制(CDDR),协调我国民用和商业高分辨卫星资源,在2020年对伊朗洪涝、乌兹别克斯坦溃坝、黎巴嫩贝鲁特港口爆炸、哥伦比亚洪涝、斐济亚萨台风等国际重大灾害开展应急响应,得到国际社会的高度关注和评价;2020年我国洪涝灾害期间启动了数据应急响应工作,快速组织了基础地理数据、社会经济本地数据、灾前遥感数据等100多个数据集,并协调多个卫星机构动态提供了大量灾后遥感数据。

为应对新冠肺炎疫情,国家对地观测科学数据中心和武汉大学等联合开展了“武汉封城76天遥感纪实”工作,协调组织和整理了30多颗卫星在封城期间开展120次观测,为武汉抗疫工作提供了大量决策数据支撑;对接地球观测组织(GEO)的抗疫号召,标准化整理和发布了我国科学家基于空间技术开展的15个科研团队的抗疫成果。

为科技创新提供精准数据

在海洋科学数据共享方面,国家海洋科学数据中心整合了海洋水文、气象、生物、化学等9大学科实测数据,研制了海洋环境统计分析、实况分析和再分析等数据产品,以及海洋经济、海域海岛、海洋灾害等专题信息产品,空间覆盖全球海域,数据类型齐全。

在服务科学研究方面,国家海洋科学数据中心研制了全球高分辨率冰—海耦合再分析系统CORA2.0,制作了全球9000米水平分辨率的气候态海面高、三维温盐和海流产品,为把握海洋气候变化规律、减轻海洋灾害风险提供了科学支撑。在服务海洋资源开发利用方面,研制的“知海宝近海水环境在线监测系统”已完成第三代升级,具有垂向海温数据剖面连续、无间断监测等特点,为海洋渔业养殖生产提供便捷服务;依托上百个海上平台观测平台,开展长时序精细化海流、海浪和台风现场观测和预报产品研发,为海上石油平台生产、船舶通航提供精准服务。在支撑政府决策方面,研制了东海区海上风电项目数据集,反映了风电站建造、运行、退役全生命周期轨迹信息,为政府部门发展利用海上风能提供决策依据。

国家海洋科学数据中心团队负责人姜晓轶说:“通过建设运行海洋科学数据中心,整合盘活了各类海洋信息资源,大幅提升了科技资源的应用服务成效,为海洋高质量发展提供了有力支撑服务。”

我国约2/3的国土面积为具有冰川、冻土、沙漠、荒漠、盐湖、绿洲、草地等地表特征的寒区旱区,这一区域既是连接我国内陆与中亚国家的战略要地,也是水资源、能源、矿产资源的后备基地,生态环境极度脆弱区,是我国脱贫攻坚、生态文明和乡村振兴战略的关键区。国家冰川冻土沙漠科学数据中心在服务包兰铁路、青藏铁路和黑河重大研究计划等项目同时,也为“渝昆高速铁路选线”提供基础数据和科学决策,为“中巴经济走廊灾害机理研究和观测预警”和“黄河上中游水土保持与治理”提供专题数据服务,为科技创新、经济社会发展和国家战略提供了重要的支撑。