当前,生态环境问题已经成为必须要面对的重要问题。这类问题涉及领域广泛、过程复杂、驱动因素众多,需要处理海量生态环境数据,这让全球生态环境问题的监测、分析和处理变得十分困难。随着大数据技术发展,解决这类问题有了新方向。
大数据技术是信息技术产业的一次重要技术变革,在数据库系统存储管理和分析处理能力上具有很大的优势。因此,将大数据技术引入生态环境领域,把分散在不同行业领域的生态环境数据进行有效集成,并对集成数据进行存储管理及信息挖掘,才能更加高效地解决生态环境问题。
2016年3月,原环境保护部发布了《生态环境大数据建设总体方案》,要求把大数据技术作为推进环境治理体系和治理能力现代化的重要手段,实现生态环境综合决策科学化、生态环境监管精准化、生态环境公共服务便民化。
生态环境数据的范围
生态环境数据有其独有的特征。第一,生态环境大数据具有“空天地一体”的巨大数据量。从数据规模来看,生态环境数据量也已从TB级别跃升到PB级别。第二,生态环境大数据的类型、来源和格式具有复杂多样性。生态环境数据在内容上包括水、土、大气等多方面的数据;从地域上来讲,包括全球各个尺度,如海洋、森林、湿地等各类生态系统的数据;从数据来源上说,有来自于气象、水利、国土、农业、林业、交通、社会经济等不同部门的各种数据。且同一种数据在不同部门的格式多样,使得各部门之间的同类数据整合具有一定难度。
整体上来说,生态环境大数据可以分为基础支撑数据、自然生态数据、环境监测数据、人文社会数据四个方面的内容。
基础支撑数据包含了基础地理、遥感影像、气候气象等方面的数据。
自然生态数据包含了农田生态系统、森林生态系统、草地生态系统、荒漠生态系统、沼泽生态系统等方面的数据。每种生态系统包含了不同的数据,例如,农田生态系统,包含农田环境要素、主要作物以及肥料农药等投入量、主要作物叶面积与生物量动态、病虫害记录、土壤微生物等;森林生态系统包含植物群落种类组成与分层特征、树种的更新状况、叶面积指数、鸟类种类与数量等。
环境监测数据包含了水环境、大气环境、土壤环境、噪声环境、核辐射环境等方面的数据。我国已经初步建立了一套网络监测系统,包括1436个空气质量监测站点、82个沙尘暴监测站点、1011个酸雨监测站点、956个地表水水质监测断面、20401个地下水监测站点、301个近海水质监测站点、35000多个土壤污染监测站点。
人文社会数据包含了经济发展、基础设施、能源消耗、公众参与、网络舆情等方面的数据。
生态环境大数据相关文件
2016年3月,原环境保护部发布了《生态环境大数据建设总体方案》,把2016年至2018年作为基础建设年,主要完成生态环境大数据基础设施、保障体系建设和试点示范建设,基本形成大数据采集、管理和应用格局。《生态环境大数据建设总体方案》的首要建设任务就是要推动环境数据资源全面整合共享,这也是生态环境大数据建设的基础和关键。2019年至2020年为数据建设年,主要拓展深化大数据应用,形成生态环境大数据创新应用新业态、新模式和新方式。
2018年4月,生态环境部发布了《2018-2020年生态环境信息化建设方案》,指出要建设生态环境大数据、大平台、大系统,形成生态环境信息“一张图”。进一步强调了大数据对于推进生态环境治理体系和治理能力现代化的重要性。
2018年12月15日,第二次全国污染源普查暨全国土壤污染状况详查工作推进视频会议召开。生态环境部部长李干杰表示,要扎实推进第二次全国污染源普查和全国土壤污染状况详查。另外,要加强部门间沟通协调,推动数据共享,建立土壤生态环境数据库,健全数据库动态更新机制,为土壤管理提供数据支撑。
生态环境大数据的共享及应用
生态环境大数据面临的主要问题就是缺乏数据共享,其原因有以下几点。第一,生态环境数据复杂多样。数据来源几乎涵盖所有政府职能部门,这些部门互不连通,只是一个个“数据孤岛”。第二,数据没有规范化。数据存储形式不一样,即使在同一个行业,数据也是“一人一个模样”。第三,数据开放严重不足。生态环境数据开放总量偏低,大多为静态数据,且集中在经济发达、政府信息化基础和IT产业发展好的城市。第四,存在敏感性问题。数据开放意味着任何人都能下载和读取数据,判断哪些数据可以公开、哪些数据需要脱敏,这对各机构来说都是困难的任务。因此,对生态环境大数据进行标准化处理以及推动同类数据的对接平台建设是目前迫切需要开展的工作。
大数据在生态环境领域已得到初步应用,主要体现在全球气候变化预测与区域大气污染治理等方面。
随着新气象观测设备的推广和应用,气象观测水平由过去较少指标的常规观测到现在大量多指标的非常规观测,观测的频率和精度日益增加。气象监测站点遍布全球,截至2015年年底,中国已建有5万多个地面自动观测站。气候模式由最初的大气环流模式发展到今天的陆、海、空耦合模式,并向着包括人类生活圈在内的地球各个系统耦合的“气候系统模式”发展,所需的输入变量也从最初的气象数据拓展到现在的植被、土壤、水分、人类干扰等多方面全方位数据。2015年9月,中国科学院大气物理研究所等发布“地球数值模拟装置”原型系统,集成了土壤、大气化学、植被动力学、生物地球化学等模式和模块,仅需一整天就能够估算地球的大气、水、岩土等多个圈层长达6年的变化。此外,还可以从气候观测数据中挖掘新信息,从而扩大业务范围。美国一家公司使用降雨、气温、土壤状况等气象数据与农作物产量进行关联分析,来预测各地农场来年的产量和适宜栽培的品种,并将其以个性化保险服务的形式向农户出售,从而减少气象灾害带来的损失。
对于大气污染治理,地区间联防联控仍然是当下的共识,大数据为地区大气质量管理、区域间协调和合作机制提供了技术和决策支撑。为预报空气污染状况,IBM公司与北京市政府联合开发了“绿色地平线”大数据平台系统,该系统能够结合当时的气象卫星资料、地面监测资料,根据当时气象条件以及周围所有的企业排放数据进行大数据分析,预测未来72小时的空气质量。在预测空气质量较差的地区,政府通过该地区工厂停工等辅助措施,减少空气污染物质排入,这些措施的实施大幅减少了整个区域的大气污染物排放量。