雷锋网 AI 研习社按:「AI Challenger 全球 AI 挑战赛」是面向全球人工智能人才的开源数据集和编程竞赛平台,本次 AI 大赛气象赛道应用了一个很重要的数据源-「睿图」预报数据,睿图就是北京市气象局数值天气预报体系。
在本次公开课中,嘉宾将分享数值天气预报的现状、睿图数值天气预报体系的情况以及睿图预报数据的介绍,使听者对数值天气预报本身以及「睿图」预报数据有所了解。
分享嘉宾:
范水勇,中国气象局北京城市气象研究所,副研究员,主要研究方向是数值天气预报系统开发和应用
公开课回放地址:
分享主题:数值天气预报介绍
分享提纲:
-
什么是数值天气预报
-
「睿图」数值天气预报系统介绍
-
「睿图」预报数据怎么做出来的
雷锋网 AI 研习社将其分享内容整理如下:
众所周知,大气系统是很复杂的,主要具有这几种特征:非线性、多尺度、多圈层和多种强迫和反馈,此外,大气系统还是动力、物理和化学的综合。对于大气系统的多变性,著名气象学家 Charney 在 1951 年说过:「大气并没有向我们展现出类似潮汐变化那种类型的周期性,因此我们无法采用像潮汐预报那样的方法来预报天气。我们没有发现大气在某一特定时刻的状态与另一时刻的状态之间存在一系列的简单因果关系。」
我们的气象预报主要解决以下三方面的问题:当前的天气或气候信息、天气或气候的演变规律以及从已知预报未来的手段。在未有数据预报以前,天气预报主要建立在地面与少数高空观测基础上的主管技术,比如下图便是 1944 年美国气象学家用来做天气预报的天气图。
这种预报比较主观,对于极端天气的预报时效很少会超过 12 个小时。
我们对天气预报的定义,是应用大气变化的规律,根据当前及近期的天气形势,对未来一定时期内的天气状况进行预测。预测主要根据对卫星云图和天气图的分析,结合有关气象资料、地形和季节特点、群众经验等综合研究后作出的。
业内主要默认有三种基本的天气预报模式:第一种是根据天气学原理和经验建立的,以物理定性关系为主的天气学模式;第二种是由当前气象要素与未来天气之间的统计关系建立的统计学模式;第三种则是利用当前气象要素的分布与未来天气之间的物理定量关系建立的动力学模式。简单进行总结的话,第一种模式对应的是天气图方法;第二种模式对应的是统计预报方法;第三种模式对应的是数值预报方法。
第一种天气学方法与第二种统计学方法都属于传统方法的范畴,其局限在于无法满足客观、定量、准确的分析需求。
为了解决天气预报的难题,业界采用了一种可行性较高的方法:首先、把大气的演变规律近似表示为一组数学方程式;第二、根据从有限观测中得到的当前大气的初始状态;第三、在已知或设定的强迫条件(包括边界条件)下,通过求解这一组方程的解,得到对未来的天气或气候状况的预报;最后、由于方程组的复杂性,难以求出其解析解(精确解),只能借助于高性能计算机用数值方法近似求解。这一系列步骤构成了我们如今的天气预报系统。
我们一般将数值天气预报称作 NWP(numerical weather prediction),指的是根据大气实际情况,在一定的初值和边值条件下,通过大型计算机作数值计算,求解描写天气演变过程的流体力学和热力学的方程组,预测未来一定时段的大气运动状态和天气现象的方法。
从这个解释来看,就会发现数值天气预报与过往天气学模式预报的不同。
它是一种定量的和客观的预报,因此,数值天气预报首先要求建立一个较好的反映预报时段的(短期的、中期的)数值预报模式,以及误差较小、计算稳定并相对运算较快的计算方法。其次,由于数值天气预报要利用各种手段(常规的观测,雷达观测,船舶观测,卫星观测等)获取气象资料,因此,必须恰当地作气象资料的调整。
如果按预报时间长短给天气预报做分类,我们可以分为以下几种:
0-2 小时 临近预报
2-12 小时 甚短期预报 (短时预报)
12-48 小时 短期预报
3-10 天 中期预报
10 天以上 长期预报
数值模式预报系统的运作原理
在未有数值天气预报以前,传统的天气分析过程由观测——资料收集——填图——手工绘图——过程分析——主观天气预报组成。在引入数值模式以后,天气分析流程变成了观测——资料收集——输入电脑——资料初始化——模式模拟——客观再现历史天气或预报未来天气。
通过数值模式,我们可以将初始状态的数值转为为对未来状态的预报,不过对操作的人有一定要求,那就是必须对演变规律有综合理论的认识。
形象点来说,天气预报的原理是先有一个大气综合探测系统,通过资料同化系统利用探测资料对预报系统进行初始化,将大气变为三维立体空间的一个个格点,然后通过对逐一格点求解形成一组数学方程组,接着在大型计算机上进行逐时刻「推算」,最终获得未来的天气演变情况。
数值模拟系统的一共有 5 个组成部分,分别是:
客观分析和资料同化系统——主要解决从观测资料到模式可用资料的转换和优化。
初始化过程——去除资料中的干扰。
数值模式—一组数理方程组 (干模式)
物理过程参数化——描述大气中辐射、行星边界层、积云对流、海气相互作用、微量气体等(湿模式)。
数值产品的后处理——包括分析诊断再加工各类产品、图形化显示。
具体的数值预报系统流程,我们可以参考下图:
至于哪些必要条件是开展数值预报的必备,我们总结出了 3 点:性能相宜的计算机、良好的通信条件,保证实时原始资料的供应以及较好的数值模式。
不夸张的说,数值预报产品的应用改变了预报业务的传统工作程序和思路。
按照传统的天气预报思路,我们会先从实况形势分析入手,采用运动学方法和物理分析等方法作出形势预报,而且通常先作高空形势预报再作地面形势预报,着重报出高空、地面影响系统的强度变化和移动情况,然后在形势预报的基础上再作具体的要素预报。
而有了数值预报产品以后,形势预报准确率已明显高于人工主观预报,预报员的重点是在数值预报的基础上,运用天气学. 动力气象学等有关知识和天气实况、卫星云图等资料的演变情况,判断数值预报结果是否有明显的不合理现象——如果没有,就会使用数值预报的结果:如果有,则做出订正预报。
数值模式预报系统的发展历程
我给大家科普下数值预报在发展过程当中的一些里程碑事件:
数值预报概念在 1904 年由挪威科学家 Bjerknes 提出,经过不停发展,在 1950 年由美国 Charney 成功实现 24 小时的预报天气形势预报,后来随着计算机技术和数值技术方法的不断进步,又获得了更大的发展。
中国的数值预报发展要稍微晚一些。
我们是从 1954 年才有关相关的理论研究,1965 年推出北半球数据预报产品。如上图所示,从 50、60 年代开始,我国每年都有新模式提出,基本上都是一些覆盖大范围的全球性预报。直到 1997 年我国正式推出中尺度数值天气预报系统,行业才算正式步入新阶段。
中尺度数值模式得到全球的大力发展应用,其中最著名的是美国大气研究中心 NCAR、国家环境预报中心 NCEP 等多单位联合建立发展的 WRF(Weather Research and Forecasting Model),其次则是美国国家环境预报中心 ( National Centers for Environmental Prediction,NCEP) 用于业务预报的 ETA( η) 模式。
其他由美国主导的中尺度数值模式尚有:
美国宾夕法尼亚大学和美国国家大气研究中心 (PSU/ NCAR) 合作研制的 MM5( Mesoscale Model 5) 模式;
美国科罗拉多州立大学 (CSU) 研发的区域大气模拟系统 RAMS ( Regional Atmospheric Modeling System)。
美国俄克拉何马大学 (OU) 研发的区域预报系统 ARPS(Advanced Regional Prediction System);
美国北卡州立大学的中尺度大气模拟系统 MASS ;
美国空军全球天气中心(AFGWC)的重置窗口模式 RWM 模式;
美国海军业务区域预报系统 NORAPS6;
美国 NCEP 的区域谱模式 RSM 模式;
美国海军舰队数值气象和海洋中心(FNMOC)的耦合海洋/大气中尺度预报系统 COAMPS
其他国家也各自开发了独立的数值预报模式,当中较有名的包括:
欧洲:ECMWF(欧洲中心中长期预报业务模式)
法国: MESO-NH 模式 (中尺度非静力模式);
日本: JRSM 模式 (日本区域谱模式)
英国: UKMO 模式 (英国气象局业务中尺度模式);
加拿大: MC2 模式 (中尺度可压缩共有模式)
中国: GRAPES-meso(全球/区域同化预报系统 Global/Regional Assimilation and Prediction System,中尺度版)
其中由美国大气研究中心 NCAR、国家环境预报中心 NCEP 等多单位联合建立发展的 WRF 模式,是目前全球使用最广泛的中尺度数值模式。
所谓的 WRF(Weather Research and Forecasting Model)模式,是新一代非静力平衡、高分辨率的中尺度数值模式。这种模式结合先进的数值方法和资料同化技术,采用经过改进的物理过程方案,重点考虑从云尺度到天气尺度等重要天气的模拟及预报。
按照不同的动力框架,我们可以将 WRF 分为 ARW(the Advanced Researched WRF)和 NMM(the Nonhydrostatic Mesoscale Model)。前者由 NCAR 的 MM5 发展而来,多用于研究;后者由 NCEP 的 Eta 发展而来,多用于业务预报。
自 2000 年初推出第一个版本以来,WRF 目前已更新至 4.0 版本,距离第一代已有 18 年的历史。
睿图数值预报系统
睿图数值预报系统英文简称为 RMAPS-ST,中文全称「快速更新多尺度分析和预报系统-短期预报子系统」。「睿图」实际上是个庞大的预报体系,我们将着重介绍短期预报子系统 RMAPS-STv1.0 系统,该系统已在 2017 年 5 月业务应用于北京气象局。
MAPS-STv1.0 系统一共有两层嵌套区域,第一层分辨率达 9 公里,范围覆盖了全中国;第二层分辨率达 3 公里,主要覆盖华北区域。MAPS-STv1.0 系统的预报流程从世界时 00 时开始,一直持续至 21 时,根据不同业务预报需求,预报时效会有相应调整。系统每隔 3 小时快速获取一次常规观测资料(GTS)和中尺度观测资料(地基 GPS、自动站、雷达飞机观测等),主要用于资料同化程序。
下图是 MAPS-STv1.0 系统的资料分布情况,其中包括了常规的探空、地面、飞机报和自动站的分布(东部最为密集);另外还有地面 GPS 资料(同样东部最为密集);以及针对强对流天气预报的雷达资料分布。
与前一代预报系统 BJ-RUC v3.0 相比,MAPS-STv1.0 系统在很多方面都有了很大进步,其中包括模式版本、模式分辨率、预报范围、预报框架、资料同化技术性能、物理方案等,这些都是预报系统比较关键的参数。
MAPS-STv1.0 系统每天将有 8 次预报,实际的启动时间要比正常时间滞后 1 小时 15 分钟。根据不同业务的预报需求,系统将有相应的预报时效安排。如下图所示,00 点、03 点的预报时效要长一些,其次为北京时间 12 点。
由于网格覆盖范围较大,因此对计算量的需求也变得更高,一般需要 40 分钟至 2 个小时来完成所有预报流程——系统约滞后 2 小时可以看到前 12 小时的预报产品、约滞后 2 小时 15 分中可以看到 24 小时的预报产品。
为了维持数值预报的正常运算,系统采用了曙光高性能计算机,其计算峰值达到了 90 万亿次。其次,为了应付数值预报的海量数据,系统采用的都是上百 TB 的存储系统。
这里给我们的网站打个广告——www.ium.cn/rmaps,我们会在这里发布我们的天气预报产品,此外,网站上还能看到三天内的天气预报,预报的数据包含:降水量、温度、云层、强对流天气等。
为了保证预报数据的准确性,我们会通过一些统计学方程式来检验我们的系统预报性能。
下图结果显示,系统的 2 米温度的均方根误差在 1.7 度到 2 度之间;10 米风的均方根误差在 1.9 到 2.1 米/秒之间。总而言之,数据偏差基本都在可控范围之内。
AI Challenger 2018 全球 AI 挑战赛——-「睿图」预报数据
对于本次竞赛的睿图数据的制作,我们将提供两款数据集:
1)用于训练学习的历史预报数据集
——采用北京时间 11 点(世界时 03UTC)起始的预报
——预报时效 36 小时,数据时间间隔 1 小时
——原始预报是三维格点数据,netcdf 格式
——包含地面和特征气压层共计 29 个气象要素
——10 个观测站点,约 3 年预报样本
2)双周赛所使用的实时预报数据集
——格式、变量等与历史预报数据集相同
——实时预报数据的生成滞后 3 小时
我们先获取模式格点预报数据,然后通过处理软件插值到站点上,以形成站点要素预报;接着把北京自动站逐小时观测资料读取相应站点要素,形成站点要素观测数据,最好将两个数据合成包括站点要素预报和观测的数据集(netcdf 格式),最后发给大家。
我今天的分享内容就到这里,谢谢大家。
以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网(公众号:雷锋网) AI 研习社社区(http://ai.yanxishe.com/)观看。关注微信公众号:AI 研习社(okweiwu),可获取最新公开课直播时间预告。
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/134642.html