2. 江苏省宿迁环境监测中心, 江苏 宿迁 223800
2. Jiangsu Suqian Environmental Monitoring Center, Suqian, Jiangsu 223800, China
空气质量与人类健康之间的关系已经引起了广泛关注,已有不少学者对此做了大量研究[1]。空气质量预报在污染事件发生前对公众的预警及制定减灾计划方面尤为重要,国内外学者也利用数值机理模型及统计模型来对空气质量进行预报,试图精准预测污染事件的发生,为减灾计划提供支持[2-7]。因此,评估预报模型的预报准确率对进一步提高模型预报准确性也具有较为重大的意义。现以江苏省宿迁环境监测中心空气质量预报业务系统(OPAQ系统)为例,基于人工神经网络算法的OPAQ系统的两种模式对臭氧(O3)预报准确率进行分析,探讨2种模式的优劣。
1 OPAQ系统OPAQ系统采用人工神经网络算法中的多层感知方法,其中一个隐含层代表一个输出层。预测的结果是污染物的日均值或日最大值。假如模型在当天早上运行,则当天00:00至模型开始运行最近时刻的监测数据以及未来几天的气象数据作为输入数据。对每个监测站点配置几个不同的模型进行训练,不同模型的区别在于所采用的输入参数不同。所预测当天早上的监测数据及行星边界层高度(BLH)作为预测未来第N天的重要输入参数。行星边界层高度可认为是理查德系数(Ri)超过0.5时的高度[2]。其中Ri是浮力(由垂直温廓线确定)与惯性力(由大气湍流确定)的比率。如果Ri非常小(甚至是负的),湍流非常强烈,并且足以打破稳定的温廓线将颗粒物带至垂直方向,则从底部到行星边界层高度之间,颗粒物可以随湍流在此之间扩散。研究表明行星边界层高度在基于人工神经网络算法的空气质量预报系统中有非常重要的作用[8]。另外,还使用了风速与风向、温度、湿度及云量等气象参数来提高预测的准确性[8-9]。对每个监测站点都配置几种模型进行训练,最后选择一个最优的模型作为日常预报模型。
OPAQ系统具有两种模式,一种是预报趋势最优模式(RMSE模式),另一种是预报极值最优模式(SI模式)。预报趋势最优模式指的是在模型训练和验证阶段,选择预报值与监测值的均方根误差(RMSE)最小的模型作为日常业务预报时所采用的模型;预报极值最优模式指的是在模型训练和验证阶段,选择预报成功指数(SI)最大的模型作为日常业务预报时所采用的模型。
2 研究方法 2.1 数据时间2018年1月1日—2019年7月29日。
2.2 统计分析的项目O3预报的散点图、正确预警指数(FFE)、成功指数(SI)、错误预警指数(FFA)、相关性系数(R)以及级别预报准确率。统计方法技术说明见图 1。
$ {\rm{SI}} = \frac{{N3}}{{N3 + N4}} + \frac{{N1}}{{N1 + N2}} - 1 $ | (1) |
式中:SI——成功指数,为正确预报非超标天数和超标天数的比例,%;
N1——监测值达标预测值也达标的天数;
N2——监测值达标而预测值超标的天数。
$ {\rm{FFE}} = \frac{{N3}}{{N3 + N4}} $ | (2) |
式中:FFE——正确预警指数,为正确预报超标天数的比例,%;
N3——监测值超标且预测值也超标的天数;
N4——监测值超标而预测值达标的天数。
$ {\rm{FFA}} = \frac{{N2}}{{N1 + N2}} $ | (3) |
式中:FFA——错误预警指数,为错误预报超标,而实际未超标的天数比例,%。
3 结果与讨论 3.1 RMSE模式预报准确率评价O3预报分析评价结果中,m表示监测值,d0表示预报当天,d1表示预报未来24 h,d2表示预报未来48 h,d3表示预报未来72 h。RMSE模式预报结果评价见表 1。
由表 1可见,在预测当天及未来24 h的FFE都能达到60%以上,预测未来48和72 h的FFE略低;在预测当天及未来24,48及72 h的FFA较低,均 < 10%。
图 2(a)(b)(c)(d)为OPAQ系统RMSE模式当天及未来24,48及72 h的预测值与实际监测值对比的散点图,十字线为O3滑动8 h最大的超标临界值160 μg/m3。
由图 2可见,RMSE模式预测当天及未来24,48及72 h的结果与实际监测值的拟合度较好,有个别值离散度较大。
表 2中展示了OPAQ系统统计预报模型RMSE模式预报当天及未来24、48及72 h的O3预报级别准确率的评价结果。表中天数列为监测值(m)与预测值(d0, d1, d2, d3)在O3各级别出现的天数,准确率为预测当天及未来3 d对O3各级别的预测准确率。由表 2可见,OPAQ系统的RMSE模式在预测当天及未来24、48及72 h优-良天的预测准确率较高,在预测轻度污染-重度污染的准确率较低。
表 3为OPAQ系统统计预报模型SI模式预报当天及未来24、48及72 h的预报结果评价指标。由表 3可见,在预测当天及未来24、48及72 h的正确预警指数FFE都>60%。
图 3(a)(b)(c)(d)为OPAQ系统SI模式当天及未来24、48及72 h的预测值与实际监测值对比的散点图,十字线为O3滑动8 h最大的超标临界值160 μg/m3。
由图 3可见,RMSE模式预测当天及未来24、48及72 h的结果与实际监测值的拟合度较好,有个别值离散度较大。
表 4为OPAQ系统统计预报模型SI模式预报当天及未来3 d的O3预报级别准确率的评价结果。由表可见,OPAQ的SI模式在预测当天及未来24、48及72 h优-良天的预测准确率较高,在长达一年半的统计时段里,O3重度污染发生过1次,预测值为中度污染。
(1) 2种模式预报评价指标显示,SI模式的正确预警指数FFE和成功指数SI要高于RMSE模式;而RMSE模式的错误预警指数FFA要低于SI模式,该指标越低越好;并且从长期来看,2种模式的相关性系数相差不大。
(2) 2种模式预报准确率表明,在O3优-良级别天时,RMSE模式的预测准确率较高;而在轻度污染以上时,SI模式的预测准确率明显高于RMSE模式。建议在夏季O3污染较严重的时段里,采用OPAQ系统的SI模式来预报ρ(O3)。
[1] |
World Health Organization. Review of evidence on health aspects of air pollution-REVIHAAP Project 309[R]. 2013.
|
[2] |
万显烈, 杨凤林, 王慧卿, 等. 利用人工神经网络对空气中O3浓度进行预测[J]. 中国环境科学, 2003, 23(1): 110-112. |
[3] |
STOCKWELL W R, MIDDLETON P, CHANG J S, et al. The Second generation regional acid deposition model chemical mechanism for Regional Air Quality Modeling[J]. J of Geophysical Research, 1990, 95(D10): 16343-16367. |
[4] |
王淑莹, 许荣, 尹翠芳, 等. 基于OPAQ的城市空气质量预报系统研究[J]. 中国环境监测, 2016, 32(3): 13-20. |
[5] |
沈路路, 王聿绚, 段雷. 神经网络模型在O3浓度预测中的应用[J]. 环境科学, 2011, 32(8): 2231-2235. |
[6] |
叶斯琪, 陈多宏, 谢敏, 等. 珠三角区域空气质量预报方法及预报效果评估[J]. 环境监控与预警, 2016, 8(3): 10-13. |
[7] |
王厚俊, 程滢, 吴莹, 等. 几种空气质量预报方法对冬季预报效果的评估与对比[J]. 环境监控与预警, 2018, 10(5): 36-40. |
[8] |
程念亮, 李云婷, 邱启鸿, 等. 2013年北京市PM2.5重污染日时空分布特征研究[J]. 中国环境监测, 2015, 31(3): 38-42. |
[9] |
陈强, 梅琨, 朱慧敏, 等. 郑州市PM2.5浓度时空分布特征及预测模型研究[J]. 中国环境监测, 2015, 31(3): 105-112. |