温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
用于
高温
季节
预报
深度
学习方法
邓敏
第 39 卷 第 2 期 福 建 电 脑 Vol.39 No.2 2023 年 2 月 Journal of Fujian Computer Feb.2023 本文得到国家重点研发计划“重大自然灾害监测预警与防范”专项(No.2018YFC1505805)、福建省引导性项目“福建省前汛期持续性强降水过程延伸期预报的人工智能技术研究”(No.2021Y0057)、福建省引导性项目“基于深度时空多尺度交叉注意力的华南前汛期极端降水延伸期预报研究”(No.2022Y0008)资助。邓敏,男,1998 年生,主要研究领域为人工智能应用。E-mail:。游立军(通信作者),男,1974 年生,主要研究领域为延伸期预报、气象信息技术。E-mail:。翁彬,男,1981 年生,主要研究领域为人工智能理论与应用。E-mail:。郑子华,女,1976 年生,主要研究领域为人工智能、信号处理。E-mail:zh_z_。叶锋,男,1978 年生,主要研究领域为人工智能应用。E-mail:。用于高温次季节预报的深度学习方法 邓敏1,2,3 游立军4 翁彬1,2,3 郑子华1,2,3 叶锋1,2,3 1(福建师范大学计算机与网络空间安全学院 福州 350117)2(数字福建大数据安全技术研究所 福州 350117)3(福建省公共服务大数据挖掘与应用工程技术研究所 福州 350117)4(福建省气象科学研究所 福州 350007)摘 要 高温是一种比较常见的气象灾害,对人们日常生活和健康以及国民经济都有一定的影响。准确地预报未来 10-30 天(次季节)的每日高温天气状况,有助于人们及早地做出对应的决策和降低财产损失。本文设计了一种深度学习模型,通过对两个 Encoder 提取的大气环流和地表高温的特征进行延迟融合,并结合 Decoder 逐日输出高温预报结果。实验结果表明,本文的方法有较好的预测效果,相较于单个 Encoder 的深度学习方法,均方根误差降低了 2.12%,异常相关系数提高了 2.72%,决定系数提高了 0.04。关键词 高温次季节预报;深度学习;气象预报数据 中图法分类号 TP389.1 DOI:10.16707/ki.fjpc.2023.02.001 A deep Learning Method for Sub-seasonal Forecast of High Temperature DENG Min1,2,3,YOU Lijun4,WENG Bin1,2,3,ZHENG Zihua1,2,3,YE Feng1,2,3 1(College of Computer and Cyber Security,Fujian Normal University,Fuzhou,China,350117)2(Digital Fujian Institute of Big Data Security Technology,Fuzhou,China,350117)3(Engineering Technology Research Center for Public Service Big Data Mining and Application of Fujian Province,Fuzhou,China,350117)4(Fujian Institute of Meteorological Sciences,Fuzhou,China,350007)Abstract High temperature is a common meteorological disaster that has a certain impact on peoples daily life and economy.Accurate forecasting of daily high temperature weather for the next 10-30 days(sub-seasonal)can help people make early decisions and reduce damage.In the paper,a deep learning model was design by late fusion the futures of atmospheric circulation data and surface high temperature extracted by two Encoders,and combining with Decoder to output day-by-day high temperature forecasting results.The experimental results show that the proposed method has better prediction effect,with a 2.12%reduction in root mean square error,a 2.72%improvement in anomaly correlation coefficient and a 0.04%improvement in coefficient of determination compared to the deep learning method with a single Encoder.Keywords Sub-seasonal Horecast of High Temperature;Deep Learning;Meteorological Forecast Data 1 引言 目 前 的 天 气 预 报 依 赖 于 数 值 天 气 预 报(Numerical Weather Prediction,NWP)模型1。但数值模型初始条件的不确定性和大气本身的混沌2 邓敏等:用于高温次季节预报的深度学习方法 第 2 期 性质导致数值预报的结果存在偏差2,需要进一步处理。其中,受大气中的风速、湿度和垂直速度等环流要素的影响,地表高温和环流要素的预报偏差存在非线性关联。次季节预报通常是指在 10-30 天的时间尺度上进行天气预报。由于严重依赖于当地天气和全球气候变量的变化,次季节预报一直被认为是“可预测性沙漠”3-4。但是在公共卫生和水资源管理等许多部门的决策中,需要关于这些时间尺度的可靠的和可操作的预测3,5。高温是一种比较常见的气象灾害,对人们日常生活和健康以及国民经济各部门都有一定的影响。中国气候变化蓝皮书(2022)指出中国升温速率高于同期全球平均水平6,是全球气候变化的敏感区。提前 10-30 天的高温预报有助于人们更早地制定决策和降低生命财产损失。随着人工智能的快速发展,人们对基于统计机器学习的天气预测方法的兴趣正在迅速增长,且获得了不错的预测结果,例如天气预报、次季节预测和气候预测等7-11。因此,将深度学习应用在次季节时间尺度上对高温进行预报具有巨大的研究意义。其中,Jin W 等人验证了深度学习在次季节高温预报方面的有效性10。但该工作仅考虑纯地表高温,并没有在预报过程中考虑大气环流要素。本文基于 UNet 网络12,将大气环流和地表高温这两类数据进行融合,并对中国大陆东部地区的夏季未来 30 天内的日高温进行逐日的确定性预报。本文的创新点如下:(1)基于 UNet 设计了一个融合多种气象数据进行次季节高温预报的基础模型。它用同一个编码器(Encoder)同时提取大气环流和地表高温的特征,为后续高温次季节预报研究提供基础。(2)针对大气环流与地表高温的不同物理特性,提出了 CTUNet。它利用两个编码器分别提取大气环流特征和地表高温特征,并将这两个特征进行延迟融合。实验结果表明,基于深度学习的高温次季节预报的方法均优于传统的天气预报方式。其中,相较于 UNet 模型,本文提出的 CTUNet 在均方根误差(Root Mean Square Error,RMSE)上降低了 2.12%,在异常相关系数(Anomaly Correlation Coefficient,ACC)上提高了 2.72%,在决定系数(Coefficient of Determination,R2)上提高 0.04。2 相关工作 目前,天气预报在很大程度上依赖于基于物理的动力学模型的集合预报13。但与气候态相比,在次季节到季节(Sub-seasonal to Seasonal,S2S)的时间尺度上集合预报显示了有限的预测技能14-16。为了了解导致提高 S2S 预报可预测性和改善的条件,已经建立了 S2S 和 SubX 等项目17-18。机器学习(Machine Learning,ML)已经被应用于各种预测系统中,有助于提高不同时间尺度上的预测技能。尤其是深度学习的发展,使得 ML 模型的性能在天气预报和季节预测等方面比动力学模型更具竞争力7,11,19,20。特别是,ML 模型已经开始应用于提高预测次季节时间尺度的温度、降水和其他气候变量的预测技能8,9,21-27。He 等人在次季节时间尺度上对一套现代 ML方法进行了比较28,包括非参数 AutoKNN、多任务 Lasso、梯度增强树和深度编解码器网络,表明ML 模型平均在 SSF 上优于动力学模型,并且探索通过使用动力学模型的预测来增强 ML 模型,这也为本文的研究提供数据可行性分析。3 数据和方法 本文提出一种高温次季节预报模型,对中国大陆东部地区未来 30 天的每日最高气温进行确定性预报。模型结合动力学预报模式的环流要素场和高温要素场,经深度学习网络 CTUNet 后给出特定日期的距地面 2m 的高温预报。3.1 数据 本文使用两个数据集。来自欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECWMF)的次季节到季节预测项目(https:/www.ecmwf.int/en/forecasts/dataset/sub-seasonal-seasonal-prediction)提供的全球范围的回报数据作为输入数据集。本文选取覆盖中国大陆东部地区(19.5N45N,105E132.0E)的 6 个环流要素(Q700,U200,U850,V200,V850,W500)和高温要素(TMAX)。标签数据集为由中国气象台 提 供 的 全 国 日 高 温 站 点 插 值 数 据(http:/ 342 个网格点。这些数据的时间范围为 1998-2014 年每年的 6-9 月。其中,1998-2008年为训练数据,2009-2011 年为验证数据,2012-2014年为测试数据。2023 年 福 建 电 脑 3 3.2 算法流程 高温次季节预报流程如图 1 所示,包含模型构建和模型评估两部分。首先,对 S2S 项目和中国气象局提供的气象数据进行数据预处理操作,根据实验要求分别提取出覆盖中国大陆东部地区的环流输入数据、高温输入数据以及高温观测数据。这些数据都需要经过归一化处理来映射到同一尺度上,才能送入 CTUNet 网络。然后,将得到的数据输入到 CTUNet 网络进行模型训练,输出高温预测数据。最后,本文将 CTUNet 网络和其他基准进行比较评估分析,包含总体误差评估分析、误差的空间分布评估以及预报个例检验。图 1 高温次季节预报流程图 3.3 CTUNet网络 图 2 UNet 网络结构 深度学习网络UNet的Encoder-Decoder结构可以很好地处理不同数据之间的非线性关系。首先基于 UNet 设计一个深度学习模型应用在次季节预报中。如图 2 所示,该 UNet 网络由 Encoder、Decoder和跳跃连接构成。Encoder 由 1 个输入模块和 4 个下采样模块构成。每个输入模块含有两层 33 卷积层,下采样模块包含两层 33 卷积层和 1 层 22 最大池化层。Decoder 由 4 个上采样模块和 1层 11 卷积层构成。每个上采样模块含有 1 层上采样的