分享
基于双分支特征提取的太阳辐射预测方法_王俊.pdf
下载文档

ID:2574178

大小:2.29MB

页数:8页

格式:PDF

时间:2023-07-24

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 分支 特征 提取 太阳辐射 预测 方法 王俊
年月第 卷第期计算机工程与设计 基于双分支特征提取的太阳辐射预测方法王俊,欧阳福莲,周杭霞(中国计量大学 信息工程学院,浙江 杭州 )摘要:针对太阳辐射预测过程中气象特征复杂、时序特征难以充分利用而导致光伏功率出力扰动的问题,提出一种基于双分支特征提取的太阳辐射逐日预测方法。气象分支采用多尺度卷积神经网络提取动态变化的多维气象特征;时序分支使用双向门控循环网络初步提取时序特征,将学习到的双向时序特征输入门控循环网络进一步学习其潜在规律;基于注意力机制自适应地赋予各分支合适的权值,优化多尺度卷积的提取操作和气象、时序特征的融合过程。经过实验验证了该预测方法的准确性和有效性。关键词:太阳辐射预测;双向门控循环单元;多尺度卷积;注意力机制;特征提取;特征加权;双分支中图法分类号:文献标识号:文章编号:():收稿日期:;修订日期:基金项目:浙江省公益技术应用研究基金项目();公安部重点实验室开放课题基金项目()作者简介:王俊(),男,浙江杭州人,硕士研究生,研究方向为数据挖掘、智能算法优化;欧阳福莲(),女,江西宜春人,硕士研究生,研究方向为智能算法、深度学习;通讯作者:周杭霞(),女,浙江杭州人,教授,硕士生导师,高级会员,研究方向为智能计算、大数据分析。:,(,):,(),(),:;引言太阳辐射预测方法有物理模型、经验模型和机器学习类,机器学习无需结合复杂的计算原理,预测结果适用性强,是目前太阳辐射最为常用的预测方法。传统的机器学习模型如支持向量机、梯度提升决策树、极限学习机等难以灵活调整结构,在输入特征较少的太阳辐射预测任务中,存在精度下降的问题。卷积神经网络(,)适合学习网格量测等输入特征来进行预测建模;循环神经网络(,)能够根据辐 射 序列分析太 阳辐射的 时 序变化,其 中 变 体 长 短 期 记 忆 网 络(,)和门控循环单元(,)在预测过程中体现了良好的非线性表示能力和时间序列分析能力。文献 结合不同类型网络的优势,使用 类模型对预测变量进行特征提取,对提取后的特征采用 模型学习时序规律,相比单一模型有更好的预测精度。但上述研究并未将气象因素和时间因素计算机工程与设计 年对太阳辐射的影响清晰分离,类和 类模型的串行叠加容易混淆两种类型的特征对太阳辐射的出力情况。为充分挖掘和利用原始数据的气象特征与时序特征,本文提出了一种基于双分支特征提取的太阳辐射预测方法。该方法在构建数据集时完全分离时序因素与气象因素,使用多尺度()和 ()模型有效提取时序特征和气象特征,并结合注意力机制优化各分支的加权融合。基于国家气象数据中心真实数据进行算例分析,验证了双分支特征提取方法在太阳辐射预测中的有效性。预测数据集处理 数据预处理本文的数据来自国家气象数据中心海宁站点年的太阳辐射数据,数据粒度为每日一条,包含最高温度、日降水量、总云量、空气质量等个气象特征,个时间特征以及当日的太阳辐射数值,具体数据集分布情况见表。表原始数据集描述数据类型数据名称单位最小值最大值风速 风向度 总云量 空气质量指数 气象特征日降水量 相对湿度 最高温度 最低温度 温差 时间特征具体日期 辐射数据太阳辐射 按照 将数据集划分训练集和测试集,取 年月日至 年 月 日共 条数据作为训练集,年月日至 年 月 日共 条总辐射数据作为测试集。太阳辐射整体分布情况如图所示,可以看出,太阳辐射以年为单位呈现明显的周期性,以天为单位存在明显波动。图太阳辐射数据整体分布情况为进一步挖掘时间因素对太阳辐射的影响,将时间特征拆分为年份、季节(春、夏、秋、东分别使用,进行标签编码)、月份和日期。时间因素对太阳辐射的出力影响如图所示,其中线条表示太阳辐射的均值,阴影表示辐射的数据分布范围。由图可知,季节和月份对太阳辐射影响明显,表现为夏季最高,冬季最低,每月的辐射均值稳定,且月存在一个辐射降低点;日期和年份对太阳辐射影响不大,表现为辐射随日期呈随机波动,随年份无明显变化。因此,将季节因素和月份因素筛选为太阳辐射预测的时序特征。由于不同的特征在单位和数量级上的不同,需要先对数据进行归一化处理。图时间因素对太阳辐射的影响曲线 数据划分复杂多变的气象特征对太阳辐射的出力不同,为提高预测精度,需根据气象特征对数据进行划分。采取 相关系数来衡量气象特征与太阳辐射的相关 性,计算 公式如下,(?)(?)(?)(?)()式中:,为 相关系数,分别为样本变量,取值范围为,相关系数绝对值 为极强相关;为 强 相 关;为 中 等 程 度 相 关;为弱相关;为极弱相关。为样本量;?,?分别为两个样本均值。太阳辐 射 与 气 象 特 征 的 相 关 性 分 析 结 果 见表,其中()表示无量纲数。由于未对数据进行基于气象特征的清晰划分,辐射与气象特征的相关性绝对值均在 以下,直接预测未能合理利用气象特征,需对太阳辐射数据进一步划分,以降低样本的噪声干绕,提升太阳辐射预测的准确性。第 卷第期王俊,欧阳福莲,周杭霞:基于双分支特征提取的太阳辐射预测方法表气象特征与太阳辐射的 相关性分析结果特征风速()风向度总云量相关系数 特征空气质量指数()降水量相对湿度相关系数 特征最高温度最低温度温差相关系数 将气象特征中总云量 的数据划分为晴类天气,剩余数据采用聚类方法进行划分。剔除弱相关及以下的气象数据,按式()构成聚类特征向量,()式中:为特征向量集合;为最高温度,为最低温度,为温差,为总云量,为相对湿度,为日降水量。算法在 的基础上,优化了聚类中心的选择过程,核心思想是使初始聚类中心尽可能相互远离,以加速聚类算法的收敛过程,保证良好的聚类效果。聚类流程见表。表 聚类流程聚类流程:步骤从数据集中随机选取一个样本作为初始聚类中心;步骤计算每个样本与当前最近的一个聚类中心之间的最短距离,用()表示;步骤根据公式()(),计算每个样本被选为下一个聚类中心的概率;步骤用轮盘法选出下一个聚类中心;步骤重复步骤步骤直到选出个聚类中心;步骤针对数据集中的每个样本,计算它到个聚类中心的距离,并将其归到与它距离最小的聚类中心所在的类中;步骤针对每个类别,根据公式,重新计算它的聚类中心;步骤重复步骤和步骤直到聚类中心的位置不再发生变化。值的大小由手肘法确定。本文确定 值为时,聚类效果最佳。以经过归一化后的最高温度、降水量和总云量作为,轴的聚类结果如图所示,在三维空间有清晰的聚类表现,验证了基于 划分数据的有效性。将聚类分析后的辐射数据根据气象特点命名为多云、阴雨和多雨类。预测数据集构建合适的预测特征集的构建,能有效提高预测精度并加图 聚类结果快模型的收敛速度。本文充分考虑气象特征的影响以及时序规律造成的波动,按照如下太阳辐射构建预测数据集,进行太阳辐射的逐日预测,数据集的构建如式()()所示 (),()()(),(),()()(),(),()()式中:太阳辐射预测数据集 由当天的时序数据集()和气象数据集()组成。其中时序数据集()通过滑动窗口构成,为时间步滑动窗口的大小,()包含前天的时序特征,表示第天所属的季节,表示第天所属的月份,表示第天的太阳辐射数值。()由(),(),()共个气象特征构成。预测模型搭建预测模型主要包含基于 的数据划分、预测数据集的构建、基于多尺度 的气象特征提取、基于 的时序特征提取、注意力机制个部分。特征提取结束之后,将经过注意力机制优化的合并特征展平后输入全连接层,得到太阳辐射的预测结果。本文所提出方法的双分支预测流程如图所示。图双分支预测流程计算机工程与设计 年 气象特征提取 卷积神经网络主要结构为输入层、卷积层、池化层、全连接层、输出层等,主要思想为局部连接和参数共享,是一种具有深度的前馈神经网络,广泛应用于计算机视觉和自然语言处理等领域中。通常采用多个不同尺寸的卷积核对原始特征数据进行卷积操作,来更好地学习不同尺度的特征,卷积核的尺寸可以决定提取特征的抽象程度。不同尺寸的卷积核通常采用串行的方法进行叠加,这样会导致网络层数变深,从而引起过拟合、梯度爆炸等问题。本文借鉴 模型中拓宽网络的思想,设计了一种多尺度 特征提取方法,以学习有限的气象特征。该模型通过并行叠加卷积层的方式,能在网络参数减少的情况下更好地学习不同尺度的特征,模 型 结 构 如 图所示。图多尺度 模型结构输入数据为气象数据集(),包含个气象特征。首先矩阵化为大小()的特征向量;再经过卷积核数量为,大小为()的卷积操作,改变了特征维度并增加了非线性特性;然后将大小为()的特征向量分别经过个卷积核大小不同的卷积操作,有助于学习不同抽象程度的特征;最后将个卷积操作的提取结果进行数值相加,作为气象特征的提取结果。卷积操作均采用 策略,保证了特征向量经过不同卷积核的卷积操作后维度相同,输出的气象特征维度为()。每一个卷积操作包含一个二维卷积()层,批标准化(,)层和激活函数层。批标准化的过程见式(),缓解了因为网络中隐藏层引起的权重变化问题,使得神经网络每层的均值和方差保持不变?()式中:?为批标准化的初步结果,为输入的批数据,为该批数据的平均值,为该批数据的方差,是一个极小值,防止除数为造成的计算错误。批标准化的初步结果基本被限制在正态分布下,导致网络表达能力下降,所以批标准化层的输出采用式()对数据扩展和平移,保证每层神经网络的输入均在激活函数敏感的区域,可以加快网络学习与收敛的速度?()式中:为 扩 展 参 数,为 平 移 参 数,为 批 标 准 化 的输出。激活函 数 采 用 ,计 算 公 式 见 式(),与 相比较赋予了负值非零的斜率,解决了在负值范围内的梯度消失问题,()式中:为激活函数输出层;为激活函数输入层;为自定义的非零斜率。时序特征提取循环神经网络()相比传统的神经网络,隐藏层的神经元间建立了连接,因此在时序数据分析与预测中体现了更好的适应性。但是 难以学习时序数据的长期依赖信息。在 的基础上,神经元内部增加了个相互作用的神经网络层,改善了 训练时梯度消失或梯度爆炸的现象。作为 的变体,在解决长期依赖问题的同时,弥补了 内部参数复杂而导致收敛时间过长的缺陷。信息在 等神经网络中的传递顺序均为单向的,但某一时间点的太阳辐射与历史时刻和未来时刻的时序特征均有关联。针对时序数据与前后数据均相关的特点,采取一种分步学习的策略,先提取数据的双向时序特征,再学习双向时序特征的内部规律。双向 神经网络由前向 层与后向 层组成,能够有效学习时序序列的前向规律与后向规律。本文采用 模型对时序数据集进行特征提取,的模型结构包含输入层、层、层、层 和 输 出 层,模 型 结 构 如图所示。模型的输入层为时序数据集()。为方便网络结构 的 描 述,将 数 据 序 列首先 按 照 式()进 行 简单替换,()式中:,和均表示时刻的时序数据集()中第个时间步的时序特征,的取值范围为,。层包含前向 网络和反向 网络,分别计算前向传播状态和反向传播状态,将两个传播状态的隐藏层结果基于通道维度进行张量拼接,得到包含前向规律与反向规律的双向时序特征集,层的计算过程如下第 卷第期王俊,欧阳福莲,周杭霞:基于双分支特征提取的太阳辐射预测方法图 模型结构,(,)(),(,)(),;,(),()式中:,为时刻下第个时间步的前向传播状态,反向传播状态,为时刻下 层包含前向传播状态,与反向传播状态,的第个时间步的输出单元,为时刻下的 层输出矩阵,;为矩阵基于通道维度的张量拼接。层的输入为时刻的双向时序特征,本文采用两层通道数目相同的 网络,充分学习双向时序特征的潜在规律,层的计算过程如下,(,)(),(,)(),()式中:,为时刻下第一层 网络第个时间步的隐藏层状态,为时刻下第二层 网络第个时间步的隐藏层状 态,为时 刻 层 的 输 出 矩 阵,即 第 二 层 的最后一个时间步的隐藏层状态。网络与 网络叠加时会存在模型复杂、参数过多的情况,为防止在样本规模较小的情况下产生过拟合的 问 题,层 和 层 在 设 置 时 均 采 用 了 机制,训练模型时随机丢弃部分隐藏层单元,使 模型具有更强的鲁棒性和泛化能力。层与 层的单元数目分别设置为 和,满足时序特征与气

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开