温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
天鹰
优化
算法
短期
电功率
区间
预测
陈申
()年 第 卷 第 期 收稿日期:基金项目:国家自然科学基金项目();中国国家铁路集团有限公司科技研究开发计划重点课题();中国国家铁路上海局集团公司科技研究开发计划重大课题()作者简介:陈申,男,硕士,主要从事风电功率预测研究,-:;通信作者 叶小岭,女,硕士生导师,主要从事新能源发电相关技术研究,-:。本文引用格式:陈申,叶小岭,熊雄,等 基于天鹰优化算法的短期风电功率区间预测 重庆理工大学学报(自然科学),():,-(),():()基于天鹰优化算法的短期风电功率区间预测陈申,叶小岭,熊雄,陈昕(南京信息工程大学 自动化学院,南京 ;南京信息工程大学 气象灾害预报预警与评估协同创新中心,南京 )摘要:为克服随机森林算法预置参数依赖经验设定和风电确定性预测难以描述其随机性的困难,提出一种基于天鹰优化算法(,)、随机森林()和非参数核密度估计()相结合的区间预测方法。首先将 与 相结合进行功率单点值预测,在此基础上,为了能够给电网调度和优化配置提供更多信息,引入 进行风电功率区间预测。根据所提出的方法,对如东某风场使用 模式预报的风速数据进行对比实验。实验证明,-区间预测模型能够给出综合性能更优的风电功率波动区间,对减少风电功率不确定性,弱化电网波动具有应用价值。关键词:模式;随机森林;天鹰优化算法;非参数核密度估计;风电功率区间预测中图分类号:文献标识码:文章编号:()引言近年来,由于世界气候变暖问题的加重,中国制定“碳中和”目标,指导我国能源产业转型 。风能是一个主要的低碳再生能源,其具备了廉价、洁净、无污染等一系列优势,并具备了可持续能源供应的巨大发展潜力,大力发展风能,对降低温室气体污染和应对世界能源危机,有着重大的意义 。风能所固有的随机性特点对风能并网的有效调度,以及整个电网的平稳安全运转都产生了很大影响,而对于欧美等部分发达国家,其风电场是多个分布式网络结构的小容量风电场,因此各自对电网所引入的波动影响都会在一定程度上彼此抵消。中国现阶段的风电场,主要是集中式风电场和大容量风电场。正因如此,中国目前出现了大规模的弃风行为,这无疑导致了大批资源的空置与耗费 。准确的风电功率预报技术能够支持整个电网的正常运作与调节,使风电场所制定的控制策略更为科学与合理,提高风能的利用效率。所以,有效正确的风电功率预报技术对电力系统的稳定运转以及供电系统的优化调整有着非常关键的作用 。按照不同的评价准则,可将风电功率预测方法分为多种类别。从时间尺度角度上,可以分成 种类型,包括超短期(单位为小时)、短期(单位为天)、中期(单位为月)和长期(单位为年)。其中风电功率的超短期预测用来评估风电场机组,风电功率的短期预测则用作对电网系统的调整,风电功率的中长期预测用来安排大型设备检修以及风电场选址。从所使用模型的角度划分,方法一般可分成物理方法及统计方法,统计方法分为时间序列方法和人工智能方法 。物理方法获取风机轮毂高度附近风速和风向数值的主要手段是使用数值天气预报模式,进而参考风机自身的风力输出功率曲线,即可得出在目标时段的风机出力电量预估值,但是,由于模拟过程复杂,且计算成本较大,物理模拟并不适于短期、超短期的风电功率预报。时间序列模型是对风速和功率历史数据使用参数化和曲线拟合的方法实现预测。但在处理复杂问题,如波动性较大的风电功率预测问题时,效果不理想 。人工智能模型具有可以自适应和自学习的优点,通过大量数据进行训练,可以对风速等气象要素与功率的关系有较好描述 。近些年来,部分学者通过对风电数据预处理,然后使用机器学习算法对功率进行预测。文献 在使用最小二乘法曲线拟合和 归一化方法对风电功率历史数据预处理的基础上,结合 算法,通过滚动预测的方法,实现区域风电功率预测。文献 利用神经网络平均影响值的方法筛选出对于输出变量贡献值最明显的输入变量,通过实验证明,此种模型有比较好的预测效果。除了原始风电数据预处理这类方法,部分学者还选择了对原始数据进行分解,并对每个分量进行数据叠加的方式进行预测。文献 使用 方法分解了风电功率原始数据,预测模型选用随机森林(,)算法建立,可以得到每一个序列对应的预测结果,并且将结果叠加,得到最终的风电功率预测值。文献 提出了一种在小波分解()数据预处理基础上的核极限学习机()风电功率组合预测模型。然而,以上各种方法在使用机器学习算法建立预测模型时,并没有对模型本身的参数进行充分考虑和寻优,这将会导致模型无法发挥最佳性能,影响最终的风电功率预测效果。为解决上述方法所存在的问题,将 预测算法应用到风电功率点预测之中。为了发挥模型的最优预测性能和泛化效果,在对于风电功率预测模型的训练过程中,使用天鹰优化算法(-,)对模型的参数进行寻优改进,并与目前研究比较多的预测方法,如支持向量机()和极限学习机()等预测效果进行对比。针对功率点预测存在一定误差,不能对风电并网调度策略制定提供更多参考的问题,将单点预测和非参数核密度估计(-,)结合,建立了区间预测模型。最后通过使用数值天气预报风速数据和风电场风机实际功率数据进行实验验证,证明了该方法具有较好的效果和实用性。研究方法 天气研究和预报()模式数字天气预报是通过数值计算求解大气方程组的一种物理模型,需要提前给定目标空间的原始气候条件和边界条件,并基于目前所知的初始时间的大气环境状况,对未来一段时间内的大气环境变化作出预测,因为数值天气预报模式主要是对于描述大气活动的大气方程组进行数值计算,所以数值天气预报模式一般要依赖于大型计算机来进行数值计算 。其中,中小尺度预报被广泛地应用于风电功率预测领域,目前,使用最广泛的是美国的 模式,该模式数据同化能力先进,嵌套能力强大,物理过程先进,主要应用于中尺度数值天气预报,模式的具体运行流程如图 所示。图 模式运行流程陈申,等:基于天鹰优化算法的短期风电功率区间预测 是以 方法为基础,并在此基础上改良的集成学习算法,广泛应用于很多领域,并且具有比较优异的性能 。算法通过采用自主法对样本进行抽样,并使用回归训练树模型构建组合模型,其本质上是一种基于由多种弱学习器所组成的强学习器,从而完成学习任务 。算法的主要优势是良好的噪声容忍范围、不易出现过拟合以及计算工作量相对较小,更有利于去处理较高维数值的分类和回归问题 。以回归树为基础,回归树的数学表达式为:()()()式中:为回归树子集数量;为子集中样本的响应均值;为每个子集;()为示性函数(当 时取 ,反之取 )。是由很多个相互独立的回归树模型组成的,模型表达式为:()(,)()式中:为回归树的数量;(,)为一个回归树;()为预测值的输出。模型中的主要参数如表 所示。表 参数参数作用 控制模型性能和速度 控制样本读取方式 控制模型稳定性 控制节点分裂 控制过拟合度 控制 模型规模其中的 个重要参数 、的设定将很大程度上决定 模型的性能。是一种受自然启发的算法,由 于 年提出,该算法通过模拟天鹰在捕食过程中的 种不同的行为来不断进行迭代寻找全局最优解 。天鹰算法是基于群体的方法,优化规则从初始群体开始,初始群体是在上下界之间随机产生的,具体形式如下:,|(),(),()式中:,为第 个种群第 只天鹰的位置(指 的 个参数组合);为 ,之间的随机数;为种群中天鹰的数量(取 );为天鹰的种群数(指待优化的 个参数);和 为待解决问题的上下界。方法 为垂直俯冲的高空飞翔行为,该行为的数学表达式如下:()()()()()()其中()(),()式中:()为方法 下次的迭代位置;()为迭代前的最优点;和 为当前和最大迭代次数;()为迭代前位置的平均值。方法 为带短滑行的等高线飞行,该行为的数学表达式如下:()()()()()式中:()为方法 下次的迭代位置;()为 个位置中的任意一个;为飞行分布函数,有 ()式中:为固定值,取 ;和 为 之间的随机数;的表达式为:()()()|()式中:()为伽马函数;为固定值,取 。式()中 ()和 ()为螺旋状,为螺旋半径,为螺旋角度,有()()式中:为搜索周期数,取值为 ;为固定值,取 ;为 的整数;为固定值,取 ;为初始角度。方法 为低空飞行缓慢下降,该行为的数学表达式如下:()()()()()式中:()为方法 下次迭代的位置;和 为固定值,取 。方法 为行走抓取猎物,该行为的数学表达式如下:()()()()式中:()为方法 下次迭代的位置;()为当前位置;()()为平衡搜索质量函数;为天鹰的各种运动,()为天鹰从起点到终点的飞行斜率,取值从 到 。是一种可直接使用误差数据拟合其概率分布的非参数方法,具有无需对先验分布假设,使用范围更加广泛的优点,该方法对连续的概率密度函数描述更准确,有更好的拟合效果 。对概率密度函数进行积分,从而得到对应的累积分布函数,在得到累积分布函数以后,假设,为 个样本,则核密度估计有以下形式:()()()式中:()为概率分布函数;为待估计点;为一个随机样本点;()为权重函数;为带宽。方法使用的核函数有均匀核函数、高斯核函数、伊凡斯科尼科夫核函数、三角核函数等 。选用标准高斯核函数,如下式所示:()()()()则有功率波动区间上下界,如下式所示:()式中:和 为功率区间的上下界;为单点预测值;和 为固定置信度的误差区间。预测框架 -区间预测模型根据上述方法,所建立的 -区间预测模型主要包含以下部分,具体细节如下:将 模型中的最大特征数、树的最大深度、生成子树的数量作为优化对象,初始参数组合随机生成。:将对训练集数据拟合的均方根误差(,)作为优化目标函数,根据 值进行迭代寻优。:初始化种群中的天鹰位置,并且计算种群中每个天鹰位置的目标函数值,其中目标函数值比较小的天鹰位置作为当前种群的最优解 。当前天鹰位置作为最优位置。:当迭代次数 和最大迭代次数 满足 时,每次迭代生成一个随机数 ,当 时,根据式()执行方法 ,当 时,根据式()执行方法 。:当迭代次数 和最大迭代次数 满足 时,根据生成的随机数 ,当 时,根据式()执行方法 ,当 时,根据式()执行方法 。:若满足算法终止条件,利用得到的参数组合建立 预测模型,输入测试集,输出功率点预测值和误差生成集。:误差生成集数据量比较大,根据功率值分为 个不同的区间段,分别求出预测误差,分别使用 方法,根据式()得到不同置信度条件下的误差置信区间。:将点预测值对应 个不同的功率区间段,根据式()得到最终功率波动区间。-区间预测模型的整体流程,如陈申,等:基于天鹰优化算法的短期风电功率区间预测图 所示。图 -区间预测模型流程 模型评价指标将采用平均绝对误差(,)及 这 种指标来评估点预测精度,其表达式如下:()()()式中:为预测功率点的数量;和 分别为第 个样本的功率预测和实际数值。针对功率区间预测的效果,使用区间覆盖率()与区间平均带宽()来评估。表示实际功率落于所预测区域内的机率,可用来评价模型的可行性;指标可以评估预测模型的清晰度。),()()式中:为 的数值;为第 个点的实际功率;和 分别为第 个点预测功率值的上下限;为用于判断真实功率是否落在预测区间内的中间变量;为预测点的个数。)()()式中:为 的数值;,为估计区间的上下界;为真实功率的变化区间,用作平均带宽的归一化数据处理;,当 固定时,的值越小,那么区间预测效果越好。由于在实验过程中发现,当预测区间平均带宽过大时,其与预测区间覆盖率组成的区间预测评估标准无法清晰地评估各个模型的区间预测性能,针对这个问题,定义了一个区间预测效果的综合评价指标,即区间平均带宽覆盖率()。)()式中:为 的数值;平均带宽覆盖率数值越高,区间预测的性能越好。实验结果分析 实验数据集使用的风力发电数据集是位于江苏如东的海上风电场风机所收集的。风机的轮毂高度为 ,该风场实际的监测数据包括测风塔状态信息的监测,包括轮毂处的风速和风向数据等,风电场的 系统记录每一台风机的实际风电功率输出值,所有以上数据的时间分辨率为 ,采集时间为 年 月至 年 月。在风电功率预测领域,获取未来风速数据的主要技术手段就是使用 模式对未来一段时间内的风速进