分享
基于CatBoost算法的短期光伏功率预测方法_陈海宏.pdf
下载文档

ID:498338

大小:1.92MB

页数:9页

格式:PDF

时间:2023-04-07

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 CatBoost 算法 短期 功率 预测 方法 陈海宏
第 42 卷 第 2 期2023 年2 月Zhejiang Electric PowerVol.42,No.02Feb.25.2023基于CatBoost算法的短期光伏功率预测方法陈海宏1,易永利1,黄珅2,韩静怡2(1.国网浙江省电力有限公司温州供电公司,浙江 温州 325000;2.亿可能源科技(上海)有限公司,上海 200090)摘要:光伏电站发电功率的间歇性与波动性对电网安全、稳定、经济运行的影响日益明显,因此需要不断提高光伏发电功率预测准确率,为电网灵活调度与规划提供准确信息。首先,介绍了短期光伏发电功率的预测算法、特征方程、预测流程以及评价指标。接着,通过SHAP方法对训练集所构造特征进行分析筛选,使用CatBoost算法进行训练。最后,通过与使用相同特征的其他机器学习算法模型预测精度的对比,表明所提方法有效提高了预测性能,证实了基于CatBoost算法、融合多维特征的模型在光伏功率预测中的优势。关键词:光伏发电;功率预测;CatBoost;SHAPDOI:10.19585/j.zjdl.202302009 开放科学(资源服务)标识码(OSID):Research on a short-term photovoltaic power prediction method based on CatBoostCHEN Haihong1,YI Yongli1,HUANG Shen2,HAN Jingyi2(1.State Grid Wenzhou Power Supply Company,Wenzhou,Zhejiang 32500,China;2.EQuota Energy Technology(Shanghai)Co.,Ltd.,Shanghai 200090,China)Abstract:The intermittent and fluctuating generation power of PV power plants has an increasingly prominent impact on the safe,stable,and economical operation of power grids.Therefore,it is required to continuously improve the accuracy of PV power prediction to provide accurate information for flexible grid dispatching and planning.First,the prediction algorithm,characteristic equation,prediction process,and evaluation index of short-term PV generation power are introduced.Afterward,the features constructed in the training set are analyzed and filtered using the SHAP,and the training is performed using the CatBoost.Finally,by comparing the prediction accuracy with other machine learning algorithm models using the same features,the paper indicates that the proposed method can improve the prediction performance and confirms the advantages of the CatBoost that incorporates multidimensional feature models in PV power prediction.Keywords:PV power generation;power prediction;CatBoost;SHAP0引言目前,在“双碳”背景下1,我国正在全力推进光伏发电的大规模开发与高质量发展,光伏发电呈现出良好的发展前景2-3。随着集中式光伏发电开发的有序推进,我国在大力推广光伏产业的同时,也在开展光伏发电功率预测相关工作4。在电网调度过程中,如果在获得精确的光伏发电功率预测结果的基础上制定生产计划,则能够保障电力系统连续、可靠供电,有效降低发电成本。但光伏发电功率数据的准确性问题加大了光伏发电功率预测的难度,增加了光伏发电功率预测的不确定性,当光伏电站并网运行时,电力系统的稳定性与经济性会受到影响5。可靠的预测算法模型和精细的气象预报数据是准确预测光伏发电功率的决定性因素,而多变的微气象环境使功率预测变得更加复杂,传统的预测方法在建模难度与预测精准度上受到诸多限制。因此,全面了解和掌握先进的光伏发电功率预测方法、利用人工智能算法实现更加精确的光伏发电功率预测,是提升电力系统可靠性与经济性的有效解决方案6。近年来,国内外学者通过不同算法建立模型,提出了多种光伏发电预测方法。刘家庆等7借助ARIMA(自回归差分平均)方法和SVR(支持向量机)算法,通过考虑功率修正建立模型从而预测光基金项目:国网浙江省电力有限公司科技项目(B311WZ220002)第 42 卷伏发电功率。李秉晨等8基于Kmeans和CEEMD(完备总体经验模态分解)、PE(排列熵),与LSTM(长短期记忆)神经网络结合建立了用于光伏发电功率预测的模型。刘国海等9提出了一种结 合 注 意 力 机 制 与 GRU(门 控 循 环 单 元)的Attention-GRU短期光伏发电功率预测模型。A.I.Salamanis等10提出了一个综合的基准框架,用于多步骤短期光伏发电预测的分析型、数据型和混合型模型。A.A.H.Lateko等11提出了一种基于堆叠集成模型的提前一天到三天的光伏功率预测方法。C.C.Liu等12根据预测过程、需求、时间和空间尺度对预测方法进行分类,罗列出了合适的评价指标。以上算法中,ARIMA等方法对于非线性时序的预测效果较差,而LSTM、GRU算法在模型训练过程中有较多超参数需要考虑,都不能对文字标签进行处理。本文提出了一种基于CatBoost算法的短期输出功率预测模型,该方法对于类别型特征有较好的识别能力,且降低了对超参数的要求。结合时间特征、历史光伏功率特征和气象因素特征对未来的光伏发电功率进行预测,同时采用 SHAP(SHaplay加法解释)方法对所构造的特征进行筛选,进一步提高了光伏发电功率预测精度。最后通过实例验证了所提模型在光伏发电短期预测中的优越性和可靠性。1光伏发电功率短期预测研究常用的短期预测方法大致可分为线性预测法、非线性预测法和综合预测法13。1)线性预测法通过结合历史气象数据与历史输出功率数据来预测光伏发电功率。目前大多采用ARMA(自回归移动平均)、ARIMA、ARIMAX(扩展的自回归移动平均)3种方法。2)受气象因素的影响,光伏发电功率不稳定,为提升预测的精度,可以采用非线性预测法。首先通过对外界影响因素与光伏发电功率的分析,建立非线性模型,进而进行光伏发电功率预测14。3)综合预测法是将非线性预测法与线性预测法相结合产生的预测方法。与单一预测方法相比更为复杂,但预测精度也随之提升。1.1预测算法目前,为实现短期光伏发电的精确预测,提出了时间序列法、回归分析法、SVR、模糊预测法、人工神经网络等。诸多预测方法具有很好的预测精度,但因有过多的超参数调优,并且数据预处理过程中类别变量处理方式较为复杂,容易降低训练速度,影响预测效果。另外,考虑到气象因素与突发事件对光伏功率预测精度的影响,本文在前期有针对性地收集了光伏电站附近的数值气象预报数据、天气实况数据、光伏电站机组特性数据、检修计划数据、光伏电站出力数据等多种类型数据,训练AI(人工智能)预测模型,预测未来光伏发电出力2。由于光伏发电功率具有不平稳、非线性特征,且外围数据中存在较多类别变量(如天气类型等数据),因此本文尝试采用 CatBoost 算法建立光电预测模型15。1.1.1CatBoost算法CatBoost 和 XGBoost、LightGBM 是 GBDT(梯度提升树)的主要算法。相比于传统的GBDT,XGBoost算法得到的模型更加简单,LightGBM算法的训练速度更快,而 CatBoost 算法的准确率更高。CatBoost算法的机器学习参数少,支持类别变量且精度高,在处理类别数据方面具有显著优势,与其他算法相比,准确性更好并提高了泛化能力16。在光伏发电功率的预测过程中,可能会出现梯度偏差及预测偏移,从而导致过拟合问题,而 CatBoost 恰好能够有效解决该问题。此外,CatBoost算法减少了对广泛的超参数调整的需求,具有很高的鲁棒性。与 XGBoost、LightGBM 相比,CatBoost具有以下特点:1)插入了能够自动将类别型特征处理为数值型特征的新算法。2)通过组合类别特征处理不同特征的联系,丰富了特征维度。3)采用排序提升处理数据集的噪声点,解决了预测偏移的问题。4)采用完全对称树作为基模型,避免了过拟合问题,增加了可靠性,加快了预测进程。1.1.2CatBoost特征处理GBDT中存在离散的特征(类别型特征),此类特征在算法输入时需要经过处理。最简单的处理方法是Greedy TS,但Greedy TS采用类别特征68 第 2 期陈海宏,等:基于CatBoost算法的短期光伏功率预测方法对应标签的平均值来替换离散特征,当训练数据集与测试数据集的数据结构、数据分布不一致时,标签所替代的离散特征丢失了信息,会导致条件偏移。由此提出采用CatBoost算法对Greedy TS进行改进17。通过添加先验分布项,使得数据分布免受噪声 和 低 频 的 影 响,即 打 乱 数 据 集D=(xi.yi)i=1,n顺 序,打 乱 后 的 序 列 是=(1,n),遍历1到n,用遍历到的前p个记录计算类别型特征的数值,具体公式如下:p,k=jp-1 xj,k=xi,kYj+apjp-1 xj,k=xi,kYj+a(1)式中:p为添加的先验项;a为权重系数。1.1.3参数优化在参数优化方面有多种选择,最常用的是Grid Search和它的一些改进方法。1)Grid SearchGSA(网格搜索算法)是一种穷举搜索,它对输入到搜索空间的每个超参数进行组合。将各个参数的可能取值进行排列组合,列出所有可能的组合“网格”。通过循环遍历,尝试每一种组合,最后选择表现最好的参数组合为每个组合创建一个模型并进行比较。网格搜索是目前比较常见的超参数优化算法,其缺点也很明显:确定最优超参数是一个NP-Hard问题,因为需要处理的是超参数的组合,所以效率低下。2)Optuna超参数优化算法由于Grid Search没有包含任何结构化的方法来搜索最优超参数集,因此考虑采用新算法对其进行优化,以提高效率。Optuna超参数调优算法是基于贝叶斯优化算法中的树形帕曾优化器(Parzen)对模型参数进行优化的方法。Optuna可以通过不断试错的方法找到最好表现的最优超参数值,具有以下主要特征:可实现分布式并行优化;可修剪无希望调优的试验;通用于多个机器学习框架。Optuna主要基于运行的历史数据来确定接下来需要测试的超参数各值的组合。基于已有数据,选择一些超参数组合区域并在该区域中进行超参数搜索尝试。随着不断获取新的结果,它也将更新这一区域并继续搜索。在不断重复搜索、评价更新的过程中获取表现更好的超参数。Optuna可以在很复杂的空间中实现超参数优化;可以通过预测终止可能性较小的参数区间,把更多的算力用于可能性更高的区域以提高搜索效率。整体而言,这是一种基于改进贝叶斯的试错算法,当向某一区域尝试得到的效果变差即损失不再减小时停止该区域的搜索,

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开