2023-05-10计算机应用,JournalofComputerApplications2023,43(5):1647-1654ISSN1001-9081CODENJYIIDUhttp://www.joca.cn结合注意力机制与深度强化学习的超短期光伏功率预测丁正凯1,2,傅启明1,2*,陈建平2,3,4,陆悠1,2,吴宏杰1,方能炜4,邢镔4(1.苏州科技大学电子与信息工程学院,江苏苏州215009;2.江苏省建筑智慧节能重点实验室(苏州科技大学),江苏苏州215009;3.苏州科技大学建筑与城市规划学院,江苏苏州215009;4.重庆工业大数据创新中心有限公司,重庆400707)(∗通信作者电子邮箱fqm_1@mail.usts.edu.cn)摘要:针对传统光伏(PV)功率预测模型受功率随机波动性影响以及易忽略重要信息导致预测精度低的问题,将注意力机制分别与深度确定性策略梯度(DDPG)和循环确定性策略梯度(RDPG)相结合提出了ADDPG和ARDPG模型,并在此基础上提出一个PV功率预测框架。首先,将原始PV功率数据以及气象数据标准化,并将PV功率预测问题建模为马尔可夫决策过程(MDP),历史功率数据和当前气象数据则作为MDP的状态;然后,将注意力机制加入DDPG和RDPG的Actor网络,赋予状态中各个分量不同的权重来突出重要且关键的信息,并通过深度强化学习智能体和历史数据的交互来学习数据中的关键信息;最后,求解MDP问题得到最优的策略,作出准确的预测。在DKASC、AliceSprings光伏系统数据上的实验结果表明,ADDPG和ARDPG在均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)上均取得了最优结果。可见,所提模型能够有效提高PV功率的预测精度,也可以推广到其他预测领域如电网预测、风力发电预测等。关键词:深度强化学习;注意力机制;光伏功率预测;深度确定性策略梯度;循环确定性策略梯度中图分类号:TP183;TP391文献标志码:AUltra-short-termphotovoltaicpowerpredictionbydeepreinforcementlearningbasedonattentionmechanismDINGZhengkai1,2,FUQiming1,2*,CHENJianping2,3,4,LUYou1,2,WUHongjie1,FANGNengwei4,XINGBin4(1.SchoolofElectronicandInformationEngineering,SuzhouUniversityofScienceandTechnology,SuzhouJiangsu215009,China;2.JiangsuKeyLaboratoryofIntelligentBuildingEnergyEfficiency(SuzhouUniversityofScienceandTechnology),SuzhouJiangsu215009,China;3.SchoolofArchitectureandUrbanPlanning,SuzhouUniversityofScienceandTechnology,SuzhouJiangsu215009,China;4.ChongqingIndustria...