温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
面板
回归
地区
行业
用电量
空间
协同
预测
模型
研究
王凌谊
用电252供用电DISTRIBUTION&UTILIZATION第 40 卷 第 2 期2023 年 2 月摘 要:中国大部分地区目前还处在工业化中后期阶段,行业用电在全社会用电量中占有较大比重,随着区域协同发展政策的实施,各地区内部行业间联系日益紧密,针对地区内部行业用电量预测问题,传统单维度历史序列分析无法满足需求。介绍一种基于关联规则发掘算法确定行业电量增长主导因素的方法,结合面板数据建立区域行业用电量空间协同预测模型,模型基于面板协整关系实现多地区行业用电量预测。以中国南方五省非金属行业用电量及相关经济数据为例进行实证研究,验证了所提出的空间协同预测模型的可行性与有效性。关键词:行业用电量;主成分分析;面板回归;空间协同预测;电量预测中图分类号:TM721 文献标志码:A DOI:10.19421/ki.1006-6357.2023.02.0080 引言2018年7月,国家能源局、国家发展和改革委员会发布关于积极推进电力市场化交易进一步完善交易机制的通知(发改运行20181027号)1。通知指出,2018年将选择部分重点行业电力用户,率先全面放开发用电计划试点,进一步扩大交易规模、完善交易机制,形成新的改革突破口和着力点。在改革的背景下,挖掘地区行业用电量增长潜力,把控地区行业用电量变化走向对改革的顺利进行有着重要的战略意义。中长期用电量需求预测是制定电力电量平衡及能源布局规划的重要基础,科学高效的预测方法对于电力系统的经济安全运行,乃至整个地区的社会经济发展至关重要1-5。目前,中长期电量预测的对象大多是关于地区的总用电量,地区规模越大,利用传统的趋势外推方法得到的预测精度就越高。但是随着我国经济发展进入新常态,这种预测模式的准确度值得商榷。同时,分行业电量是地区全社会用电量的重要组成部分,而不同行业用电影响因素不同、电能消费特性存在差异,导致变化规律也各有特点,针对典型行业用电量预测方法开展研究,不仅可以进一步提高地区总电量的预测准确度,同时也具有理论研究价值。建立多地区的行业用电量空间协同预测模型,其相关研究不仅使多地区行业用电量数据得到更为有效的利用,也将给出更科学、更精细化的预测结果,为各地区的电力调度规划部门开展相关预测工作提供参考。传统的用电量预测研究多在单一地区的不同时间尺度上开展,随着区域协调发展战略的实施,对用电量的预测研究逐渐从时间尺度延伸至空间尺度,从传统的单地区用电量预测向多地区用电量协同预测发展。目前国内外针对空间尺度下的用电量预测方面的研究多集中于空间负荷预测(space load forecasting,SLF)。文献6对空间负荷预测的发展情况做了详细的调查研究,介绍了空间负荷工作中的小区划分、负荷发展特性和负荷同时率等问题。文献采用S曲线进行拟合预测,但预测精度有待提高。文献7提出基于混合高斯分布与主成分分析(principal component analysis,PCA)的城市空间负荷预测方法,对多尺度空间分辨率下的负荷进行建模分析,并利用粒子群算法进行空间尺度上的多级协调。但在地区负荷影响因基于面板回归的地区行业用电量空间协同预测模型研究王凌谊1,王志敏1,钱纹1,时亚军2,顾洁2,胡凯1,刘娟1(1云南电网有限责任公司电网规划建设研究中心,云南 昆明 650011;2上海交通大学电子信息与电气工程学院,上海 200240)基金项目:国家重点基础研究发展计划支持项目(2016YFB0900 100);上海市科学技术委员会重大项目(18DZ1100303)。Supported by National Basic Research Program of China(2016YFB0900100);Science and Technology Commission of Shanghai Municipal(18DZ1100303).引文信息王凌谊,王志敏,钱纹,等基于面板回归的地区行业用电量空间协同预测模型研究J 供用电,2023,40(2):52-59WANG Lingyi,WANG Zhimin,QIAN Wen,et alResearch on spatial collaborative forecasting model of regional industry electricity consumption based on panel regressionJ Distribution&Utilization,2023,40(2):52-59供用电2023年第2期-第二部分-2-6.indd 52供用电2023年第2期-第二部分-2-6.indd 522023/2/13 14:282023/2/13 14:28用电253供用电DISTRIBUTION&UTILIZATION第 40 卷 第 2 期2023 年 2 月素识别方面可供选择因素较为单一。文献8通过灰色聚类对样本进行分类,从而得出性能更好的样本。建立最小二乘支持向量机(least squares support vector machines,LSSVM)模型对相应的分类样本进行训练。经过有效训练的LSSVM可以完成复杂的空间载荷及其影响因素的非线性回归建模。最后采用真实数据来测试所提出的方法证明其有效性。文献9在支持向量机模型的基础上,通过构建模糊信息粒化的负荷样本,来改进实现空间尺度上的负荷预测分析。上述研究多着重于电量(负荷)的空间分布特征,对各地区用电量序列之间的特征挖掘方面关注度较低。随着区域协同发展政策的不断推进,不同地区行业间的联系日益紧密。对地区行业用电量预测来说,传统的单维度历史序列分析已不能满足需求,本文引入空间计量经济学理论中的面板数据的概念,通过对面板回归模型进行改进来实现行业用电量的空间协同预测分析。1 基于主成分分析的行业电量增长主导因素识别法地区总用电量由各行业电量及生活用电组成,受区域经济发展阶段的影响,全国绝大部分区域内产业总用电量所占的比例占绝对优势。不同行业用电影响因素不同,电能消费特性存在差异,导致变化规律也各有特点,为了准确地对行业用电量进行用电分析,在建立预测模型前需要对影响行业电量增长的因素进行提取识别。行业用电需求变化常常受到众多不同因素的影响,目前国内外对用电影响因素识别方法研究分析的对象包括社会总用电量或分产业用电量,研究所涉及的因素大多为气温因素或经济因素,行业用电量影响因素识别研究尚未形成较为成熟的方法体系。本小节将从行业用电量的多因素系统性影响角度出发,利用主成分分析法对相关社会经济发展指标进行降维,提取各经济因素对行业电量增长的贡献度。PCA本质上是化繁为简的降维(即空间压缩)技术和指标数尽量压缩的综合评价方法。PCA的目的是通过分析原来较多可观测指标之中所反映的个体信息,从中提取出较少的综合性指标,该分析方法的基本任务是根据样本的观测值确定应该构造多少个综合指标(主成分),并构造出各主成分的表达式10。1)输入样本观测值X为:(1)式中:xij为第i个观测样本的第j个维度指标;n为样本个数;p为指标维度数。2)计算各指标的样本均值和样本标准差sj为:(2)(3)3)对xij标准化,计算得到样本相关系数矩阵R:(4)式中:yij为标准化矩阵第i行第j列的元素;rij为相关性矩阵R第i行第j列的元素;i=1,2,n,j=1,2,p。由于rii=1,rij=rji,即R是对称阵,只需计算其下三角阵。4)求R的特征值及特征向量。设12p0为矩阵R的p个特征值,向量(j=1,2,p)为第j个特征值j所对应的正规化特征向量。5)按累积方差贡献率建立主成分。将k从1开始逐次增加,计算累计方差贡献率,即的值,直至累计方差贡献率首次大于等于95%(或90%)时,确定此时k值,从而得到前k个主成分Zj(j=1,2,k):(5)式中:Zj为第j个主成分分量;为第i个正规化的输入指标。基于主成分分析理论,基于主成分分析的行业用电量主导因素提取流程如图1所示。具体流程为:1)从历史统计数据中提取收集行业用电量数据及相关的社会经济发展指标数据。2)基于Pearson相关系数11分析得到行业用电供用电2023年第2期-第二部分-2-6.indd 53供用电2023年第2期-第二部分-2-6.indd 532023/2/13 14:282023/2/13 14:28用电254供用电DISTRIBUTION&UTILIZATION第 40 卷 第 2 期2023 年 2 月量与各社会经济发展指标的相关性大小,提取相关性较高的经济发展指标。3)利用主成分分析法对上述经济发展指标进行主成分提取,针对提取的主成分构建行业电量与相关因素的主成分方程,定量计算得到其对行业用电量增长的贡献度大小。4)对主成分方程的结果进行解释和评估,得到行业用电量增长的主导因素。和普适性。2)在对面板数据进行建模的过程中可以加入虚拟变量或是对随机误差项进行分解,以更全面地分析提取行业用电量影响因素特征。3)基于面板数据的建模相较于单时间序列反映了更多动态信息与实证结果,在解决实际问题中适应性更强。4)面板数据由于其数据维度的复杂度提升可以构造相关性更复杂的实证模型。基于面板数据的特性,采用面板回归模型对行业用电量进行空间协同建模预测,有助于全面地反映不同地区行业用电量之间的内在联系,也能使地区行业用电量数据得到更为有效的利用。2.1.1面板单位根检验在构建基于面板数据的行业用电量回归模型之前,与传统时间序列数据类似,为了避免出现“伪回归”,需要对待分析数据集进行平稳性检验,本小节将详细介绍面板单位根检验的基本理论。目前较为成熟且广泛应用于空间计量经济学领域分析的面板单位根检验法包括以下3种:LLC检验、IPS检验、Breitung检验13。若行业用电量面板数据未通过平稳性检验,可通过差分处理或取自然对数的方法对原数据序列进行处理,重复上述过程直至面板数据达到平稳。2.1.2面板协整检验基于面板单位根检验法,进一步引入面板协整检验来描述变量之间的中长期均衡关系。针对行业用电量通常用来检验行业用电量及其相关影响因素之间的协整关系。根据面板协整检验思路的不同大致可分为以下两个方向:基于时间序列中的E-G两步法衍生得到的Kao检验14与Pedroni检验法15;以及基于时间序列中的Johansen协整检验理论衍生得到的Westerlund检验16。基于行业用电量面板数据的特征,拟利用Kao检验和Pedroni检验进行面板协整检验,具体检验过程详见文献13-15。2.2 空间协同预测模型构建本小节将基于面板协整基本理论,结合行业用电量的特征,构建行业用电量空间协同预测模型。2.2.1基于面板数据的回归模型设定基于面板数据的截面性质,可以得到比单独的时间序列更复杂的结构模型,针对行业用电量的特征建立行业用电量面板回归模型,可表示为:图1 基于主成分分析的行业用电量主导因素提取流程Fig.1 Leading factor extraction process of industry electricity consumption based on principal component analysis历史数据用电量主导因素Pearson相关性系数分析主成分提取主成分方程建立解释评估2 空间协同预测模型构建流程面板数据具有较为复杂的数据形式,同时包含时间序列与截面数据序列,可以更全面地反映不同变量之间的内在联系12。本节引入面板回归模型,建立基于不同地区的行业用电量空间协同预测模型。2.1 面板协整基本理论面板数据是包括时间序列数据与截面序列数据的二维数据,从纵剖面(longitudinal section)观察,面板数据由多个不同的时间序列数据组成;从横截面(cross section)观察,面板数据是多个个体在某一时间点构成的截面数据。对行业用电量面板数据来说,既包括单地区行业历史用电量数据,又包括不同地区行业用电量在同一时间点的截面数据,面板数据相较于传统单时间序列数据通常具有以下优点:1)面板数据的观测