温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
滚动
时间
市场价格
分解
集成
预测
研究
范丽伟
第 卷第期 年月 中国管理科学 ,文章编号:():基于滚动时间窗的碳市场价格分解集成预测研究范丽伟,董欢欢,渐令(中国石油大学(华东)经济管理学院,山东 青岛 )摘要:提高碳市场价格预测准确性对于交易风险监测以及碳市场平稳发展具有重要价值。针对复杂的、非线性碳市场价格数据的短期预测误差偏大、分解过程易产生数据泄露问题,提出了基于滚动时间窗的 分解集成预测框架。首先,选取时间窗数据,继而借助奇异谱分析将时间窗内碳价序列分解重构为高、低频序列;然后,使用支持向量回归方法对高、低频序列分别进行预测;最后,加和集成预测结果,得到下一时刻的碳市场价格预测值。通过不断更新时间窗的数据内容,动态执行“分解预测集成”过程,实现碳市场价格的实时预测。研究结果表明,本文所提出框架表现出优异且稳定的预测性能,在碳市场价格预测研究中具有良好的适用性和有效性。关键词:碳市场价格;分解集成预测;奇异谱分析;滚动时间窗中图分类号:;文献标识码:收稿日期:;修订日期:基金项目:国家重点研发计划资助项目();国家自然科学基金资助项目()通讯作者简介:范丽伟(),女(汉族),山东青岛人,中国石油大学(华东)经济管理学院,教授,博士生导师,研究方向:能源经济系统建模分析、数据挖掘与商务智能,:引言碳排放权交易以市场机制助推绿色低碳发展,是我国落实减排行动,实现碳达峰目标和碳中和愿景的重要抓手。经过多年的探索,我国碳排放权交易市场从政策规划走向实践运行,并逐步从区域试点推向全国范围,取得了一系列实质性进展和阶段性成果。然而,碳市场在初显减排作用的同时,很容易受到内部机制和外部环境的影响,其运行过程面临着较大不确定性,导致碳市场价格波动剧烈、交易风险加大,这不仅会直接影响到企业的经济效益,还关系到国家推进控排减排工作的进程,给从事碳交易的参与者和管理者造成了很大困扰。因此,分析碳市场价格波动特征,准确预测碳价变化趋势,对投资者规避风险,最大化资产价值以及监管部门科学合理地制定相关机制,进而充分发挥碳市场作用具有重要价值。综合国内外学者已有研究成果,可以发现,碳市场价格预测模型大体可以分为单一模型和混合模型两类。单一模型试图仅通过一个算法或技术来实现对碳市场价格的预测,常用的方法包括:传统 计 量 与 统 计 方 法、人 工 智 能 方 法 等。诸 如 、(,)等传统计量与统计方法简单、方便、易解释,曾一度备受学者推崇,但其建立在一定的假设基础条件之上,对数据平稳性、线性等要求较高。随着碳市场的发展与完善,此类方法在预测具有非线性、非平稳特征的碳市场价格时表现出较明显的局限性,难以满足实际需要。相较而言,由机器学习驱动的人工智能方法灵活度高、泛化能力强,逐渐被应用于碳市场价格预测研究中。例如,朱帮助和魏一鸣基于 方法构建了国际碳市场价格预测模型;等提出了一种多层感知器神经网络模型来预测碳价;结合神经网路和自适应神经模糊推理系统实现了对碳价准确、及时的预测。上述不同的人工智能方法在碳市场价格预测研究中均进一步带来了预测精度的提升。然而,对于具有多种复杂特征的碳市场价格数据,单一模型的侧重点和应用场景有限,难以全面捕捉碳市场价格序列的波动规律。随着预测要求的不断提高,一些学者尝试性地结合数据处理、特征选择、参 数 优化 和 预测 算 法等,并 由此提出了混合模型。其中,分解集成模型在预测过程中加入了数据分解技术,可以将原始时间序列分解为一系列具有不同特征的分量,简化了序列中不同信息间的干扰 ,降低了计算复杂度,也受到了越来越多学者的青睐与应用 。如 等 提出了 碳期货价格预测模型,应用时在统计量度和交易绩效方面取得了优异表现;等 结合 和随机森林、支持向量机等六种机器学习方法来构建碳价预测模型;崔金鑫和邹辉文 建立了一种 混合模型,并证明了其稳健性和优越性;和 在对国内碳价进行研究时发现 混合模型可以大幅提高预测精确度;等、张晨和杨仙子、等、等 分别采用经验模态分解、极点对称经验模态分解、互补集合模态分解、变分模态分解对碳市场价格序列进行处理,再结合分量特征建模预测,均取得 了 较 好 的 预 测 效 果;和 构建了 模型,结合和进行二次分解以改进预测精度。上述研究中分解集成模型的预测效果均优于单一模型,表现出优异的预测性能,体现了数据分解处理在碳市场价格预测研究中的必要性。但是,现有研究中的分解预测流程存在两个问题:)通常先对原始时间序列进行整体分解,再划分训练集和测试集,这一处理流程隐含地假设了未来数据可用,模型可能会发生数据泄露且无法应用于实际;)仅在建模前对时间序列进行一次分解操作,没有考虑到当序列中加入新数据时,分解得到的各个分量会发生明显变化的情况。并且较多采用的经验模态分解及其衍生方法固有的端点效应问题可能会使分解结果两端数据发散失真,难以快速捕捉序列的变化。相较而言,奇异谱分析具有严格的数学理论和完整的计算过程,不仅能够辨识并提取出原始时间序列中所隐含的不同成分,而且其分解得到的奇异值反映了不同成分的波动频率,为高低频划分提供了判断依据。作为一种非参数分解处理方法,奇异谱分析已在航空客运预测,、大 宗 商 品 价 格 预 测、电 力 价 格 预测、风电功率预测,、汇率预测 等非线性、非平稳、含噪声的复杂时间序列的分析与研究领域被证明有效,然而在碳价预测研究中尚未得到足够的关注。鉴于此,本文提出一种基于滚动时间窗的 碳市场价格分解集成预测框架,并以我国湖北碳试点市场价格为例进行预测分析。本文研究贡献主要体现在以下三点:)在滚动时间窗的基础上构建动态碳价分解集成预测方法,在避免数据泄露问题的同时保证了预测模型的及时性和有效性;)针对非线性碳价数据的短期预测误差偏大、经验模态分解等数据处理方法存在端点效应等问题,首次将奇异谱分析方法引入到碳市场价格预测研究中,拓展了奇异谱分析方法的适用领域,也为碳价分解处理提供了新方向;)所提基于滚动时间窗的 分解集成预测框架具有优越且稳健的性能,为碳市场价格预测建模提供了新思路。方法与原理 滚动时间窗当描述时间序列某一时刻的数值与距离当前时间点相近 的 数 据 有 较大相关性这种 时 变 状 态时,模型的输入和输出数据应该不断更新变化,这就需要引入滚动时间窗技术。滚动时间窗的原理可简单描述为:假设给定一组连续数据样本,其中时刻的状态可由时刻到时刻的组数据刻画。因此,选用到时刻区间内的数据建立模型并对时刻进行预测;等到下一时刻,保持时间窗长度不变,丢弃时刻的数据,加入时刻数据,然后利用到时刻的数据建立模型,以得到时刻的预测输出。随着时间推移,动态更新刻画状态的组连续数据区间。奇异谱分析奇异谱分析(,)是 年 在海洋学研究中提出的一种处理非线性时间序列的方法,其通过对时间序列构造出的轨迹矩阵进行分解、重构等操作,以提取出原始序列中具有独立信息的不同成分。对于给定长度为的时间序列(,),奇异谱分析首先通过嵌入和分解提取出包含原始序列独立信息的子矩阵,然后对子矩阵进行分组和对数平均化,重建原始序列的独立分量,具体过程如下:()嵌入。选择合适的嵌入维数(),将序列转化为轨迹矩阵。其中,一般不宜超过,且如果可以粗略确定数据的周期特性,最好将其设定为周期的整数倍。()()分解。对 进行特征求解,得到特征值,()及对应的正交特征向量,。令为非零特征值对应的最大下标,即 ,有,则轨迹矩阵可表示为:()其 中,为 奇 异 值,中国管理科学 年(,)。()分组。将(,)划分成个不相交的不同组,并将每组内所包含的矩阵相加,假设,有为第组对应的下标,则:()借助奇异熵概念,按照式()考察各个奇异值包含的信息量。基于奇异熵理论可知,若奇异熵增量在第阶之后数值较小且降幅平稳,则说明第阶至第阶的奇异值包含了主要信息,反映了时间序列的大体走势,而剩余的奇异值所包含的信息较少,可视为序列中短暂微小的变化。()()()()对角平均。假设分组后得到的矩阵 中包含的元素可表示为,即()(,),将各矩阵按照下式进行对角平均重构成长度为的时间序列 (,),其中 (,),(,)。,()支持向量回归支持向量机(,)是 和 在统计学习理论基础上,以结构风险最小化为原则所提出的一种机器学习算法。其中,支 持 向 量 回 归(,)是 在回归预测问题中的一个扩展和应用。给定训练样本(,)有,为输入变量,为相应的输出变量。对于非线性回归问题,使用非线性函数()将样本从低维映射到高维,然后在高 维 特 征 空 间 构 造 线 性 回 归 模 型()(),和为待估参数。方法的核心是假设能够容忍模型输出与真实值之间最多有的偏差,并根据最大间隔宽度和最小损失函数,采取下述目标函数进行参数寻优:,()()()()()()其中,()为惩罚因子,为不敏感损失函数。考虑允许拟合误差情况,引入松弛变量和,重写优化问题。然后采用拉格朗日乘子法得到 的对偶问题:,()()()()()()(),()通过求解拉格朗日乘子和,即可得到原始问题的最优解()()。为规避直接计算样本映射到高维空间后的内积,选择适当的函数使得(,)()(),最终相应的回归函数可表示为:()()(,)()其中,(,)为核函数,常见的核函数有线性核函数、多项式核函数、径向基函数和 函数等。碳价分解集成预测框架根据上述方法原理,本文针对碳市场价格提出了基于滚动时间窗的 分解集成预测框架,基 本 流 程 如 图所 示。具 体 步 骤 可 描 述如下:第一步:时间窗数据选择。设置滚动时间窗,若确定时间窗口长度为,则选取待预测时刻之前个连续碳市场价格数据组成训练集。第二步:时间序列分解重构。采用奇异谱分析方法,并基于奇异熵理论将时间窗内的碳价序列分解重构为低频和高频序列。第三步:样本数据集重构。结合低频和高频序列的特征,分别确定合适的滞后阶数,将高、低频时间序列 转换 为 包 含 输 入向量和 输 出 值 的 样 本 数据集。第四步:模型训练预测。首先,分别使用低频和高频训练数据集来训练 模型,采用网格搜索与交叉验证的方式寻找模型的最优参数。然后,将待预测时刻对应的输入向量代入到训练好的模型中,计算出高频和低频预测值,并通过线性加和得到最终结果。第五步:若要预测下一时刻的碳价,则通过加入新数据,丢弃距离当前时刻最远的数据的方式更新时间窗,并返回第二步。第期范丽伟等:基于滚动时间窗的碳市场价格分解集成预测研究图基于滚动时间窗的 碳价预测框架湖北碳市场价格预测分析 数据选取与描述自 年 关于开展碳排放权试点工作的通知 颁布以来,深圳、湖北和北京等八个碳排放权交易试点市场陆续上线交易,对建设既符合我国国情又具有当地特色的碳交易体系展开了积极探索。经过多年的实践,湖北碳市场覆盖了电力、钢铁等高耗能高排放行业,成交量和成交额长期处于全国领先地位,交 易活 动较 为 活跃,有效 交 易 日占比 高达,表现出较好的整体性和代表性。因此,本文选取湖北碳交易市场碳排放权配额现货日成交价进行研究,数据来源于湖北碳排放权交易中心官方网站。样本区间为 年月日 年月 日,剔除节假日后共计 个数据,碳价序列的描述性统计见表。可以看出,碳价最大值与最小值之间相差 ,标准差为 ,单位根统计量大于、和 显著性水平下的检验临界值,碳价序列波动剧烈且是非平稳的,具有明显的不确定性和复杂性。表湖北碳市场价格描述性统计统计量偏度峰度平均值标准差最小值最大值 结果 注:检验临界值为 ()、()、()。中国管理科学 年采用可视图算法将碳市场价格时间序列映射到复杂网络中,构造出如图所示的湖北碳价可视图网络。进一步对可视图网络的度分布、平均路径长度和聚集系数等拓扑特征进行分析。在图双对数坐标下,可视图网络的度分布函数 ()和度值大小 近似呈现为一条负斜率的直线,即度分布服从幂律分布(),幂指数 。说明碳价可视图网络具有无标度特征,并且可以推断湖北碳市场价格序列是一个分形时间序列。另外,碳价可视图网络与随机重排网络平均路径长度随节点的增长特性表现出差异,且相较于同等规模的随机网络,碳价可视图网络的聚集系数处于较高水平,表明碳价可视图网络具有小世界特性,碳价时间序列内部具有一定的相关性