温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
改进
XGBoost
地下工程
空调
系统
负荷
预测
冯增喜
计算机与现代化JISUANJI YU XIANDAIHUA2023年第1期总第329期0引言地下工程封闭运行时的保障资源有限,为最大化延长其运行时间,需最大程度节能。在地下工程中,通风空调系统的运行能耗占工程总能耗的比例高达50%60%1。因此通风空调系统的节能效果对延长地下工程封闭运行时间具有重要作用。而准确的负荷预测对于实现地下工程空调系统的高效运行和能源优化分配、调度具有重要作用。为提高负荷预测精度,基于机器学习的预测模型已成为专家学者们的研究热点,已有机器学习算法应用于各类预测问题。目前常用的机器学习算法有神经网络、支持向量机(Support Vector Machine,SVM)以及近年来新兴的XGBoost等。神经网络具有非线性映射、自适应、容错性强等特点,已有专家学者将神经网络应用于交通运输调度与优化2、降雨量预测3、空调能耗预测4与优化控制5等领域,并取得了较好的预测结果。然而,影响地下工程空调系统负荷的因素多,且具有多扰量混合、多周期叠加的特点6,若使用神经网络进行预测则会使网络结构复杂,从而导致训练速度慢7-8,且神经网络要求输入数据具有典型性。支持向量机泛化能力强、实用性好且具有优异的分类性能,已有专家学者将其用于故障诊断9-10。但是SVM算法的预测结果受核函数的选择基于改进XGBoost超参数优化的地下工程空调系统负荷预测冯增喜1,陈海越1,王涛2,赵锦彤1,李诗妍1(1.西安建筑科技大学建筑设备科学与工程学院,陕西 西安 710054;2.火箭军工程大学作战保障学院,陕西 西安 710025)文章编号:1006-2475(2023)01-0108-06摘要:针对地下工程空调负荷难以精确预测的问题,提出一种基于天牛须搜索算法(Beetle Antennae Search,BAS)优化极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)的负荷预测模型。该算法通过引入典型最优解引导机制优化常规BAS算法中的位置更新策略,同时采用线性递减策略对天牛的搜索步长进行修正,以实现更快达到全局最优点,提高收敛速度;并利用改进的BAS算法对XGBoost中的决策树个数、树的最大深度2个对模型预测精度有较大影响的超参数进行寻优,以获得XGBoost的最优参数组合,提高模型预测精度。最后,以某地下保障工程空调系统为研究对象,验证所提出的预测模型的有效性。关键词:地下工程;负荷预测;极限梯度提升;改进天牛须搜索算法中图分类号:TP29文献标志码:ADOI:10.3969/j.issn.1006-2475.2023.01.018Energy Consumption Prediction of Air-conditioning System in UndergroundEngineering Based on XGBoost Hyperparameter OptimizationFENG Zeng-xi1,CHEN Hai-yue1,WANG Tao2,ZHAO Jin-tong1,LI Shi-yan1(1.School of Building Services Science and Engineering,Xi an University of Architecture and Technology,Xi an 710054,China;2.Combat Support College,Rocket Force University of Engineering,Xi an 710025,China)Abstract:Aiming at the problem that it is difficult to accurately predict the air-conditioning system s energy consumption in underground engineering,an energy consumption prediction model based on the eXtreme Gradient Boosting algorithm(XGBoost)optimized by the Beetle Antennae Search(BAS)algorithm is proposed.The algorithm optimizes the position update strategy inthe conventional beetle algorithm by introducing a typical optimal solution guidance mechanism,and uses a linear decreasingstrategy to correct the search step size of the beetle,so as to achieve the global optimum point and improve the convergencespeed.The number of decision trees and the maximum depth of the tree in XGBoost,which have a greater impact on the prediction accuracy of the mode,are used to optimize by the improved BAS,so as to obtain the optimal parameter combination ofXGBoost and improve the model prediction accuracy.Finally,taking the air-conditioning system of an underground security project as the research object,the validity of the proposed prediction model is verified.Key words:underground engineering;load forecast;eXtreme gradient boosting;improved beetle antennae search algorithm收稿日期:2022-01-27;修回日期:2022-03-19基金项目:国家自然科学青年基金资助项目(51508446)作者简介:冯增喜(1979),男,陕西韩城人,副教授,博士,研究方向:建筑设备自动化,E-mail:;通信作者:陈海越(1996),男,陕西西安人,硕士研究生,研究方向:智能建筑,E-mail:。2023年第1期影响较大11,且核参数与惩罚参数的选取也较为复杂12-13,除 此 之 外,SVM 存 在 参 数 寻 优 过 程 复杂14-15、收敛速度慢等问题16。XGBoost作为一种新兴的集成学习算法,可以避免上述问题。XGBoost算法是对集成学习算法中较为常用的梯度提升算法的改进17,调节参数少、运行速度快18、预测准确度高、结果稳定且具有很好的泛化性能19。Zhang等17针对火箭储罐铝合金激光焊缝强度的回归预测问题,提出了一种基于 RFPCA-XGBoost 的预测模型。朱波等20将改进的 XGBoost算法用于空调系统的故障诊断。以上针对XGBoost算法的应用均获得了良好的预测结果。本文提出一种基于天牛须搜索算法(Beetle Antennae Search,BAS)优化极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)的负荷预测模型。1改进的XGBoost预测模型1.1XGBoost算法XGBoost算法属于可扩展机器学习系统21,基于梯度下降理论,对损失函数进行了二阶泰勒级数展开,通过串行迭代的方法学习每个基评估器,迭代时通过对前一级基评估器的错分样本设置较大的权重来提升预测性能,以指导弱学习器的训练。同时,在目标函数中引入了正则项,解决容易过拟合的问题22。XGBoost中基评估器的迭代过程可表示为式(1)的形式:y?i(k+1)=y?i(k)+fk+1(xi)(1)其中,y?i(k+1)为第i个数据在经过k+1个基评估器迭代之后的预测值,k表示基评估器的棵数,fk+1表示第k+1个基评估器的权重,xi表示第i个输入样本,为基评估器迭代时的步长,又称学习率,其值越大,迭代速度越快,但设置过大则有可能无法收敛,设置过小则有可能运行缓慢,通常默认为0.3。1.2基评估器的选择XGBoost可选用多种基评估器,最常用的有线性回归模型、Additive Regression Trees(ART)以及决策树模型3种。为确定具体选用何种基评估器,本节分别采用以上3种模型建立XGBoost预测模型,利用工程原始数据初步验证此3种模型的性能。本文采用决定系数R2衡量训练后的模型在测试集上的预测效果,R2越接近1,则表明模型训练结果越好。如图 1 所示,采用决策树模型作为基评估器的XGBoost,其100次训练的效果最佳,决定系数R2约为0.8;采用ART模型的XGBoost训练结果则稍差,R2约为0.7左右;而采用线性回归的XGBoost训练效果最差,其R2仅在0.2上下波动。根据以上结果,本文采用决策树作为基评估器建立XGBoost预测模型。当XGBoost算法采用决策树作为基评估器时,其目标函数可表示为以下损失函数和正则项的组合:L()t=i=1nl(yi,y?i(t-1)+ft(xi)+(fk)(2)(fk)=T+0.52(3)其中,l表示第i片叶子的损失函数,y?i(t-1)代表前t-1次迭代的预测值,(fk)是第t次迭代的模型的正则项,和是正则项的系数,T为叶子节点个数,表示叶子节点上的样本权重。对式(2)进行泰勒展开可得:L()ti=1n gift(xi)+0.5hift2(xi)+T+0.5j=1Tj2j=1T(i Ijhi+)j2+T(4)其中,gi与hi分别为样本xi的一阶和二阶导数,j为第j个叶子的输出值,I为叶子值的样本子集。XGBoost的目标函数值越小,则生成的决策树分支结果越好23。图13种基评估器训练效果对比1.3XGBoost参数的设置XGBoost算法调节参数少,其中决策树的棵数与树的最大深度2个参数对其预测精度影响最大。本文利用工程的原始数据进行以下实验,以初步验证这2个参数对模型的具体影响:设定树的最大深度为定值,改变决策树的棵数,观察决策树棵数变化对模型训练结果的影响;设定树的棵数为定值,改变树的最大深度,观察树的深度变化对模型训练结果的影响,结果如图2与图3所示。图2决策树数对模型的影响由图2和图3可知,单独调节树的棵数或深度都会对模型的训练结果产生较大影响。当2个参数设定值较小时,模型的训练结果均比较一般,随着设定值的增大,模型的R2迅速增加。但是,模型的R2在参数设定值到达一定程度后便不再有明显的增加,而是在一定范围内进行较大幅度的波动且无明显规律性。根据以上分析可知,由于模型的训练结果与参数的设定值并非严格的正相关,因此单纯地将参数设定值选决策树线性回归ART训练次数01020304050607080901000.80.70.60.50.40.30.2R20102030405060708090100基评估器的数目0.90.80.70.6R2冯增喜,等:基于改进XGBoost超参数优化的地下工程空调系统负荷预测109计算机与现代化2023年第1期得过大并不一定能够得到最佳的训练结果,而且实际建模时,需同时考虑2个参数的影响。此外,若用于影响因素多、数据量大的预测问题时,参数设置过大会使得生成的模型结构复杂,则运行时间会大大增加,效率低下。针对上述的调参局限性,本文拟采用寻优算法实现参数的自动寻优。1.4XGBoost超参数寻优目前常用的参数寻优方法有网格搜索、随