温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
SSA
LSSVM
住宅
工程造价
预测
研究
投稿网址:http:/ 沙 理 工 大 学 学 报(自 然 科 学 版)Journal of Changsha University of Science&Technology(Natural Science)Vol.20 No.3Jun.2023DOI:10.19951/ki.16729331.20220624001文章编号:16729331(2023)03013709引用格式:彭军龙,胡珂,王梦瑶,等.基于SSALSSVM的住宅工程造价预测研究J.长沙理工大学学报(自然科学版),2023,20(3):137-145.Citation:PENG Junlong,HU Ke,WANG Mengyao,et al.Research on residential project cost prediction based on SSALSSVMJ.J ChangshaUniv Sci Tech(Nat Sci),2023,20(3):137-145.基于SSALSSVM的住宅工程造价预测研究彭军龙,胡珂,王梦瑶,彭超(长沙理工大学 交通运输工程学院,湖南 长沙410114)摘要:【目的】提高建筑工程造价预测的准确性,进而为项目前期投资决策提供重要依据。【方法】针对工程实践中小样本数据和工程造价特征指标之间高维、非线性关系的特点,构建基于麻雀搜索算法(sparrowsearch algorithm,SSA)的优化最小二乘支持向量机(least squares support vector machine,LSSVM)造价预测模型SSALSSVM。首先,通过主成分分析法对住宅工程造价样本的输入指标数据进行处理,减少数据冗余;其次,采用SSA算法对LSSVM模型中的正则化参数c和核函数参数进行优化,以弥补LSSVM模型参数确定困难的缺陷;最后,将处理后的数据导入所构建的模型进行训练和预测,并通过相关系数、平均绝对百分比误差和均方根误差对模型的预测性能进行评价。【结果】与LSSVM模型、用灰狼优化算法优化的LSSVM模型和反向传播神经网络模型相比,SSALSSVM模型具有更好的泛化能力和更高的预测精度。【结论】本研究所构建的模型可以比较精准、高效地对实际住宅工程造价进行预测,同时可为工程前期投资决策提供一定参考。关键词:住宅工程;造价预测;主成分分析;麻雀搜索算法(SSA);最小二乘支持向量机(LSSVM)中图分类号:TU723.3文献标志码:0引言建筑工程造价预测是项目可行性研究的重要内容,准确的造价预测可协助建设单位实现更加科学的投资决策。在工程建设项目前期可获取的工程信息有限、设计深度不够等问题将会导致造价预测的精度和效率较低,不能满足建筑市场精细化发展的实际需要1。因此,快速、准确地进行建筑工程造价预测具有实践意义。为提高工程造价预测的精度与科学性,国内外学者们采用不同的方法构建工程造价预测模型。传统造价预测方法包括移动平均法、时间序列分析法和简单回归分析法等2。由于建设工程造价的影响因素多且复杂,这类传统造价预测方法在实际应用过程中的精度有待进一步提高3。随着人工智能技术的蓬勃发展,建筑工程造价预测方法越来越智能、高效。机器学习方法因其具有良好的非线性映射能力,被引入到了工程造价预 测 领 域,如 学 者 们 将 粒 子 群 算 法4(particleswarm optimization,PSO)、人工神经网络(artificialneuralnetwork,ANN)和 反 向 传 播(backpropagation,BP)神经网络5等智能机器学习算法应用于造价预测建模6。李玲玲7将人工神经网络与 Adaboostda 迭代算法、代价敏感方法相结合对建筑工程造价进行预测,提高了 ANN的泛化能力;何利娟8基于灰色理论构建多变量 GM(1,N)预测模型对哈密市的工程实例进行造价预测,该模型能够很好地反应变量间的动态关系;张晓东等9先对市政工程造价影响因素进行主成分分析,将主成分得分作为输入变量,再采用贝叶斯正则 化 算 法 构 建 带 外 源 输 入 的 非 线 性 自 回 归(nonlinear autoregressive with exogenous inputs,NARX)神经网络模型进行市政工程造价预测;收稿日期:20220624;修回日期:20220812;接受日期:20220822基金项目:国家自然科学基金资助项目(51578080);湖南省自然科学基金资助项目(2021JJ30746)通信作者:彭军龙(1976)(ORCID:0000000255850569),男,副教授,主要从事工程项目管理方面的研究。Email:投稿网址:http:/ 沙 理 工 大 学 学 报(自 然 科 学 版)2023年6月KIM 等10提出了案例推理(casebased reasoning,CBR)与遗传算法的混合预测模型,利用遗传算法优化特征权重,建立了建筑前期投资预估模型;ZHAO 等11将遗传算法与建筑信息模型(buildinginformation modeling,BIM)辅助分析相结合对项目成本进行了预测;YE12基于 240组高层住宅项目的竣工结算数据,将PSO算法与BP神经网络相结合对工程造价进行了预测。上述智能算法相较于传统造价预测方法,预测的准确度有所提高,对样本数的要求有所降低8,但这些算法仍存在较易出现局部最优的缺陷,必须在大样本数据训练的情况下才能得到较优结果13。为提高预测精度,本研究采用非线性拟合能力好、泛化能力强、能较好地避免陷入局部最优解、对小样本数据表现突出的最小二乘支持向 量 机(least squares support vector machine,LSSVM)对住宅工程进行造价预测14。此外,通过麻雀搜索算法(sparrow search algorithm,SSA)对LSSVM模型中的正则化参数和核函数参数进行优化计算,找到合适的参数,使LSSVM具有更快的收敛速度、更强的泛化能力以及更高的预测精度,建立了基于 SSALSSVM 的住宅造价预测模型,并通过工程实例分析以及与其他模型的预测结果进行比较,选择最优预测模型,以期为住宅工程项目前期投资决策提供参考。1相关理论及住宅造价预测模型的建立1.1LSSVMLSSVM 是在标准支持向量机(support vectormachine,SVM)基础上的一种重要改进,它选取误差平方和作为经验损失,用等式约束取代原算法中的不等式约束,不再需要求解复杂的二次规划问题,降低了求解难度,优化了算法的整体收敛速度,提高了计算结果的精度15-16。LSSVM 的实现过程如下:设定训练集S=()xi,yi,xi Rn1,yi R,其中,xi为输入项;yi为输出项;i=1,2,N;R为实数集;Rn1为n1维实数集;N为训练样本的数量。回归估计函数为:f(x)=T(x)+b(1)式中:为权值系数向量;(x)为非线性映射函数;b为偏置项。根据结构风险最小化原则,可以将 LSSVM的优化目标函数可以转化为:minJ(,e)=122+c2i=1Ne2is.t.yi=T()xi+b+ei(2)式中:J 为损失函数;ei为误差变量;c 为正则化参数。通过构造拉格朗日乘子i求解上述问题:L(,b,e,)=J(,e)-i=1NiT()xi+b+ei-yi(3)式中:L为拉格朗日函数。根据卡罗需-库恩-塔克(KarushKuhnTucher,KKT)条件,对式(3)中的各变量求偏导数:L=0 =i=1Ni()xiLb=0 i=1Ni=0Lei=0 i=ceiLi=0 T()xi+b+ei-yi=0(4)通过求解,消掉上述方程中的 和 ei,最终得到LSSVM回归函数为:f(x)=i=1NiK()x,xi+b(5)式中:K(x,xi)为核函数。常用的核函数有线性核函数、Sigmoid 函数、径向基核函数(radial basis function,RBF)等。RBF具有预先设定的参数少、对实际问题泛化学习能力强的特点,且可以非线性映射,已经应用于许多实际问题当中。因此,RBF是 LSSVM模型核函数的首选。RBF的具体表达式如下:K()x,xi=exp()-x-xi222(6)式中:为参数,表示核函数距中心点的宽度。138投稿网址:http:/ imax,R2n/2时,表明第i个追随者未搜寻到食物,处于极度饥饿的状态,因此它需要前往其他区域搜寻食物,以获得更多能量。追随者的位置更新公式为:x(t+1)ij=Q exp()x(t)worst-x(t)iji2,i n2x(t+1)P+|x(t)ij-x(t+1)P A+L,i n2(9)式中:x(t)P为该次迭代时发现者占据的最优位置;x(t)worst为第次迭代时种群的全局最劣位置;为1d维矩阵,其元素都被随机分配为 1或-1;+AT(AAT)-1。预警者的位置更新公式为:x(t+1)ij=x(t)best+|x(t)ij-x(t)best,fi fgx(t)ij+|x(t)ij-x(t)worst()fi-fw+,fi=fg(10)式中:x(t)best为第次迭代时种群的全局最优位置;为步长参数,并服从标准正态分布 N 0,1;-1,1,为一个随机数;为一个极小常数,加入 是为了防止出现fi-fw=0的情况;fi、fg、fw分别为当前个体适应度、全局最优适应度和全局最差适应度。当fi fg时,表示麻雀正处于种群的边缘地带,易被天敌捕食;当fi=fg时,表示处于种群中心位置的麻雀发觉了危险,需要靠近其他麻雀个体以保证自身安全。1.3住宅工程造价预测模型的建立由 LSSVM的建模过程可知,在住宅工程项目造价预测中,选择合适的 LSSVM 正则化参数 c和核函数参数 是精确预测的关键,故在预测之前运用 SSA对 LSSVM的 c和 进行参数寻优18。基于SSALSSVM的住宅工程造价预测模型的计算流程如图1所示。获得优化后的LSSVM预测模型,进行训练与仿真结束是否达到最大迭代次数觅食与反捕食行为,更新个体位置更新发现者、追随者和预警者的位置计算初始适应度并找到最好和最差个体初始化SSA和LSSVM参数利用主成分分析法对数据进行降维收集住宅工程造价数据并进行归一化处理开始YN图1基于SSALSSVM的住宅工程造价预测模型的计算流程Fig.1Algorithm flow of the residential project costprediction model based on SSALSSVM具体步骤为:step 1:获取住宅工程造价的相关数据,确定训练样本和测试样本数量,统一进行量化和归一化处理。step 2:利用主成分分析法对住宅工程造价的输入指标数据进行降维,并分析得出主成分。139投稿网址:http:/ 沙 理 工 大 学 学 报(自 然 科 学 版)2023年6月step 3:设置 SSALSSVM 模型的初始参数,包括种群规模、预警者占种群的比例、最大迭代次数等。step 4:计算每只麻雀的初始适应度fi,并根据fi的大小进行排序。step 5:根据式(8)(10)更新麻雀种群发现者、追随者和预警者的位置,计算麻雀新位置的适应度,并更新fg以及fw。step 6:判断是否达到停止条件,若达到则输出全局最优参数,否则转至step 4。step 7:将c和赋值给LSSVM,LSSVM利用最优参数进行造价预测。2工程特征指标的选取及量化处理关键特征指标的确定是构建预测模型的前提1。本研究采用文献分析法,以“工程造价预测”“cost prediction”“project investment estimate”等为关键词,在知网、Science Direct和Web of Science选取具有代表性的、与住宅工程造价预测有关的50篇文献,根据造价影响因素出现的频数和其对造价的影响程度,结合案例的实际情况19,选定了15个特征指标,分别为工期 X1、地上层数 X2、地下层数 X3、建筑面积 X4、檐口高度 X5