基于
监督
方法
确定
岩土
参数
DOI:10.16030/ki.issn.1000-3665.202207046阮永芬,李鹏辉,朱强,等.基于无监督方法确定岩土参数取值 J.水文地质工程地质,2023,50(4):149-159.RUAN Yongfen,LI Penghui,ZHU Qiang,et al.Determination of geotechnical parameters based on the unsupervised learning methodJ.Hydrogeology&Engineering Geology,2023,50(4):149-159.基于无监督方法确定岩土参数取值阮永芬1,李鹏辉1,朱强2,王勇3,闫明4(1.昆明理工大学建筑工程学院,云南 昆明650500;2.中铁十六局集团有限公司北京交通轨道建设工程有限公司,北京101100;3.昆明军龙岩土工程有限公司,云南 昆明650214;4.中铁二十局集团第五工程有限公司,云南 昆明650000)摘要:随着城市工程建设的发展,建筑工程事故问题愈发突出,采用传统方法求取的岩土参数区间无法满足实际工程需要。基于无监督学习思想,选取工程性质较差的泥炭质土,结合工程经验选用 8 个物理指标作为输入集,利用主成分分析(priciple components analysis,PCA)算法实现多样本多参数去耦合的降维处理,得出各物理指标相关性及敏感度,结合其相关性及敏感度赋予不同埋深泥炭质土物理指标的综合评价值。利用 k-means 聚类分析泥炭质土物理指标、综合评价值及工程特性之间的关系,为岩土参数选取提供理论基础。采用监督学习方法BP 神经网络算法分析无监督结果,验证(PCAk-means)算法模型的合理性。将通过聚类分析得到的正态样本利用多种截尾法优化,得到可靠取值区间,并将取值结果与实际工程取值比较,验证了该模型工程参数取值的合理性。该算法模型具有较好的工程应用价值,所得研究结果可为工程勘察、设计、施工参数取值提供参考,也能为岩土参数取值分析提供新的分析方法。关键词:主成分分析;k-means 聚类;BP 神经网络;截尾法;岩土参数中图分类号:TU443 文献标志码:A 文章编号:1000-3665(2023)04-0149-11Determination of geotechnical parameters based on theunsupervised learning methodRUAN Yongfen1,LI Penghui1,ZHU Qiang2,WANG Yong3,YAN Ming4(1.Faculty of Civil Engineering and Mechanics,Kunming University of Science and Technology,Kunming,Yunnan650500,China;2.China Railway 16 Bureau Group Metro Engineering Construction Co.Ltd.,Beijing101100,China;3.Kunming Junlong Geotechnical Engineering Co.Ltd.,Kunming,Yunnan650214,China;4.No.5 Engineering Corporation Limited of CR20G,Kunming,Yunnan650000,China)Abstract:With the development of urban engineering construction,the issue of construction engineering accidentshas become more and more prominent.The geotechnical parameter interval obtained by using the traditionalmethods cannot meet the needs of actual engineering.Based on the idea of unsupervised learning,the peaty soilwith the worst engineering properties is considered,and 8 physical indexes are selected as the input set.Theprincipal component analysis(PCA)algorithm is used to realize the dimensionality reduction of multi-sample andmulti-parameter decoupling,and the correlation and sensitivity of each physical index is obtained.Combined with 收稿日期:2022-07-28;修订日期:2022-10-20投稿网址:基金项目:中铁二十局集团第五工程有限公司科研计划项目(CR2005-5-JS-2021-009)第一作者:阮永芬(1964-),女,博士,教授,主要从事岩土工程方面的研究。E-mail:通讯作者:李鹏辉(1999-),男,硕士研究生,主要从事岩土工程方面的研究。E-mail: 第 50 卷 第 4 期水文地质工程地质Vol.50 No.42023 年 7 月HYDROGEOLOGY&ENGINEERING GEOLOGYJul.,2023its correlation and sensitivity,the comprehensive evaluation value of physical indexes of peat soil with differentburied depths is given.The k-means clustering is used to analyze the relationship among physical index,andcomprehensive evaluation value and engineering characteristics of peaty soil provide a theoretical basis for theselection of geotechnical parameters.The supervised learning method-BP neural network algorithm is used toanalyze the unsupervised results and verify the accuracy of the(PCAk-means)algorithm model.The normalsamples obtained by clustering analysis are optimized by a variety of truncation methods to obtain a reliable valuerange,and the value results are compared with the actual engineering values to verify the rationality of the modelengineering parameters.The algorithm model is of good engineering application value.The research results canprovide references for engineering investigation,design and construction parameter values,and also provide a newanalysis method for geotechnical parameter value analyses.Keywords:principal component analysis;k-means clustering;BP neural networks;truncated method;geotechnical parameters 昆明滇池流域广泛分布由泥炭质土、粉土、黏土、粉砂互层组成的特殊湖相沉积软土,这类软土不仅土体类别离散,物理指标也非常离散,导致工程性质较复杂,容易引发工程事故,同时为工程勘察、设计及施工时参数的选取带来很多困难。这类软土中,泥炭质土最为特殊,具有孔隙比大、含水率高、压缩性大等特点,工程性质极差1 4。实际工程中参数取值是否合理直接影响后续工程施工安全。因此,得到合理可靠的岩土参数值成为亟待解决的问题。为降低泥炭质土给工程带来的施工困难与安全隐患,目前很多学者致力于研究泥炭质土物理力学参数相关性。Kolay 等5对马来西亚 6 个不同地点的重塑泥炭质土进行试验研究,其试验结果与他人研究结果吻合较好,即随着有机质含量的增加,泥炭质土的液限、纤维含量、最优含水率均增加,比重、密度均减少。Price 等6研究了泥炭质土的物理性质,对密度、分解度、持水能力、泥炭土纤维含量及种类与压缩性之间的关系进行分析。Santagata 等7对有机质含量达 40%60%的原状土、重塑泥炭质土及人造无机黏土进行恒载及增量加载一维固结试验,分析研究了压缩系数、渗透系数与孔隙比的变化规律以及土的结构性。裴利华等8研究了有机质含量对无定形泥炭质土物理力学性质的影响,为工程应用提供理论基础。随着岩土参数相关性研究内容的深入,越来越多的学者采用一元及多元线性方程对岩土参数进行拟合,为设计参数的合理取值提供参考9 11。归纳现有研究成果可知,通过线性拟合得到的岩土参数值考虑的影响因素较少,不能真实反映工程状况。机器学习算法可快速高效处理多参数耦合问题,但是研究发现监督学习严重依赖外部因素,难以处理噪声样本,需排除噪音点后使用,导致工程适用性不强12 13。无监督学习作为解决分类及回归问题的常用方法之一,目前已被多次应用到岩土工程。例如,阮永芬等14采用无监督学习理论中的主成分分析(priciple compone-nts analysis,PCA)算法和模糊 C-均值聚类算法(fuzzyC-means algorithm,FCM),即 PCA-FCM 算法,对盾构施工地表沉降进行预估,很大程度上提高了预估正确率。宫凤强等15采用主成分分析与距离分析识别法识别矿山水源,极大提高了判别正确率。任玉晓16采用无监督学习理论对隧道地震波速进行反演,为地震波速深度学习反演在实际数据中的应用提供了可行手段。但是,无监督学习理论在岩土参数方面应用较少且不系统,且计算时未能将多指标样本联系到一起,未考虑多参数指标对土的工程性质影响17 18。为解决以上问题,采用昆明会展中心场地地质勘测资料,将不同埋深下的泥炭质土 8 个物理指标 381组数据引入无监督学习理论中,利用 PCA 算法和 k-means 聚类分析将物理指标及工程特性联系起来,为工程参数取值提供参考。将无监督学习理论的输出结果与 BP 神经网络得到的结果进行分析,进一步验证建立模型的适用性;并对优化后样本指标采用多种截尾法确定其样本取值区间,与实际工程综合建议值比较分析,检验 PCAk-means 模型的合理性。1 算法原理 1.1 主成分分析(PCA)PCA 算法的目标是通过某种线性投影,将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大,以便使用较少的数据维度,同时保留住较多的原数据点特性19。采用文献 14 中 150 水文地质工程地质第 4 期PCA-FCM 模型中的相关 PCA 算法实现数据降维,其基本步骤如下所述。为消除不同指标参数量纲的影响,首先对指标参数进行 Z-score 标准化处理,计算如下:xij=xijxjj,i=1,2,n,j=1,2,m(1)xij式中:第 i 个样本第 j 个指标的实测值;xj、j第 j 个指标的均值与标准差;n样本个数;m指标空间维度。对样本指标标准化后,构建协方差矩阵 C 如下:C=Cov(x1,x1)Cov(x1,xm)Cov(x2,x1)Cov(x2,xm).Cov(xm,x1)Cov(xm,xm)(2)Cov(xj,xj)式中:第 j 个与第 j个指标间的协方差。协方差的计算公式见式(3)(4),其大小决定了不同指标间的关系:当其值0 时,两样本间为正相关;当其值85%时的前 k 项代表原表征指标样本。cj和ck计算公式如下:ck=kj=1cj,cj=jmj=1j100%(5)对样本指标降维后形成新的坐标空间,由选定的前 k 个指标 yk组成的矩阵 Y 可以表示为:Y=y1y2.yk=PX=p11p12p1mp21p22p2m.pk1pk2pkmx1x2.xm(6)式中:P主成分得分系数矩阵;Xm 维列向量。1.2 k-means 聚类分析k-means 聚类主要用于解决未知量的分类问题,目前已被用于解决多个领域分类问题。其算法基本原理为随机确定 k 个初始点作为簇质心,然后计算数据样本中的每个点与每个簇质心间的距离,依据此距离对样本进行分配;之后将每簇的质心更改为该簇内所有点的平均值;经过多次迭代计算,簇质心最终趋于稳定20 21。k-means 聚类的优点为运算速度快,操作简单,容易理解。算法的基本步骤如下:x1,x2,x3,xni=1,2,k(1)从 n 个样本()中随机选取 k 个初始聚类中心 Ci()。(2)采用欧式距离公式分别计算其余样本 xj与各个聚类中心 Ci的距离,将样本对象分配至聚类最近的簇中。欧式距离公式如下:d(xj,Ci)=mp=1(xjpCip)21/2(7)式中:xjp、Cipxj、Ci的第 p 个属性值。(3)所有样本分配完成后,观察是否会发生点重新分配的现象,若没有则样本分配稳定聚类结束,否则重新计算新的簇中心。(4)当聚类中心稳定不再变化时停止,并输出聚类结果。1.3 BP 神经网络BP 神经网络是一种多层的前馈神经网络,是监督学习的常用方法之一。其过程主要分为两个阶段,第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误差的反向传播,从输出到隐含层,最后到输入层,然后依次调节隐含层到输出层、输入层到隐含层的权重和偏置。结合文献 22 23中的 BP 神经网络算法,对数据进行预测分析。算法基本步骤如下:(1)网络初始化,选取合适的激活函数 f(x),常用的激活函数为双曲正切“S”型函数:f(x)=1ex1+ex(8)(2)对隐含层输出(Hj)进行计算:Hj=fni=1wijxi+aj,j=1,2,l(9)式中:wij输入层到隐含层的权重;aj输入层到隐含层的偏置。l隐含层的节点数。(3)对输出层输出(Ok)进行计算:Ok=mj=1wjkHj+bk,k=1,2,l1(10)2023 年阮永芬,等:基于无监督方法确定岩土参数取值 151 式中:wjk隐含层的输出层的权重;bk隐含层到输出层的偏置;l1输出层的节点数。(4)计算其误差(E):E=12l1k=1(YkOk)2(11)式中:Yk期望输出,记 YkOk=ek,则E=12l1k=1e2k(12)(5)权值更新,计算如下:wij=wij+Hj(1Hj)xil1k=1wjkek(13)wjk=wjk+Hjek(14)(6)偏置更新隐含层到输出层的偏置更新:aj=aj+Hj(1Hj)xil1k=1wjkek(15)bk=bk+ek(16)输入层到隐含层的偏置更新:bk=bk+Hj(1Hj)l1k=1wjkek(17)计算结束后,判断算法是否收敛。若结果收敛,则算法结束;否则重复上述计算操作,直到结果收敛。2 案例分析 2.1 参数指标确定对大量地勘报告进行整理和分析,选取地层分布具有代表性的昆明会展中心场地进行研究。此场地属于滇池盆地湖相沉积平原地貌,在勘测范围内,地层主要由表层填土、第四系冲洪积及湖相沉积层组成,共有 4 层泥炭质土。地层构造如图 1 所示。分别对各层不同深度泥炭质土取样,选取 381 个样本进行研究。选择密度()、比重(Gs)、含水率()、液限(L)、塑限(P)、孔隙比(e)、压缩系数(a1-2)、有机质含量(wu)等 8 个物理指标进行分析。每层泥炭质土的物理指标参数如表 1 所示。2.2 参数相关性分析根据式(1)对泥炭质土样本指标进行标准化处理后进行 KMO 和巴利特球形检验,得到 KMO 取样适切性量数为 0.897(0.50),显著性概率为 0.000(3 时,曲线趋于平稳,且累计贡献率大于85%,故取前 3 个主成分为降维后的样本指标,代表原始 样 本 数 据 的 全 部 信 息 参 与 计 算。利 用 式(19)计算各指标的敏感度(rj),将 rj统计到表 3。由表 3 可知,按 rj由高到低排序,各物理指标依次为:e、L、P、wu、a1-2、Gs,当研究泥炭质土的物理指标变化规律时,可优先考虑分析 e、与 L的变化规律。rj=kc=1c?pjc?mj=1kc=1c?pjc?(19)为得到不同埋深泥炭质土的综合评价值,可利用主成分得分系数矩阵 P 采用回归法分别计算 3 个主成分的因子得分函数 F1、F2、F3,计算公式如式(20)所示。将因子得分函数 F1、F2、F3代入式(21)计算不同埋深下的泥炭质土的综合评价值(Q)。将不同埋深泥炭质土的综合评价值由低到高进行排列表 4。由于样本数量较多,直接分析综合评价值与物理指标变化规律不方便;而物理指标之间存在某种线性关系,故将样本数量缩小,利于观察其变化趋势,因此令 10 个样本为 1 组,计算各组物理指标平均值。计算结果如表 4所示。0.91.01.11.21.31.41.51.61.70123456其他指标/(gcm3)a12,R2=0.62,R2=0.87P,R2=0.85e,R2=0.85a12Pe拟合曲线图 2 与、L、e、a1-2关系曲线Fig.2 Relationship of and,L,e and a1-2 0123456其他指标5 10 15 20 25 30 35 40 45 50 55 60 65 70 75u/%a12,R2=0.45,R2=0.73P,R2=0.80e,R2=0.70a12Pe拟合曲线图 3 wu与、L、e、a1-2关系曲线Fig.3 Relationship of wu and,L,e and a1-2 01234567891234567特征值特征值变化曲线6.1650.8220.2190.514主成分数图 4 特征值变化规律Fig.4 Variation of elgenvalues 12345678020406080100贡献率/%0.102 80.064 30.027 40.162 702040608010077.058%87.337%93.763%96.505%98.132%主成分数累计贡献率/%累计贡献率变化曲线累计贡献率贡献率图 5 累计贡献率Fig.5 Cumulative contribution 表 2 不同物理指标间的相关性系数Table 2 Correlation between different physical indicators 物理指标GSLea1-2Pwu1.00GS0.641.00w0.870.551.00wL0.890.590.941.00e0.850.850.940.871.00a1-20.620.420.810.680.851.00wP0.850.580.820.930.580.491.00wu0.830.660.730.780.700.450.801.002023 年阮永芬,等:基于无监督方法确定岩土参数取值 153 Fk=mj=1(pkjxj),k=1,2,3(20)Q=(F1c1+F2c2+F3c3)/(c1+c2+c3)(21)由排序结果可知,随着综合评价值的升高,敏感性较高的 e、L与 wu整体呈递增的趋势,而 及GS大体呈递减的趋势。这种现象是由泥炭质土特殊的成分有机质所引起的。由于有机质内存在腐殖酸,泥炭质土的结合水层较厚,有机质与水膜联合形成架空结构,使泥炭质土具有较高的 e、值。由于有机质含量的重度小于黏土颗粒的重度,故随着 wu的增多,泥炭质土的 及 Gs逐渐较小。对埋深 2035 m 与 4555 m 的泥炭质土与其评价值进行分析,发现上层泥炭质土各物理指标稳定,而下层泥炭质土物理指标参数离散性较大。这是由于随着埋深的增加,泥炭质土发生煤化作用,上覆沉积物产生静压力排出大量孔隙水,泥炭质土转化为褐煤,导致参数空间变异性增大,故离散性增强1。泥炭质土物理指标取值除受深度影响外,还受其土层厚度、地理位置、气候气象、地形地貌及水文地质条件的影响,这导致我国不同地区的泥炭质土物理指标值有所差异。但这些地区的泥炭质土工程性质均较差,具有较高的触变性、流变性、低透水性、高压缩性及低强度等特点。建筑物基础容易产生地面不均匀沉降,进而影响工程施工进度。而泥炭质土不良的工程性质与物理指标具有一定的相关性,高含水率、高压缩系数、高孔隙比的泥炭质土工程性质较差。由表 4 可知,由多个物理指标得到的综合评价值与其工程性质具有相关性。表 4 各组泥炭质土综合评价值排序Table 4 Ranking of comprehensive evaluation of the peaty soil 组类综合评价值物理指标平均值/(gcm3)/%GseL/%P/%a1-2/MPa-1wu/%11.2951.56557.5902.5171.53668.69042.6900.7228.10021.1621.53367.9802.3971.56571.73044.9100.81212.67031.0961.49968.2802.4281.69976.18048.2701.10311.69041.0351.48372.1202.4361.82484.80049.5600.97712.27050.9281.45273.6902.2381.88292.40058.8900.85013.67860.9461.45478.0702.4261.97190.32053.5501.12112.10070.9001.45582.1802.4261.95795.36362.1810.83313.318341.2931.115211.2001.7964.406228.270149.4003.80243.750351.4961.134220.2001.1644.761228.710144.1004.71844.346361.5661.117232.7001.3114.818238.770149.3105.03140.817371.8611.121247.0000.9965.327249.400156.3006.00641.710382.5741.079287.1820.9905.839304.936207.8005.97856.455 3 结果检验及参数分析 3.1 聚类结果分析为验证上述结论,采用聚类分析法分析其物理指标值与其综合评价值关系。将 PCA 转化后的主成分数据作为分级判据指标输入到 k-means 聚类算法时,需考虑聚类个数 k 的影响,k 直接影响聚类效果和主要信息完整性。对分判指标采用不同 k 值进行分析,随着 k 的增加,会有一类样本基本不会发生变化,因此可将这类样本认定为最优子类。当 k=3 时,样本分类趋于稳定,分类结果明显,且样本点较为集中。故选取 k=3 为最优分类数。分类结果如图 6 所示。确定好聚类数 k=3 后,对输出结果施加外部标签(综合评价值),按外部标签由小到大将输出类数进行规范化排列,结果如图 7 所示。结合表 4 及图 7 可知,分类结果与外部标签之间相关性较优,外部标签虽存 表 3 各物理指标敏感度统计表Table 3 Sensitivity statistics of each physical index 物理指标编码X1()X2(GS)X3()X4(L)X5(e)X6(a1-2)X7(P)X8(wu)敏感度符号r1r2r3r4r5r6r7r8敏感度值0.234 90.206 90.254 00.242 80.260 80.215 10.241 00.228 1 154 水文地质工程地质第 4 期在混淆区但混淆样本较少,存在混淆样本点的原因是岩土参数变异性、数据本身存在一定误差。大部分样本点集中在第一类,保留了原样本的主要信息,综合评价值较低。012341.00.500.51.01.52.02.53.03.5综合评价值综合评价值聚类簇图 7 综合评价分类结果Fig.7 Results of comprehensive evaluation 为验证综合评价值与物理指标值之间的关系,选择相关性较高且敏感度较高的 e、与 L3 个指标分析 k=3 时物理指标的变化规律。结果如图 8 所示。将图 7、图 8 联系起来分析可发现,随着综合评价值升高,e、与 L基本呈线性增长趋势,且在空间分类界限较为明显。同理,由表 2 中不同物理指标相关性,可判断剩余物理指标的变化规律。综上可知,综合评价值与物理指标值具有一定的相关性,综合评价值越大,泥炭质土的工程性质越差,引起工程事故的可能性更高。结合勘测报告所给的会展中心地基土的物理力学指标评价可知,下层泥炭质土指标离散性较大,孔隙比大,压缩性高,不宜作为桩端持力层使用。由 PCA 法计算的这类土层综合评价值较高(工程特性差),验证了本文综合评价值的工程应用可行性。3.2 BP 神经网络验证为验证综合评价值理论上的有效性,将无监督学习结果输入到 BP 神经网络分析法进行分析。通过与新的数据使用方法得到的结果比较,验证无监督理论的可行性。为保证模型结果的准确性,将样本分为训练与检验两部分,训练样本占 70%,检验样本占 30%。当两部分模型误差均小于 0.05 时,认为此模型可进行神经网络分析。分析结果如图 9、图 10 所示。012341.00.500.51.01.52.02.53.03.5 综合评价值聚类簇综合评价值预测综合评价值图 9 分类结果对比Fig.9 Comparison of classification results 由图 9、图 10 可知,无监督学习的综合评价值分类结果与 BP 神经网络得到的预测分类结果基本一致,原综合评价值与回归得到的预测综合评价曲线基本拟合。通过 2 种方法的对比,证明了综合评价值的正确性。监督学习理论目标明确且效果容易评估,通过采用监督学习方法评估无监督学习的结果为一种可靠方法。监督学习方法可以从多个方面验证无监督学习的准确性,增强理论依据,并为无监督学习理 第一类第二类第三类32103210123321012321第三判别指标第一判别指标第二判别指标图 6 判别指标分类结果Fig.6 Discriminative index classification results 第一类第二类第三类54321021012354210123541L/%e/%图 8 e、与 L分类结果Fig.8 Classification results of e、and L2023 年阮永芬,等:基于无监督方法确定岩土参数取值 155 论应用到岩土工程提供理论基础。3.3 参数分布分析在工程中岩土参数的选取会直接影响到工程的安全性,故参数既不能过大也不能过小,应处于合适的范围之内。为解决这个问题,宫凤强等24针对不同的样本分布提出了相应的区间长度原则。随着参数样本数量的增加,岩土参数逐渐服从某种分布。而滇池流域泥炭质土物理指标离散性较大,很大程度上不满足正态及对数正态分布,导致无法得到可靠的参数区间范围。为保证工程设计、施工、勘察的安全性,应尽可能合理缩小物理力学指标取值范围,得到可靠安全的参数取值。以 e、w 与 wL3 个指标为例分析其样本分布,如图 11所示。分别采用正态分布与对数正态分布曲线拟合3 个指标的样本分布,对比可知,3 个物理指标均不满足这 2 种分布,分别采用不同截尾法,即 3(标准差)、c33(参考偏度双侧调整)、c3(参考偏度单侧调整)原则计算参数区间范围,结果如表 5 所示。1.01.52.02.53.03.54.04.55.05.56.06.57.07.58.0020406080100120频数e(a)e指标n=381正态分布(3.03,1.20)对数正态(1.03,0.35)/%04080120160200240280320360400020406080100120140160180频数(b)指标n=381正态分布(133.02,62.09)对数正态(4.78,0.44)50100150200250300350400450020406080100120140160频数L/%(c)L指标n=381正态分布(148.63,61.20)对数正态(4.92,0.40)图 11 3 个物理指标原样本分布图Fig.11 Original sample distribution map of three physical indicators 表 5 不同截尾法的原物理指标区间范围Table 5 Original physical index range of different censoring methods 物理指标均值标准差偏度系数变异系数3区间范围c33区间范围c3区间范围e3.031.200.940.390,6.630.56,7.760,7.76/%133.0262.090.930.460,319.294.48,377.030,377.03L/%148.6361.260.870.410,332.4118.14,385.710,385.71 由表 5 可知,由多种截尾法得到的 3 个物理指标的参数区间范围较大,导致在实际工程中参数取值不可靠,无法较好应用到工程中。针对这个问题,将综合评价值应用到参数选取中,对保留样本主要信息及综合评价值较低(工程特性较好)的第一类样本指标进行分析,结果如图 12 所示。由图 12 可知,经过截尾法优化后,3 个物理指标参数区间范围均在原样本数据区间基础上进一步集中,样本正态分布曲线与对数正态分布曲线拟合度提高。为检验样本分布合理性,采用 K-S 检验法对图 12进行检验并与原样本的正态检验结果对比,结果见表 6。由表 6 可知,聚类前 3 个指标 P 值均小于 0.05,但聚类后 3 种指标远大于 0.05,且 P 值提高了很多数量级,分类结果显著,聚类后 3 个指标参数样本分布为正态分布可接受。采用 3、c33、c3原则计算聚类后物理指标参数区间范围,同理其余物理指标均可按相同方法分析,结果如表 7 所示。由表 7 可知,聚类后的新样本保留了原样本主要信息,且正态性有显著提高。由不同截尾法求得的区间范围较之前有很大程度的缩小,取值更加方便,与 1.00.500.51.01.52.02.53.03.5 综合评价值0501001502002503003504001.5原综合评价值预测综合评价值样本数量图 10 综合评价值对比Fig.10 Comprehensive evaluation and comparison 156 水文地质工程地质第 4 期工程实用值更加接近。综上可知,通过 PCAk-means法将物理指标降维,赋予物理指标一个外部标签(综合评价值),综合评价值可衡量泥炭质土工程特性的好坏。工程特性较差的泥炭质土指标离散性较大,样本分布不规律,导致物理指标区间范围较大,取值不方便,在实际工程中不能较好应用。通过聚类分析得到综合评价值较低的样本,这类样本不仅数量多,保留了原样本的主要信息,样本分布较规律,得到的区间范围更加可靠,方便工程取值。在实际工程中,为保证施工安全,可以通过多种原位试验,得到各土层物理力学指标设计参数综合值。现对会展中心 4 层泥炭质土的物理指标设计参数进行分析,并利用本文方法分析其合理性,结果如表 8 所示。4 层泥炭质土物理指标设计参数综合值与表 7 所得各指标参数值相差不大,根据各层物理指标综合值得到的综合评价值属第一类,说明其参数取值较合理,证明通过 PCAk-means 模型得到的物理指标值是合理性的。4 结论(1)通过协方差矩阵研究多个物理指标可知,不同物理指标间相关性满足一定的规律,压缩系数与其他几个物理指标相关性较低,含水率、液限和孔隙比与其他物理指标相关系数较高。(2)利用主成分分析法对多个物理指标参数降维 1.21.41.61.82.02.22.42.62.83.03.23.43.60102030405060频数e(a)e指标n=224正态分布(2.19,0.40)对数正态(0.77,0.18)0102030405060频数5060708090100110120130140150160170180190L/%(c)L指标n=224正态分布(105.55,22.11)对数正态(4.64,0.21)010203040507060频数405060708090100110120130140150/%(b)指标n=224正态分布(88.68,17.40)对数正态(4.46,0.20)图 12 分类后 3 个物理指标样本分布图Fig.12 Sample distribution map of three physical indicators after classification 表 6 物理指标样本检验结果Table 6 Normal test result of the physical index sample 指标分布类型D值P值检验结果e(图11)正态分布0.1551.81104排除e(图12)正态分布0.0901.00接受(图11)正态分布0.1892.361012排除(图12)正态分布0.0640.710接受L(图11)正态分布0.1461.62107排除L(图12)正态分布0.0720.190接受注:D值为检验统计量;P值为渐近显著性水平,P值大于0.05时,接受原假设。表 7 不同截尾法的新样本区间范围Table 7 Range of new sample intervals for different censoring methods 物理指标均值标准差偏度系数变异系数3区间范围c33区间范围c3区间范围e2.190.400.390.180.99,3.391.45,3.550.99,3.55/%88.6817.400.390.1836.48,140.8843.26,147.6636.48,140.88L/%105.5522.110.280.2039.22,171.8845.41,178.0739.22,178.08/(gcm3)1.400.080.080.061.13,1.661.15,1.671.13,1.67Gs2.250.453.080.200.89,3.611.15,3.551.15,3.61a1-2/MPa11.240.561.560.450,2.930.43,3.810,2.93P/%68.7618.060.380.2614.57,122.9721.48,129.8814.57,129.88wu/%17.637.642.020.430,40.5710.17,56.060,56.06 表 8 各层泥炭质土设计参数检验结果Table 8 Test results of design parameters of the peaty soil ineach layer 地层编号/(gcm3)/%eILa1-2/MPa1综合评价所属类111.37103.02.410.151.630.23第一类21.3991.12.330.121.300.26第一类11.2