不同
函数
过程
回归
算法
因子
输入
情况
长江流域
蒸散
应用
研究
第 29 卷第 9 期2023 年 9 月水利科技与经济Water Conservancy Science and Technology and EconomyVol.29 No.9September,2023收稿日期 2023-03-01作者简介 杨梓涵(2002-),男,江苏盐城人,本科在读,研究方向为水文与水资源工程;崔峥铮(2002-),男,河北邯郸人,本科在读,研究方向为水文与水资源工程;张鹏程(2002-),男,湖北襄阳人,本科在读,研究方向为水文与水资源工程.doi:10.3969/j.issn.1006-7175.2023.09.004不同核函数高斯过程回归算法与不同因子输入情况下对长江流域蒸散发量应用研究杨梓涵,崔峥铮,张鹏程(河海大学 水文水资源学院,南京 210024)摘 要为探明不同核函数高斯过程回归算法在不同使用条件下对参考作物腾发量(ET0)模拟精度,在长江流域内选择 10 个代表性气象站点,以 PM 公式的计算结果作为参考值,以最高气温、最低气温、平均气温、相对湿度、平均本站大气压、日照时数和风速作为主要气象因子,使用灰色关联分析得到因子输入组合,使用二次有理、平方指数、Matern 5/2 等 3 种不同核函数的高斯过程回归算法对 ET0进行模拟,并与 Priestley-Taylor、Hargreaves-Samani、Irmak-Allen 等 3 种经典算法计算结果进行对比。结果显示:在同一站点同一参考公式计算结果下,3 种不同核函数高斯过程回归算法和 3 种经典算法的模拟精度大小排序为:Matern 5/2二次有理平方指数PTIAHS,其中 Matern 5/2 的模拟效果最好,其 R2范围为 0.9700.988。表明在相同气象参数输入条件下,机器学习模型精度普遍优于经验模型。针对灰色关联分析得到的结果,日最高温度对参考作物腾发量影响较大,其平均关联度为 0.8969;日照时数对参考作物腾发量影响较小,其平均关联度为 0.810 5;其余气象因子对参考作物腾发量的影响适中。针对不同因子组合输入下同种核函数的高斯过程回归算法,3 种不同核函数高斯过程回归算法的模拟 ET0表现效果均为:六因子五因子四因子,其中六因子输入的模拟效果最好,其 R2范围为 0.9080.977。关键词参考作物腾发量;灰色关联分析;高斯过程回归;核函数中图分类号 S152.7 文献标识码 A 文章编号 1006-7175(2023)09-0019-07Application of Gaussian Process Regression Algorithm with Different Kernel Function and Different Factor Inputs on Evapotranspiration in the Yangtze River BasinYANG Zi-han,CUI Zheng-zheng,ZHANG Peng-cheng(School of Hydrology and Water Resources,Hohai University,Nanjing 210024,China)Abstract:In order to explore the simulation accuracy of different kernel function Gaussian process regression algorithms on the emission rate(ET0)of reference crops under different conditions,10 91第 29 卷第 9 期2023 年 9 月水利科技与经济Water Conservancy Science and Technology and EconomyVol.29 No.9September,2023representative meteorological stations were selected in the Yangtze River Basin,and the calculation results calculated by the PM formula were used as reference values,the maximum temperature,minimum temperature,average temperature,relative humidity,average atmospheric pressure,sunshine hours and wind speed of the station were used as the main meteorological factors,and the factor input combination was obtained by gray correlation analysis,and the quadratic rational,squared index and Matern 5/2 were used.The Gaussian process regression algorithm with three different kernel functions simulated ET0 and compared the calculation results of Priestley-Taylor,Hargreaves-Samani and Irmak-Allen.The results show that:under the calculation results of the same reference formula at the same site,the simulation accuracy of the Gaussian process regression algorithm of three different kernel functions and the three classical algorithms are:Matern 5/2 quadratic rational squared exponentPTIA HS,Matern 5/2 works best with an R2 range of 0.9700.988.The results show that the accuracy of the machine learning model is generally better than that of the empirical model under the input conditions of the same meteorological parameters.According to the results obtained by gray correlation analysis,the maximum daily temperature had a greater effect on the emission of the reference crop,and the average correlation degree was 0.8969,the average correlation degree of sunshine hours had a small effect on the emission of the reference crop,and the average correlation degree was 0.8105,and the influence of other meteorological factors on the emission of the reference crop was moderate.For the Gaussian process regression algorithm of the same kernel function under different factor combination inputs,the simulated ET0 performance effect of the Gaussian process regression algorithm of three different kernel functions is:six-factor five-factor four-factor,and the six-factor input has the best simulation effect,and its R2 range is 0.9080.977.Key words:reference crop evapotranspiration;grey correlation analysis;Gaussian process regression;kernel function0 引 言参考作物腾发量(Reference evapotranspira-tion,ET0)是自然界水分循环与能量平衡的重要组成部分,与降水等因素共同影响着区域的干湿状况,也是估算生态需水和农业灌溉用水的关键因子1。长江流域地处亚热带季风气候区,年降水量大,流域内有丰富的自然资源,是我国重要的水利经济带。因此,对长江流域内部分城市的参考作物腾发量进行研究,对水资源合理开发利用与水循环有促进和指导意义。目前,常用的参考作物腾发量估算公式主要有 Penman-Monteith、Priestley-Taylor、Hargreaves-Samani 和 Thornthwaite 公式2,这 4 个公式对长江流域都具有一定的适用性。由于每个公式计算因子不同,对不同地区蒸散发计算的结果精度也不同,许多学者针对不同地区对 ET0估算公式进行了适用性分析并进行修正改进。如黄强等2针对珠江流域 42 个观测站点 1959-2011 年的逐日气象数据,以实测蒸散发数据为基准,探讨了 PM 公式、PT 公式、HS 公式和 TH 公式在珠江流域蒸散发计算中的适用性,结果表明 PM 公式在不同季节和地区的计算结果都较为稳定,与实测值更接近,最适用于珠江流域的蒸散发计算。朱潇枭等3针对海南省 7 个气象站点 2000-2014 年的逐日气象数据,以 PM 公式计算结果为标准,对 Priestley-Taylor 法,Irmak-Allen 法和Hargreaves-Samani 法的适用性进行了评价和对比分析,结果表明3 种不同的 ET0计算方法在海南省的相关性依次为:PT 公式IA 公式HS 公式。ET0的计算可以看作是一个依赖于大量气象变量的复杂非线性回归过程。因此,很难建立准确的经验模型来代表所有复杂的过程4。近年来,有学者提出 ET0估计的机器学习方法,因为它们可以为非线性和多变量函数提供简单的解决方案5。FAN 等4基于我国不同气候区 8 个02杨梓涵,等:不同核函数高斯过程回归算法与不同因子输入情况下对长江流域蒸散发量应用研究第 9 期气象站点 1960-2010 的逐日气象数据,对 SVM、ELM、RF、M5tree、GBDT、XGBoost 这 6 种高斯过程回归算法模拟 ET0的精度进行了对比,结果表明 GBDT 和 XGBoost 在模拟 ET0中有着显著的优越性,但 SVM 和 ELM 是模拟 ET0最稳定的两个模型。赵文刚等6选取 BP 神经网络、极限学习法和小波神经网络 3 种较为常用的机器学习法,以广东省典型代表站点 1981-2010 年的实测逐日气象数据为研究对象,对比了 3 种高斯过程回归算法的可靠性,结果表明 ET0计算精度表现为:BP极限学习机小波神经网络。此外,还有部分学者针对有限气象数据条件下高斯过程回归算法计算 ET0的精度进行了研究7-8。因此,本文以长江流域 10