基于随机森林算法的人口空间化研究_李红春.pdfVIP免费

下载本文档

阅读 0
下载 0
格式 pdf
大小 996.61 KB
约4页
2023-05-04
收藏
评论
点赞(0)
海报
举报

第４１卷第１期佳木斯大学学报（自然科学版）Ｖｏｌ．４１Ｎｏ．１２０２３年０１月ＪｏｕｒｎａｌｏｆＪｉａｍｕｓｉＵｎｉｖｅｒｓｉｔｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）Ｊａｎ．２０２３文章编号：１００８－１４０２（２０２３）０１－０１７１－０４基于随机森林算法的人口空间化研究①李红春（滁州城市职业学院，安徽滁州２３９０００）摘要：大幅度人口数量的增加和城市化水平的不断发展，加大了城市管理和资源配置的难度。为更好探究人口空间化变化特征以协调资源配置，研究在基于随机森林算法基础上，选取夜间灯光和信息点等多源数据进行影响机制分析，发现森林算法模型估算的人口数值主要集聚在网格的左下角部分，且其分布呈现出“中心高值聚集－四周低值环绕”的空间格局，该模型可以解释因变量约８６．３％的变异，拟合效果较好。同时住宅用地特征数量与其特征贡献值之间呈现上升态势，生活服务点核密度为０．３－０．９时的特征贡献值基本维持在２００－４００之间，表明两者对人口估算值具有正向作用，有助于探究人口空间精细分布的影响因素，并为后续研究人口空间化分布态势提供了新的思路。关键词：随机森林算法；人口；特征贡献；空间化；模型误差中图分类号：Ｐ２０８文献标识码：Ａ０引言随机森林（ＲａｎｄｏｍＦｏｒｅｓｔｓ，ＲＦ）算法是利用决策树进行分类的一种集成学习算法，常用于学习分类、回归和聚类问题，该算法可以通过对缺失数据的补充和分类值建模实现较好的运行效果和运行方式［１］。同时随机森林算法在训练过程中，可以通过借助袋外数据（Ｏｕｔ－ｏｆ－ｂａｇ，ＯＯＢ）实现数据真实误差的无偏估计，以检测特征点之间的相互影响，且部分学者常借助随机森林算法对行政单元进行建模来探究其空间化，但多局限于算法本身，而较少将其引入网格中进行研究，难以对人口空间分布与其影响因素之间有较为清楚的逻辑关系［２］。鉴于此，研究在基于随机森林算法的基础上，加强模型对信息特征的提取，并以处理后的相关人口空间化支撑数据来进行多维特征模型的构建，以各特征点的重要性来评估其在模型中的影响程度，进而实现人口估算。１随机森林算法下的人口空间化模型构建１．１基于随机森林算法的特征改进与提取随机森林算法将采样集训练成多棵决策树，并对决策树进行预测最终得到预测结果，以选取的特征点作为根节点来计算决策树的分支，其最重要的是对特征点的筛选和分类，即通过判断该特征点是否符...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容