分享
一种基于多源数据验证的手机...据分析结果不确定性研究方法_韩钰.pdf
下载文档

ID:2727650

大小:1.66MB

页数:5页

格式:PDF

时间:2023-10-13

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
一种 基于 数据 验证 手机 分析 结果 不确定性 研究 方法 韩钰
第 48 卷第 1 期2023 年 2 月Vol.48 No.1Feb.2023测绘地理信息Journal of Geomatics一种基于多源数据验证的手机信令数据分析结果不确定性研究方法韩钰1 史文中2 涂伟31 武汉大学遥感信息工程学院,湖北 武汉,4300792 香港理工大学智慧城市研究院,香港,9990773 深圳大学建筑与城市规划学院城市空间信息工程系,广东 深圳,518061An Uncertainty Research Method of Mobile Phone Signaling Data Analysis Results Validated by Multi-source DataHANYu1 SHIWenzhong2 TUWei31 School of Remote Sensing and Information Engineering,Wuhan University,Wuhan 430079,China2 Smart Cities Research Institute,Hongkong Polytechnic University,Hong Kong 999077,China3 Department of Urban Spatial Information Engineering,School of Architecture and Urban Planning,Shenzhen University,Shenzhen 518061,China摘要:手机信令数据被广泛应用于城市人群的动态特征分析,但其分析结果的不确定性尚不明确。因此,提出一种多源数据验证的不确定性分析方法。将从手机信令数据中提取的分布特征与多源数据进行对比,用人群代表性、转移覆盖率、聚集一致性 3个指标评价分析结果的不确定性。并基于深圳市手机信令数据,选取了城市感知中人群分布、区域流动、热点识别 3个典型城市动态特征,用人口网格分布、营运车辆 GPS 数据、高德兴趣点(point of interest,POI)等数据集对手机信令数据的分析结果进行验证,得出该区域手机信令数据分析结果的不确定性特征。关键词:手机信令数据;不确定性;多源数据;城市感知中图分类号:P208文献标志码:AAbstract:Mobile phone signaling data(MPD)are widely used to analyze the dynamic characteristics of urban population.However,the uncertainty of the analysis results is not clear.Therefore,we propose an uncertainty analysis method verified by multi-source data.We compare the distribution characteristics extracted from the mobile phone signaling data with multi-source data,and evaluate the uncertainty of the analysis results by representativeness of population,coverage rate of transfer and consistency of aggregation.Based on the mobile phone signaling data in Shenzhen,we select three typical urban dynamic characteristics in urban sensing(population distribution,regional flow and hot spot identification),and verify the uncertainty of the analysis results obtained by mobile phone signaling data with data sets including distribution data of population grid,GPS data of operating vehicles,and point of interest(POI)data from Amap to get the uncertainty characteristics of analysis results obtained by the mobile phone signaling data in the study area.Key words:mobile phone signaling data;uncertainty;multi-source data;urban sensing当前智慧城市发展进程不断加快,空间大数据使实时精细的时空感知成为可能1。空间大数据的不确定性对地理分析结果至关重要,对其不确定性的客观认识及针对性改善有利于提升空间大数据分析结果的可靠性2。手机信令数据覆盖范围广、样本数据量大,已被广泛用于城市人口调查、空间格局感知等领域3-5。但其定位原理存在固有缺陷,导致手机信令数据空间分辨率较低且存在区域差异。同时,通信运营商市场份额不均匀导致手机信令数据的人群覆盖不均匀,给基于手机信令数据的空间分析带来了较大不确定性6。不确定性本身无法避免,但可以通过认知分析中存在的不确定性,采取相应对策减轻负面影响,使分析结果更加可靠。由于缺乏真实地面数据集的验证,手机信令数DOI:10.14188/j.2095-6045.2021217文章编号:2095-6045(2023)01-0044-05引用格式:韩钰,史文中,涂伟.一种基于多源数据验证的手机信令数据分析结果不确定性研究方法 J.测绘地理信息,2023,48(1):44-48(HAN Yu,SHI Wenzhong,TU Wei.An Uncertainty Research Method of Mobile Phone Signaling Data Analysis Results Validated by Multi-source Data J.Journal of Geomatics,2023,48(1):44-48)基金项目:国家重点研发计划(2019YFB2103102);国家自然科学基金与欧洲城市化联合研究计划合作研究项目(71961137003)。第 48 卷第 1 期韩钰等:一种基于多源数据验证的手机信令数据分析结果不确定性研究方法据不确定性评估多从应用效果出发7,分微观和宏观两个角度。在微观层面,针对个体流动探究手机数据集特征对人类移动性指标的影响8。在宏观层面,多将从手机信令数据中提取的人群流动特征与官方统计的旅行日志进行对比9。少量研究通过外置 GPS设备采集定位数据,以此为基准测量手机信令数据的定位偏差10,但该方法的样本区域远小于手机信令数据的覆盖范围,缺乏推广应用的潜力。本文将一组由原始手机信令数据预先编译生成的起讫点(origin-destination,OD)数据应用于分析城市人口分布、区域间流动及识别城市热点,并结合多源数据对分析结果进行验证,研究手机信令数据在城市空间分析中的不确定性,以了解手机信令数据在城市感知领域的优势和局限性,提高手机信令数据分析的可靠性。1 研究区域和数据源本文研究区域为广东省深圳市。深圳市近年来发展迅速,城市现代化程度很高,截至 2018年末,常住人口有 1 302万人,人口密度达 6 484人/km2,位居全国前列。实验数据是 2019年某工作日的手机信令 OD数据,数据汇集网格大小为 250 m,时间窗口为 1 h。研究区域及数据分布密度如图 1所示。实验及验证数据集详情如表 1所示。2 多源数据验证的不确定性分析方法为了分析手机信令数据在城市感知应用中的不确定性,本文以人口网格数据、营运车辆 GPS 数据及高德兴趣点(point of interest,POI)数据为参考数据集,首先分别提取实验数据集和验证数据集中对应的分析特征,然后对提取出的分析特征进行对比验证,定义人群代表性、转移覆盖率、聚集一致性 3个指标分别对分布、转移、聚集 3个分析特征进行评价,得出不确定性分析结果,提出改善方法。2.1分析特征提取1)时空分布特征。以往研究使用手机信令数据估计城市人口分布时,通常假设手机通信活跃量与人口分布成正比,但由于现实中通信活跃量有时空差异,用手机数据分布推断人口分布存在一定偏差。本文提取手机信令数据的时空分布特征,以探究该偏差的具体表现。验证数据集为 WorldPop 人口网格数据11,网格大小为 100 m,通过重采样将数据匹配到与手机数据相同的 250 m网格中。2)区域转移矩阵。手机 OD 数据集可被用于分析城市区域间的人群流动,对应的分析特征为转移矩阵。首先将 OD 数据集中的起点和终点对应到深圳市的 10个行政区中,删除起点和终点在相同区的记录;然后构建10 10的转移矩阵,矩阵值是以纵轴为起点,横轴为终点的记录数。该矩阵按照同一起点进行标准化。用于验证的营运车辆 GPS 数据包括出租车、公交车、货车等营运车辆定时上传的GPS 数据,经过起点-终点提取后,采用与实验数据相同的方法提取区域转移矩阵。3)聚集热点。手机信令数据可被用于识别城市职住空间分布,一般用手机信令数据密度分布进行空间聚类与密度分级,识别居住和就业功能区12。分别对上班时段(07:0010:00)、下班时段(17:0020:00)OD数据集中的起点与终点进行具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN),提取聚类中心。验证数据集为高德 POI数据,提取 POI中类别为住宅和公司企业的数据,利用 DBSCAN 对其进行聚类,并在ArcGIS中进行核密度分析,提取POI热点。2.2验证方法及指标1)人口分布。以往研究通常利用手机信令数据模拟城市人口分布,但很少将其与实际人口进行对比。本文选取 3个模型探究手机信令数据通信量与参考人口数据间的关系:P=V+(1)P=i=0kiVi(2)lgP=lgV+(3)式中,P为因变量,表示将参考人口数据重采样到实验网格后,每个网格包含的人口总量;V为自变量,表示每个网格内的通信总量,包含该网格内的起点图 1研究区域Fig.1The Study Area表 1实验数据及验证数据详情Tab.1Details of Experimental Data and Validation Data数据名称手机信令数据WorldPop人口网格数据营运车辆 GPS数据高德 POI数据数据类型实验数据验证数据验证数据验证数据格式csvtiffcsvcsv时间节点2019年初2019年2018年底2019年样本数量4 816 903-2 133 6961 334 38845测绘地理信息2023 年 2 月和终点记录;、分别为自变量系数和常数项。手机数据时间窗口为 1 h,共 24个时间窗口,将每个小时的手机数据作为自变量,每个模型产生 24组参数。将全天的手机数据总量作为自变量,每个模型产生 1组参数。用 Spearman相关系数与均方根误差(root mean square error,RMSE)衡量模型的拟合程度。定义所有模拟中的最大值为人群代表性(representativeness of population,ROP),用于衡量手机数据最多能解释人口分布的程度:ROP=max fi(Vj),P (4)式中,fi代表第i个模型;Vj代表第j个手机数据集。2)区域转移。假设营运车辆出行占所有出行方式的比例相同,在不考虑出行方式的情况下,将手机数

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开