第48卷第1期2023年2月Vol.48No.1Feb.2023测绘地理信息JournalofGeomatics基于条件随机场的多特征未登录地址元素识别方法张帅1,2,3张红伟41重庆交通大学土木工程学院,重庆,4000742广西空间信息与测绘重点实验室,广西桂林,5410023城市空间信息工程北京市重点实验室,北京,1000384武汉大学电子信息学院,湖北武汉,430072AnIdentificationMethodofUnknownAddressElementsBasedonConditionalRandomFieldConsideringMultipleFeaturesZHANGShuai1,2,3ZHANGHongwei41SchoolofCivilEngineering,ChongqingJiaotongUniversity,Chongqing400074,China2GuangxiKeyLaboratoryofSpatialInformationandGeomatics,Guilin541002,China3BeijingKeyLaboratoryofUrbanSpatialInformationEngineering,Beijing100038,China4SchoolofElectronicInformation,WuhanUniversity,Wuhan430072,China摘要:在基于地址匹配的位置服务中,分词词典和地址数据库更新不及时会导致地址切分和地址匹配准确性降低,无法实现定位或定位错误。因此,快速准确地识别未登录地址元素,扩充和更新分词词典具有重要意义。针对现有方法的不足,提出了一种基于条件随机场的多特征未登录地址元素识别方法,结合了词法特征、语义特征、字词特征、构词能力特征。根据这些特征建立条件随机场模型对未登录地址元素进行识别分析。实验结果表明,未登录地址元素识别精确率、召回率、F1值分别达到了95.1%、94.9%、95.0%。关键词:地址匹配;未登录地址元素;条件随机场;特征选择;识别分析中图分类号:P208文献标志码:AAbstract:Inthelocationservicebasedonaddressmatching,theaccuracyofaddresssegmentationandaddressmatchingisreducedduetotheuntimelyupdateofwordsegmentationdic⁃tionaryandaddressdatabase.Therefore,itisimportanttoquicklyandaccuratelyidentifytheunknownaddresselementsandexpandandupdatethewordsegmentationdictionary.Aimingattheshortcomingsoftheexistingmethods,wepro⁃poseanidentificationmethodofunknownaddresselementsbasedonconditionalrandomfieldconsideringmultiplefea⁃tures,whichcombineslexicalfeatures,semanticfeatures,wordfeaturesandwordformationabilityfeatures.Thenweestablishaconditionalrandomfieldmodeltoidentifyandana⁃lyzetheunknownaddresselementsaccordingtothesefea⁃tures.Theexperimentalresultsshowtha...