·120·科技纵横农业开发与装备2023年第5期基于网络语义分析的武汉锦里沟风景区游客体验性评价耿凌顶1黄鑫萍2(1.大连大学国际学院,辽宁大连116622;2.武汉轻工大学管理学院,湖北武汉430048)摘要:互联网时代游客留下了大量对风景区的评价信息,将这些信息进行语义数据分析,可以为景区的发展指明道路。以武汉锦里沟景区为实证对象,利用网络语义分析软件,将游客的正、负面评价进行数据挖掘,找出了景区优劣势,为景区发展策略的制定提供直接依据。关键词:武汉锦里沟风景区,网络语义分析,游客评价0引言语义分析是通过对语言本身的文字、符号、语境等进行解析,发掘那些不能通过普通阅读所掌握的深层意义。网络语义分析是在语义分析的基础之上,通过对人们在网络上留下的语言进行深层分析,充分发掘网络语言背后人们的观点、立场以及情感等要素。武汉锦里沟是武汉市木兰山5A旅游景区群的核心景区之一,本文主要运用“八爪鱼”这一爬虫软件和武汉大学开发的ROSTCM6这一语义网络分析软件,以武汉锦里沟风景区为实证对象,利用游客对景区评价作为研究数据来源,探究游客的情感倾向和具体需求,为景区的建设发展提出可行的建议。1数据收集及处理1.1数据收集在互联网大发展的背景下,游客可以在各种网络平台上发表自己对景区的评论,这些评论蕴含着游客最真实的情感,不仅影响其他游客对于该景区的印象以及消费决策,也是对景区进行整改完善的直接依据。本文以武汉锦里沟为研究对象,利用“八爪鱼”软件搜集了景区在美团、去哪儿、携程以及飞猪四大在线旅游平台8126条游客评论(表1)。表1四大平台游客评价统计表网站名称游客评论数量美团4073携程1582去哪儿1728飞猪743合计81261.2数据预处理由于互联网平台的开放性,游客评论语言在字数、语法、格式上都存在很大的随意性,因此需要利用爬虫软件对收集到的这些评论文本进行预处理。数据的预处理主要包含三个环节,首先是删除诸如“好”“很好”“不行”等等只有一两个字、过于简短且不能产生语义关联的游客评论。其次是去掉诸如“好好…”“差差…”“垃圾垃圾…”等将一个字或者一个词多次复制粘贴,凑字数的评论。最后就是删除那些为获取平台上的评价积分,直接复制粘贴其他游客的评价。1.3分词处理及二分化处理经过数据预处理后,已经得出有效数据。但是游客评价大多是较长的句子,为了挖掘景区游客评价的热点,需要利用ROSTCM6软件的分词处理功能,将评论的长句子进行分词处理,抽取出游客评...