温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
网络
语义
分析
武汉
锦里沟
风景区
游客
体验
评价
耿凌顶
120科 技 纵 横农业开发与装备 2023年第5期基于网络语义分析的武汉锦里沟风景区游客体验性评价耿凌顶1 黄鑫萍2(1.大连大学国际学院,辽宁大连 116622;2.武汉轻工大学管理学院,湖北武汉 430048)摘要:互联网时代游客留下了大量对风景区的评价信息,将这些信息进行语义数据分析,可以为景区的发展指明道路。以武汉锦里沟景区为实证对象,利用网络语义分析软件,将游客的正、负面评价进行数据挖掘,找出了景区优劣势,为景区发展策略的制定提供直接依据。关键词:武汉锦里沟风景区,网络语义分析,游客评价0 引言语义分析是通过对语言本身的文字、符号、语境等进行解析,发掘那些不能通过普通阅读所掌握的深层意义。网络语义分析是在语义分析的基础之上,通过对人们在网络上留下的语言进行深层分析,充分发掘网络语言背后人们的观点、立场以及情感等要素。武汉锦里沟是武汉市木兰山5A旅游景区群的核心景区之一,本文主要运用“八爪鱼”这一爬虫软件和武汉大学开发的ROSTCM6这一语义网络分析软件,以武汉锦里沟风景区为实证对象,利用游客对景区评价作为研究数据来源,探究游客的情感倾向和具体需求,为景区的建设发展提出可行的建议。1 数据收集及处理1.1 数据收集在互联网大发展的背景下,游客可以在各种网络平台上发表自己对景区的评论,这些评论蕴含着游客最真实的情感,不仅影响其他游客对于该景区的印象以及消费决策,也是对景区进行整改完善的直接依据。本文以武汉锦里沟为研究对象,利用“八爪鱼”软件搜集了景区在美团、去哪儿、携程以及飞猪四大在线旅游平台8 126条游客评论(表1)。表1 四大平台游客评价统计表网站名称游客评论数量美团4073携程1582去哪儿1728飞猪743合计81261.2 数据预处理由于互联网平台的开放性,游客评论语言在字数、语法、格式上都存在很大的随意性,因此需要利用爬虫软件对收集到的这些评论文本进行预处理。数据的预处理主要包含三个环节,首先是删除诸如“好”“很好”“不行”等等只有一两个字、过于简短且不能产生语义关联的游客评论。其次是去掉诸如“好好”“差差”“垃圾垃圾”等将一个字或者一个词多次复制粘贴,凑字数的评论。最后就是删除那些为获取平台上的评价积分,直接复制粘贴其他游客的评价。1.3 分词处理及二分化处理经过数据预处理后,已经得出有效数据。但是游客评价大多是较长的句子,为了挖掘景区游客评价的热点,需要利用ROSTCM6软件的分词处理功能,将评论的长句子进行分词处理,抽取出游客评价的高频词汇和热点词汇。分词处理以后就可以利用ROSTCM6软件进行情感分析,也就是将文本分成正面、负面评价,进行二分化处理。其基本原理是根据每条的字、词包含的情感积极性的高低打出不同的分数,一条评论中正面评价词汇越多,分数就越高,相反负面评价的分数为负数,0分为中性评论。表2是表1进行预处理后,剩余7 124条评论二分化处理结果。2 基于语义网络分析的游客正面评价分析为了更加深入地了解景区哪些具体因素引发了游客的积极情感,以及这些积极因素之间的相互关系,作者简介:耿凌顶(2001),男,湖北武汉人,本科在读,乡村旅游专业。121科 技 纵 横农业开发与装备 2023年第5期将5 137条正面评价和ROSTCM6语言网络分析功能,可以构建游客在线正面评价的语义网络分析图(图1)。表2 二分化处理结果表评论性质数量(条)比例(%)正面513771.21负面142319.72中性6549.07图1 武汉锦里沟景区游客正面评价语义网络图通过图1可以看出景区存在以下优势:1)“锦里沟”和“景区”这两个界定研究对象的节点同时指向了“风景”节点,而“风景”又指向了“很好”这一节点,说明大多数游客认为锦里沟景区“风景优美、景色不错”。2)“工作人员”“服务”“态度”这几个一二级节点与“很好”这个一级节点构成了一个封闭的四边形,不难得出该景区内工作人员的服务态度很好是引发锦里沟景区的游客正面情感的一大因素。3)一级节点“好玩”关联了“山道”“滑车”“玻璃桥”“玻璃”“漂流”“项目”等多个次级节点,说明景区内项目较多,收获了不少游客特别是小孩子们的喜爱。4)“土家”“风情”“文化”这三个节点之间构成了一个封闭三角形,证明景区土家族的少数民族文化给较多游客留下了深刻的印象,事实上锦里沟景区是武汉市唯一的土苗文化风情区,文化特色鲜明。5)“网上”“划算”这两个一级节点与“买票”节点形成了一个封闭的三角形,表明了大多数游客认为锦里沟景区在网上购票十分划算。实践中武汉锦里沟是木兰山5A旅游景区群中,最早“触网”并推行团购的景区。3 基于语义网络分析的游客负面评价分析同理,为了挖掘导致锦里沟景区游客产生负面情绪的主要因素,以及这些因素之间的相互关系,可以通过1 423条负面评价,构建负面评价语义网络图(图2)来完成。图2 锦里沟景区游客负面评价语义网络图通过图2可以看出景区存在以下问题:1)景区收费混乱。图2中“项目”“收费”“门票”都是高频词汇,并且“景区”“项目”“门票”“玩的”这四个节点都指向了“收费”节点。在负面评价文本中通过搜索“收费”,可以发现很多游客反映景区存在胡乱收费现象。2)景区配套设施不完善。在负面评价语义图中可以看到“配套”“设施”“不完善”节点之间形成了一个封闭的三角形,显然游客认为景区配套设施不够完善。通过在游客负面评价文本中搜索这三个词语发现,很多游客反映景区垃圾桶太少、没有路标。3)工作人员数量少、素质较低。图2中,“服务”“人员”“态度”“管理”这四个节点构成了一个封闭的四边形,可以看出游客十分看重景区内服务人员的态度及管理。除此之外,“景区”“工作人员”“太少”节点之间也构成了一个封闭的三角形。浏览景区负面评价文本,可以得知该景区内的工作人员很少,无法问路,还有部分游客认为景区工作人员态度不热情。4)景区环境卫生问题突出。在负面评价语义分析图中可以看到“垃圾”节点直接指向了“有点多”节点。在语义分析中,“垃圾”这一词汇可以是形容词,体现游客对景区的负面评价,同时也可以作为名词,说明游客认为景区内的垃圾较多,污染了环境。结合负面评价文本分析,确实存在部分游客为了吐槽景区而形容其很“垃圾”,而更多的游客评论景区环境卫生条件差,“垃圾很多”。5)景区周边道路设计不合理。从图2中可以看到,“道路”节点上的连接弧较多,“不好走”以及“景区”节点直接指向了“道路”,说明游客认为该景区的道路不好走。通过结合所有的负面评价文本进122科 技 纵 横农业开发与装备 2023年第5期行综合分析,发现游客主要抱怨这些交通问题:首先是景区内部路况很差,山路、泥巴路多,景区外部道理路弯弯绕绕,道路不平整,安全隐患较大,其次是景区的路上路标很少,游客导入性不足,最后是景区周边堵车严重,缺乏工作人员进行疏通。事实上,锦里沟景区位于武汉市边远的黄陂区,属于大别山南麓余脉,交通设施建设任重道远。4 结语在“互联网+”时代,各大网络平台上已经形成了海量的游客评论数据。与此同时,随着计算机科学的发展,人工智能改变了人类与计算机的交流方式,运用人工智能进行语义数据挖掘,可以在对现实世界中的事物进行描述的语言中探索出更多有用的数据和信息。本文以武汉市锦里沟景区的网络评价为数据来源,运用相关的语义网络分析工具,对这些文本正、负面评价进行了进一步挖掘,既为景区发展起到导向作用,也是对语义数据网络分析的一次有益的探索。参考文献1陆玉雄,冉维维.基于网络文本分析的影视旅游游客满意度研究以贵州都匀秦汉影视城为例J.旅游纵览,2021(08):9-12.2曹宛如.基于文本挖掘的旅游目的地游客旅游满意度探析J.当代旅游,2021,19(11:28-29).3王少兵,吴升.采用在线评论的景点个性化推荐J.华侨大学学报(自然科学版),2018,39(03):467-472.4王少兵,吴升.基于景点在线评论文本的游客关注度和情感分析J.贵州大学学报(自然科学版),2017,34(06):69-73.