温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
网络
评论
产品
消费
偏好
分析
泡泡
特为
缪育霖
收稿日期:20221109*本文系国家社会科学基金项目青年项目“多源数据下消费者在线行为模式及多维客户洞察方法”(项目编号:19CGL024)研究成果之一。作者简介:缪育霖(1999),男,2021 级硕士研究生,研究方向为消费者行为、数据挖掘;国琳(1987),女,博士,讲师,研究方向为数据挖掘、社会化网络、消费行为分析。基于网络评论的盲盒产品消费者偏好分析*以泡泡玛特为例缪育霖国琳(长春理工大学经济管理学院吉林长春130022)摘要:目的/意义 盲盒消费已经成为当下最受“Z 世代”群体欢迎的消费模式之一,通过挖掘消费者对于盲盒产品的属性偏好以及情感倾向,有助于企业了解自身产品的优势和劣势,并为企业提供改进产品质量和提升消费者黏性等方面的建议。方法/过程 基于京东上购买泡泡玛特手办盲盒的消费者在线评论数据,运用 Python 进行中文分词并得到高频词词云图。采用共词分析方法,通过构建高频关键词的共词矩阵,运用 SPSS 软件对高频关键词进行聚类分析得到消费者对于盲盒产品的属性偏好。另外,通过采用词典匹配的情感分析算法,研究了消费者对产品属性的偏好和情感倾向间的关系。结果/结论 研究得到了五类盲盒产品属性偏好,并发现在其对应的情感倾向上存在着明显的差异,研究结果为盲盒制造企业进行产品和服务改进提供了方向。关键词:盲盒;共词分析;情感分析;评论挖掘;泡泡玛特中图分类号:F71355文献标识码:Adoi:103969/jissn10058095202304015Consumer Preference Analysis of Blind Box Products Based on Online eviews:Case Study of POP MATMiao YulinGuo Lin(School of Economics and Management Changchun University of Science and Technology Changchun Jilin 130022)Abstract:Purpose/significanceBlind box consumption has become one of the most popular consumption patterns among Gener-ation Z group By mining the attribute preference and emotional tendency of consumers for blind box products it can help enterprises un-derstand the advantages and disadvantages of their own products and provide suggestions for enterprises to improve product quality andenhance consumer stickiness Method/processBased on the online review data of consumers who bought Popmart blind box on JDplatform the paper uses Python to perform Chinese word segmentation and obtain the high frequency word cloud image It uses the coword analysis method to build the coword matrix of highfrequency keywords and uses the SPSS software to cluster the highfrequencykeywords to get consumersattribute preferences for blind box products In addition the relationship between consumerspreference forproduct attributes and their emotional tendency is studied by using sentiment analysis algorithm of dictionary matching esult/conclu-sionThe research obtains five types of blind box product attribute preferences and there are significant differences in their correspond-ing emotional tendencies The research results provide a direction for blind box manufacturers to improve their products and servicesKeywords:blind box;coword analysis;emotional analysis;comment mining;POP MAT0引言盲盒是消费者在购买之前并不知道具体产品的盒子,其通常装的是动漫影视联名、真实人物形象,或者设计师单独设计出来的玩偶,也称手办1。从2019 年盲盒经济在我国形成一种火爆的经济现象开始2,各类盲盒消费新形态也开始不断涌现,如考古盲盒、衣鞋盲盒、文具盲盒、甚至机票盲盒等(本文研究对象为手办盲盒),盲盒消费已经成为当下最受592023 年 4 月Apr 2023情报探索Information esearch第 4 期(总 306 期)No 4(Serial No 306)“Z 世代”群体欢迎的消费模式之一3,对其进行研究也具有较强的现实意义。启信宝数据显示,全国与盲盒潮玩等相关的企业,从 2017 年的 1 935 家新增至 2021 年 5 054 家,增长迅速。此外,随着网络购物的不断发展,尤其是后疫情时代,越来越多的人愿意在网上购买产品与服务4,其评论信息能使商家直接得到消费者的反馈。面对复杂的盲盒市场环境,如何从海量的在线评论中提取有关用户关心的主题、满意度等信息来应对市场竞争成为企业亟须解决的现实问题。1相关研究述评共词分析法最早在法国被提出4,并由 Law 等率先运用来分析环境酸化研究中的政策和科学变化地图6,并以此为例发文验证共词分析方法7。在我国,共词分析方法已经被广泛应用到许多领域,其中大多数应用是在文献计量学中基于词来分析某一学科的研究热点。例如:张晓东等8 运用共词分析法得到我国计算机集成制造系统研究热点的变化情况;周建等9 利用共词分析、聚类分析、战略坐标分析等方法,归纳了情感分析领域的研究热点与发展趋势。一部分学者还基于主题来应用共词分析方法,例如:王一博等10 运用共词分析方法得到以大数据为主题的优质期刊的 10 个主题类团,并分析了每个主题的成熟程度和重要程度;唐婷等11 利用共词分析方法生成共词矩阵,并以此为基础,通过多元统计分析和战略坐标分析确定了目前我国知识管理领域研究的核心主题。还有一部分学者则是基于时间维度来研究主题的演变,例如:朱光等12 结合LDA 主题模型和共词分析绘制主题凝聚子群,并以此为基础从时序关联、结构表征两个维度梳理了信息隐私前沿和热点主题的演化变迁;闫晓13 运用共词分析、块模型等方法分析得到了国际运动心理学动机研究主题及演化的 3 个阶段。基于情感词典的情感分析研究方面,国外最早构建的英文情感词典是 SentiWordNet14 情感词典,而国内主流的中文情感词典主要有台湾大学 NT-USD 情感极性词典15、知网 How Net 情感词典16 和大连理工情感词汇本体库17 等。考虑情感词典的规模大小,美国谷歌公司的研究者基于图传播的算法在网上挖掘出容量达到 17 余万的大规模英文情感词典,并在情感分类任务上取得了很好的结果18。国内学者赵妍妍等19 基于文本统计算法,利用微博数据构建了十万词语/词组的大规模情感词典,并将其运用在微博情感分类上。在情感词典灵活性上,针对特定的研究领域,国内学者蒋翠清等20 以 HowNet 情感词典为种子,基于 PMI 和Word2Vec 方法识别了汽车评论文本中的情感极性,并构建了专用于汽车业务领域的情感词典。尽管共词分析方法和情感词典分析的研究对象比较广泛,且各自的研究方法也较为成熟,但是针对盲盒的研究目前还处于空白阶段。同时在以往的相关研究中,一些学者采用的是词频分析法,只关注单个关键词的词频,而本文选择的共词分析方法不仅能分析高频词,而且能关注到这些词之间的联系,对于短文本的评论信息具有更好的聚类效果,同时本文通过采用词典匹配的情感分析算法对聚类结果中关键词所在评论文本进行情感分析,可以按偏好类型定性地分析产品的优势与劣势,为盲盒企业提出产品改进建议,引导盲盒产业健康发展。2数据来源与预处理本文数据来源于泡泡玛特京东旗舰店,通过借助八爪鱼软件采集泡泡玛特京东旗舰店不同盲盒商品的评论数据,爬取字段为:消费者 ID、评价内容、时间、类型以及追评内容,爬取时间为 2020 年 3月2022 年 4 月,涵盖了泡泡玛特旗下的 33 个 IP,并对爬取后的数据进行清洗。对于不同干扰数据,采取不同的处理方式:(1)重复项,在数据预处理时将其筛选出来,保留重复数据中的一条;(2)缺失值:通过查找筛选出空缺值,予以删除;(3)冗余项:对于无关评论,则是采用人工剔除的方法。经过以上数据处理,本文得到的有效评论数据为 16 549 条。接着采用 Python 中的 jieba 中文分词工具将上述评论数据进行分词,考虑到一些网络用语在分词中不容易被识别,在运行过程中添加了 add_word_list 文本,同时做了去停用词与合并同义词的处理。经过上述处理,本文共获得原始关键词 3266 个,选取频次大于 3 的词为高频关键词,并选取前 10%作为分析对象,共计 91 个,绘制的词云图如图 1 所示。3高频词共词分析31构造关键词共词关系矩阵本文通过对 91 个高频关键词进行两两共词检索,统计他们在相同评论文本中同时出现的频率,从而得到一个 9191 的共词矩阵,部分结果如表 1 所示。692023 年 4 月情报探索第 4 期(总 306 期)图 1高频关键词词云图表 1高频词共词矩阵(部分)高频关键词质感物流速度瑕疵运气朋友正品产品质量产品包装外形外观优惠活动盒子质感70145481125289543203511528物流速度4564715193941932337175瑕疵481541299283030391314运气11199484128128953朋友2539912699253920231920正品2894128825581572942981423产品质量5493301239576752761356产品包装320233082029427475349742外形外观3513739923298613496101232优惠活动15171351914357122837盒子2851432023642327306表 1 所显示的共词矩阵是一个对称矩阵,对角线上的数据表示该关键词出现的总频次,非对角线上的数据表示 2 个关键词在同一条评论中共同出现的次数。如高频关键词“实体店”与“正品”的共词频次为 22 次,表示有 22 位消费者的购物评论中同时出现了这两个关键词。为了更好地比较不同关键词之间的关系,本文选择 Ochiia 系数来计算共现指数以表示关键词的共现强度21,其计算公式如下:Ochiia 系数=A B槡A槡B(1)其中 A、B 为关键词出现的总频次。先用 Ochiia 系数将共词矩阵转化为表示 2 个关键词相似程度的相关矩阵,再用“1”与相关矩阵上的所