温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
用户
分群
数字
社区
消费
特征
分析
服务
效能
提升
研究
黎灿垚
2023年第35卷第2期基于用户分群的数字社区消费者多模态特征分析与服务效能提升研究黎灿垚1,韦伟1,刘晓丽1,周林兴2*,王帅2(1.广西中烟工业有限责任公司,南宁530001;2.上海大学文化遗产与信息管理学院,上海200444)摘要:目的/意义对数字社区消费者进行多模态特征分析与服务效能提升,有助于为数智赋能在线社区建设提供新视野、为相关部门部署数字决策提供新动能。方法/过程结合社区特性构建用于消费者分群的数据维度,将维度下的 24 个指标数据进行二次聚合后实现分群,并构造参数、决策变量及函数表,从而分析消费者多模态特征,基于这些特征实现数字消费服务效能的提升。结果/结论实证分析结果表明,本文模型能够生成合理有效的分群结果,进而实现类群特征区分以及群间渗透与漂移现象分析;分群结果呈现出 6 类消费者群体:重点、中心、特殊、沉睡、流失和一般类群,绝大多数类群都会产生用户渗透现象,仅有一般用户类群会发生群间漂移现象;服务效能提升模型表明最受关注价值的群体为中心和重点类群。关键词:用户分群;AP-DBSCAN;多模态特征;数字社区;数字消费中图分类号:G250文献标识码:A文章编号:1002-1248(2023)02-0030-15引用本文:黎灿垚,韦伟,刘晓丽,等.基于用户分群的数字社区消费者多模态特征分析与服务效能提升研究J.农业图书情报学报,2023,35(2):30-44.收稿日期:2023-01-06基金项目:广西中烟工业有限责任公司科技项目“基于机器学习方法的营销活动效果动态评估”(CGAXZX20210030050001-044);江苏省社会科学基金青年基金“社会感知数据驱动下的公共卫生事件时空演化研判机制研究”(20TQC001);中国博士后科学基金特别资助“面向应急管理的时空数据语义模型构建及创新应用机理研究”(2021T140311);中国博士后科学基金面上项目“环境污染突发事件的时空数据挖掘及协同治理机制研究”(2019M650108)作者简介:黎灿垚(1972-),男,硕士研究生,研究方向为卷烟互联网营销工作研究与实施管理。韦伟(1986-),女,研究方向为卷烟行业互联网营销及研究。刘晓丽(1978-),女,研究方向为卷烟行业互联网营销及研究。王帅(1996-),男,博士研究生,研究方向为数据分析与挖掘*通信作者:周林兴(1974-),男,教授,博士生导师,研究方向为政府数据治理。Email:DOI:10.13998/ki.issn1002-1248.23-00851引言近年数字消费为居民打开了智能生活新格局,其定义是通过数字社区对产品服务进行推广及销售的实践活动1。“十四五”规划纲要明确提出数字中国战略,旨在把握时代机遇、加快数字经济发展,以数字化转型催生产业新模态、壮大经济新引擎2,数字消费数字营销专题302023年第35卷第2期成为当今创新领跑的重要生产力。面向数字社区呈现出的新特征进行研究,有助于把握消费者行为风向和心理变化,使企业和相关单位更充分地融入数字化队列。然而,数字消费活动重视渠道成本、泛化自媒体宣传和忽视社群维系的发展路径,同样为消费者带来产品内容同质化、信息虚假化和零售模式单一化等不可忽视的负面影响3。受同类问题影响,消费者表现出一定的潜在抗拒态势,具体而言集中在群体个性化不突出、内容接受层次浅和资产意识缺失方面。究其原因,数字产品供应厂商并未真正理解消费群体,缺乏与偏好高度匹配的精细运营模式,使其较难通过数字社区消费活动满足实际需求,如何以消费者为中心开展服务优化逐渐成为研究热点。消费者是数字社区活动的参与主体,也是数字信息消费主体4,基于分群技术对其进行深入分析和特征解读能够保障主体满意度,进而通过服务布局优化提升社区运营效能。基于此,本研究面向数字社区消费者进行分群,并开展社区服务效能提升分析,为数字中国建设提供新视野、为数智赋能提供新方案。2研究现状2.1数字社区消费活动类型与内容数字社区消费活动可以归结为4种类型:分别是区域、媒介、产品和新技术类。区域类划分依赖消费者居住地,横向上分为境内5和境外6,纵向上通过中国行政区域管辖范围确定。媒介类以活动传播载体为划分依据,包括软件和硬件两种,对于前者,又涉及基于“互联网+平台”7进行的、基于APP或社群8和基于生态圈9运作的3类情形;后者则涵盖VR技术下的可穿戴设备10和新型智能终端11两种物理载体。产品类消费活动以商品或品牌宣传为目标导向铺设数字化方案,以产品功能实现12、信息集成13和数字资产14等内容为基点开展推广活动。数字类特指运用AI、AR和眼动追踪等高精尖技术,针对某一品牌进行战略创新而提出SEO或PPC等数字消费推广策略进而建立生态信息反馈渠道的方案15。数字社区研究内容主要归纳为4个方面:活力激发与运营策略16,重点对数字活动运营机制进行分析精准化内容传播与用户解读17,重点对精细化数字内容推荐机制和消费用户进行分析;人才培育及能力建设18,重点对国家数字化战略下的人才能力培育策略进行分析;前沿理论与技术应用19,20,重点分析领域前沿理论和技术的应用场景。2.2用户画像与分群研究用户画像起源于电商领域,其定义包括3个方面内容21,分别是作为画像构建前提的数据搜集工作、作为体现画像强关联性的业务关联工作和作为用户解读基础的数据挖掘工作。画像目的是把用户抽象成差异性标签进行描述,从而实现特征区分,对用户开展行为、需求和偏好解读22。在画像实现方面,现有研究主要可以分为4类,分别是面向用户偏好的实现方案23、面向情绪的实现方案24、面向主题的实现方案25和面向用户行为的实现方案26。能够发现,画像技术已经在图情领域广泛应用27,与其较为接近的技术是用户分群。用户分群是从用户画像概念下衍生出来的二次聚合概念,延伸到消费活动方面,分群对企业来说是一种降低成本且提高用户解析效率的方法28,相较于画像,它能够归结群体特点、群体网络、交互关系和行为偏好等多模态信息。目前,用户分群方法使用率较低,较有代表性的是占张帆29面向产品知识推送所开展的用户分群研究,该研究在分析用户偏好基础上,对分群模型进行形式化定义并利用偏好扩散和提取两种特征基于聚类算法设计分群方案。实现技术主要分为数学建模和机器学习,前者指通过设计专门算法实现分群,如宋嵩30面向URL数据设计专门算法实现分群;后者指将既有算法输入到机器学习模型中进行训练实现自动分群,如吴艳玲和孙思阳31采用自适应自然梯度算法实现用户聚类的最佳分群效果。2.3在线服务效能提升研究在线服务作为移动互联网时代新的服务方式,与其他相对成熟的模式相比在交互层次、支撑模式与体黎灿垚,韦伟,刘晓丽,周林兴,王帅基于用户分群的数字社区消费者多模态特征分析与服务效能提升研究312023年第35卷第2期验感知方面存在巨大差异,特别是在线消费活动常伴随大量的即时通讯消息和互动32,如何保证在线服务质量和水平、提升用户感知满意度已成为亟待解决的问题。现有研究可以根据目标导向分为5类,分别是:以管理效能提升为导向,如陈长庆33以途牛网为例研究服务质量改进对平台盈利的影响;以服务效能优化为导向,如王婉等34运用扎根理论分析用户访谈质性资料,并构建数智环境下在线社区用户服务需求的理论模型;以环境效能改善为导向,如张邦辉等35发现在线政务服务为营商环境带来了“数字红利”,可以通过赋能在线服务环境提高企业用户营商评价和市场化程度;以布局调整为导向,如于丽娟36通过分析“互联网+智慧服务”优化数字阅读精准推广模式的意义,从多维度剖析优化布局下的创新机制和发展驱动力;以用户价值为导向,如王毅和吴睿青37结合画像提出公共图书馆用户价值优化策略。可以发现,既有研究虽然覆盖有相当一部分针对用户开展的分析,但这些分析主要集中在精细化运营方案的制定方面,尚缺乏数字社区服务视角下的效能提升研究。另一方面,画像技术虽然能够较贴切地呈现用户信息概貌,但群间多模态特征的横向比对和差异性归因能力一般。基于此,本文从价值发现角度,通过聚合画像实现分群,据此分析数字社区消费者群体的多模态特征,并提出服务效能提升方案。3研究设计3.1面向数字社区消费者的多模态特征分析3.1.1分群指标体系建立多模态特征分析,是指对多源异构数据融合与特征挖掘的过程。经对实证数据进行融合与特征挖掘,共提取到画像、群偏好、活动影响力和群消费能级4个特征数据维度。为便于表述将数字消费活动简称为“活动”、消费者简称为“用户”。(1)画像维度。观察国内外用户画像构建特点,发现所用指标可分为用户基本信息38、社交情况39和UGC40(Users Generated Contents,UGC)三大类,画像指标及对应含义如表1所示。表1中的用户地区、UGC主题和关键词则须经数据加工过程才能转化为画像标签和分群依据,过程如下:用户地区按省级(或直辖)管辖区域分为华北地区、华东地区、东北地区、华中地区、华南地区、西南地区、西北和港澳台及海外地区;UGC主题、关键词使用LDA进行提取和挖掘;情感倾向抽取参照情感识别方法24进行;将活动时长和社交指标下的点赞、评论情况按极值区间均等化分为低、中、高程度。(2)群偏好维度及数据加工。挖掘群偏好有助于发现用户行为背后的潜在知识和问题41,为有效反映一级指标 二级指标 对应含义 用户昵称 参与活动用户的 Users ID 用户性别 参与活动用户的性别 用户年龄 参与活动用户的年龄 用户地区 参与活动用户所在地区 用户基本信息 活动时长 用户参与活动的时间跨度(单位;d)文本点赞数 发帖点赞与回帖点赞数之和 社交情况 文本评论数 发帖评论与回帖评论数之和 UGC 主题 用户生成的文本内容主题 UGC 关键词 用户生成文本内容主题下的关键词 UGC 内容 UGC 情感倾向 用户生成 UGC 的情感倾向 表1用户画像指标Table 1 User profile indicatorsDOI:10.13998/ki.issn1002-1248.23-0085数字营销专题322023年第35卷第2期数字社区用户原貌、提升分群科学性,筛选出用于分析的4个一级指标,如表2所示。表2需要进行数据加工的二级指标有5个:其中活动、消费频率相对指数和活动倾向评分利用力度指数公式实现,据值域分为“低、中、高”3个层次;产品倾向通过Logistic回归实现;兴趣矩阵量级参照势能公式改写计算,包括“低、中、高”3个层次;活动参与时间按早(02:0010:00)、午(10:0118:00)、晚(18:0102:00)划分。(3)群活动影响力维度。包括3个一级指标,分别是:平均用户价值计算得分,用于评估用户对活动主体的整体价值,通过访客平均(UV)价值公式计算;用户裂变病毒系数K值,用于表现用户裂变能力并侧面表征其潜在价值,通过病毒系数计算(访客邀请转化率的百分比形式);用户盈利能力计算得分,用于反映数字社区创收价值,据经济学获利能力模型算得分值并按值域均分为“低、中、高”3个层级输出。(4)群消费能级维度。包括两个方面的内容,分别是商业价值评定42和消费倾向预测43,将其作为维度下的一级指标使用。前者包括自适应决策边界下的消费层级、数值计算下的消费概率和GBDT下的消费能力;后者则包括基于线性回归的显隐性商业价值水平评定两个角度;由此生成5个二级指标并按均等值域区间将上述内容划分为“低、中、高”三档。3.1.2分群过程及其实现实现分群的第一步是用户分层,即将用户按各自特征分成若干个互不重叠的部分,每一部分称之为“层”,目的在于对用户进行初步分类44进而反映其需求,但分层方法易忽视行为数据落差、割裂用户间交互情况,难从全局解读用户参与数字社区活动所表征现象的动因,因此本研究通过画像构建达到同等分层效果。分层后对画像数据进行聚合从而实现分群,并按AARRR(又称“海盗模型”,Acquisition、Activa-tion、Retention、Revenue、Referral)模型45改写后进行命名,分群过程设计如图1所示。图1所示分群过程如下:第一步,对数据