分享
基于CLV偏好挖掘模型的数字社区用户偏好挖掘研究_肖耘.pdf
下载文档

ID:2515481

大小:2.48MB

页数:16页

格式:PDF

时间:2023-06-27

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 CLV 偏好 挖掘 模型 数字 社区 用户 研究 肖耘
2023年第35卷第2期基于 CLV 偏好挖掘模型的数字社区用户偏好挖掘研究肖耘1,许欢欢1,肖雅元1,赵又霖2,3*,庞航远3(1.广西中烟工业有限责任公司,南宁530001;2.南京大学 信息管理学院,南京210023;3.河海大学 商学院,南京211100)摘要:目的/意义数字社区已经成为企业高效管理用户的一种方式,用户行为信息以及用户的客户生命周期价值对数字社区的用户偏好挖掘具有重要意义。且现有的数字社区研究缺乏对用户价值和未来偏好挖掘的研究。方法/过程针对数字社区的用户群体,本文提出基于客户生命周期价值 CLV(Customer Lifetime Value,CLV)的偏好挖掘模型 CLV-PM(CLV-Preference Mining,CLV-PM)。首先,为反映用户真实偏好,基于用户行为信息,借助 RFM 模型和 K-Means+算法挖掘用户群体特征,生成用户价值类别标签;其次,为考虑用户时序性和差异性以及增强模型对偏好的认知,利用用户 CLV 构建用户-评分矩阵,并借助协同过滤算法挖掘用户预测偏好;最后,绘制数字社区目标用户的用户偏好画像。结果/结论“微信社群”管理平台的用户数据集中,可划分为重要价值用户、低价值用户、回流用户和重要挽留用户 4 种用户价值类别;目标用户 16254 为重要价值用户,采取“留存和维持”为主的运营策略;历史偏好为欢乐跳一跳、秒杀等活动,预测偏好为飞行棋大作战、猜码图等活动,目标用户偏好画像为数字社区运营和维护用户提供依据。关键词:CLV-PM;协同过滤;数字社区;用户偏好;信息行为中图分类号:G250文献标识码:A文章编号:1002-1248(2023)02-0045-16引用本文:肖耘,许欢欢,肖雅元,等.基于 CLV 偏好挖掘模型的数字社区用户偏好挖掘研究J.农业图书情报学报,2023,35(2):45-60.收稿日期:2023-01-10基金项目:广西中烟工业有限责任公司科技项目“基于机器学习方法的营销活动效果动态评估”(CGAXZX20210030050001-044);江苏省社会科学基金青年基金“社会感知数据驱动下的公共卫生事件时空演化研判机制研究”(20TQC001);中国博士后科学基金特别资助“面向应急管理的时空数据语义模 型构建及创新应用机理研究”(2021T140311);中国博士后科学基金面上项目“环境污染突发事件的时空数据挖掘及协同治理机制研究”(2019M650108)作者简介:肖耘(1971-),硕士,研究方向为“互联网+”营销产品产品研发、生产与运营。许欢欢(1988-),女,硕士,研究方向为互联网营销及研究。肖雅元(1988-),女,研究方向为互联网营销及研究。庞航远(2002-),女,硕士研究生,研究方向为知识组织研究*通信作者:赵又霖(1986-),女,副教授,博士生导师,南京大学博士后,河海大学商学院,研究方向为数据分析与挖掘、知识组织研究。E-mail:DOI:10.13998/ki.issn1002-1248.23-00841引言随着信息技术和互联网的迅猛发展,数字化社区应运而生并迅速发展。数字社区作为一种全新的生活方式,以数字技术为基础,通过网络、手机等终端进行信息传播和交流。然而,由于数字社区的用户信息数字营销专题452023年第35卷第2期飞速增长,信息过载问题相继出现,用户难以从海量数据资源中找到自身需要的物品。数字社区用户生命周期描述了用户参与社区活动的不同阶段,不同的用户拥有不同的生命周期,并且用户对于社区的价值贡献和需求存在差异。因此,衡量数字社区用户的客户生命周期价值不仅考虑了用户的差异性,而且考虑了用户的时序性。在众多的用户偏好挖掘研究算法中,协同过滤算法的应用最为普遍。协同过滤依赖于偏好或兴趣与目标用户相似的用户,并推荐用户可能感兴趣的项目。由于传统的协同过滤算法的实现非常依赖物品和用户的评分信息,但用户的评分信息往往伴随数据稀疏性和数据真实性问题,而用户行为信息能够真实反映用户的偏好,有效减少数据的稀疏性和失真性问题。因此,为提高预测和挖掘的精度,考虑用户时序性和用户价值。本文将用户行为数据作为数据源,从客户生命周期价值的视角出发,构建CLV-PM(CLV-Preference Mining,CLV-PM)模型。通过聚类划分用户价值类别,生成用户价值类别标签,挖掘用户历史偏好,再结合协同过滤算法预测用户未来偏好,最后,生成数字社区用户偏好画像,为数字社区用户的偏好挖掘提供依据。同时,为数字社区用户偏好挖掘提供新的研究视角。2相关研究基础2.1 CLV理论及应用客户生命周期价值CLV(Customer Lifetime Value,CLV)1是一项用于衡量客户贡献利润的典型指标,对企业的精准营销具有重要的价值和意义,其测量和计算被广泛应用于学术研究和营销领域。现有研究成果表明,以CLV为基础的营销资源分配为企业带来了更多的利润。VENKATESAN和KUMAR2发现前5%的顾客所创造的价值要比其他模型高出10%15%;KUMAR等3指出CLV模型可以帮助企业衡量客户关系,制定更为合理的营销政策,实现个性化管理,使客户价值最大化;李玉婷等4指出CLV高的企业,其客户续保率越高、赔付率越低。有关CLV的主要研究内容可以分为:用户价值细分4、客户生命周期建模5、CLV对相关决策管理的支持6,7等。2.2数字社区用户研究现状数字社区是指通过数字信息将服务提供者和管理部门与用户连接起来的虚拟在线社区,而数字社区的用户是指使用由服务提供者提供的服务的人。近年来,数字在线社区方面的研究引起了学者们的广泛关注,并得到了许多出色研究成果。数字在线社区的研究主要涉及用户信息披露8,9、用户行为影响因素10-18、用户偏好挖掘19-23等。由于本文涉及数字社区用户偏好挖掘以及用户行为方面的分析,下面将重点阐述这两个方面的数字社区研究现状。在用户行为分析方面,肖雪等10以“豆瓣读书”作为数据来源,通过社会网络分析法、内容分析法和统计分析法分析虚拟阅读社区的用户互动特征和影响因素;普哲缘和李胜利11以哔哩哔哩作为数据来源,借助双向固定效应模型探究视频评论特征对观众评论行为的影响;付少雄等12以好大夫在线作为数据来源,基于社会基本理论探究在线医疗社区医生知识贡献行为的关键动因;潘涛涛和吕英杰15以某在线健康社区的发帖行为数据为数据源,借助SOA模型探究影响用户参与社区意愿的因素;赵欣等16以问卷数据作为数据来源,运用AMOS软件探究用户行为与用户信任的互惠因果关系;陈星等18以问卷数据作为数据来源,运用AMOS探究影响用户持续知识分享行为意愿的因素。在用户偏好挖掘方面,学者主要以用户评论数据、用户基本属性以及用户行为数据等为研究数据来源;借助扎根理论、标签分类、聚类分析以及情感分析等方法展开用户需求主题识别、关键用户识别等研究。如成全和郑抒琳24以母婴网站的提问数据作为数据源,分析其用户信息需求主题标签体系,并构建层级多标签分类模型;余佳琪等8基于患者的评论数据构建了一个挖掘不同阶段患者评论主题与情感状态的主题情感混合模型;吴江等19以网易云社区为研究对象,借助DOI:10.13998/ki.issn1002-1248.23-0084数字营销专题462023年第35卷第2期BERT主题聚类的方法,分析不同音乐主题的特征;张军等20从用户交互行为属性、信息质量属性和情感倾向属性3个方面展开关键用户识别研究;王帅21从用户的基本属性、兴趣主题、情感倾向、问诊需求以及社交网络5个方面进行用户画像和用户分群研究;钱宇星等23以“老年人之家”论坛中的文本为数据源,借助共现分析和主题分析挖掘老年在线健康社区的健康信息需求(表1)。2.3协同过滤算法研究现状协同过滤算法是目前推荐系统中应用范围最广且成功率最高的推荐算法。常常被应用于预测和挖掘用户的需求和偏好。传统的协同过滤算法通常基于用户对项目的评分数据预测用户偏好25。但是,评分信息的失真问题导致预测结果不够精确,因此学者们提出结合文本内容和社区网络26-28、用户的属性信息29,30、时空信息31、用户的浏览、复制以及收藏信息32-34等提高结果的准确性。从CLV的理论及应用来看,CLV作为用户价值衡量的重要指标,其对资源的有效利用和用户价值的最大化具有重要的地位,且被广泛应用于用户价值衡量领域,为基于用户价值的用户偏好挖掘提供新的视角;从数字社区用户的研究现状来看,数字社区的用户行为研究主要集中在用户行为的影响因素方面,数字社区用户偏好研究多以文本数据作为数据来源,少以用户的行为数据作为研究对象,而用户的行为数据真实反映用户的偏好;借助主题分析等方式挖掘用户的偏好,少有对未来偏好的预测研究;现有的数字社区用户研究少有考虑用户生命周期价值,但用户生命周期价值反映用户整个生命周期内对数字社区的贡献,考虑用户生命周期价值有利于挖掘和预测用户偏好,从而提高数字社区的运营效率和效果。从协同过滤算法的研究现状来看,单一评分数据存在失真问题,现有研究采用多属性特征结合的方法提高预测和挖掘的精确度。综上所述,以现有的研究为基础,本文提出了一种以用户行为数据作为研究对象,考虑用户生命周期价值的混合用户偏好挖掘模型CLV-PM模型。该模型从CLV的视角出发,将用户行为数据作为用户偏好数据,评估和计量用户的CLV;以用户的CLV为衡量指标,利用K-means+算法进行用户聚类,生成用户价值类别标签,最后通过协同过滤算法挖掘不同用户价值类别的未来偏好,并在此基础上绘制数字社区中目标用户的用户偏好画像,为数字社区用户的偏好挖掘提高依据。3 CLV-PM模型的构建为克服现有研究的局限性以及数字社区“信息过载”的问题,并基于数字社区用户的时序性以及用户价值差异性的特点。本文提出一种基于CLV的偏好挖掘模型CLV-PM,用于数字社区的用户偏好挖掘研究。CLV-PM模型的作用有二:一是提高偏好挖掘和预测的准确度,以用户行为数据作为研究对象,真实反映用户偏好;二是从用户的CLV的视角出发,进行用户聚类,生成用户价值类别标签,实现数字社区资源最大化,用户价值最大化。CLV-PM模型的算法框架如图1所示。3.1 RFM模型在数字社区中,用户的评分存在失真或数据稀疏性问题,RFM模型通过量化用户行为信息,对用户进数据类型 用户评论数据、用户基本属性、用户行为数据等 研究方法 扎根理论、层级多标签分类、K-means 方法、EM 聚类、情感分析、BERT 主题聚类、AttriRank 算法、共现分析等 研究主题 用户需求主题识别、关键用户识别等 表1数字社区用户偏好挖掘研究特征表Table 1 Digital community user preference mining research肖耘,许欢欢,肖雅元,赵又霖,庞航远基于 CLV 偏好挖掘模型的数字社区用户偏好挖掘研究472023年第35卷第2期图1 CLV-PM模型计算框架Fig.1 CLV-PM model calculation framework行价值划分,以此衡量用户对社区的评分。本文通过基于RFM模型量化数字社区的用户行为信息,以挖掘用户偏好和衡量用户价值。RFM(Rational FunctionModel)分析模型最早是1994年HUGHES提出的35,该模型从企业的角度综合考虑客户一般购买行为。BULT和WANSBEEK对RFM的定义为:R(Recency)是指用户消费的临近性,与客户重复购买的可能性成反比,通常以用户在观测期内的最近消费时间作为衡量指标;F(Frequency)是指用户的消费频率,与客户忠诚度成正比,通常以观测期内用户的消费次数作为衡量指标;M(Monetary)是指用户的消费能力,与公司对客户的关注度成正比,通常以观测期内用户的消费总额作为衡量标准36。基于RFM模型的定义,本文对数字社区用户进行价值划分,帮助社区精准服务于用户。另外鉴于数字社区中用户参与不同活动所获得的奖励额度和奖励物品不同,在测算R、F、M值时需通过最大最小归一化

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开