温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
推荐
中的
知识
融合
研究进展
收稿日期:20220828基金项目:河北省社会科学基金项目“基于知识图谱的查询扩展研究”(项目编号:HB21TQ005);中国高校产学研创新基金新一代信息技术创新项目“基于知识图谱的信息检索教学平台设计研究”(项目编号:2020ITA02045);河北省社会科学发展研究课题“媒体融合视域下河北省社科学术期刊影响力提升研究”(项目编号:20220202057)。作者简介:张彬(1980),男,高级实验师,博士研究生,研究方向:信息检索。吴姣(1980),女,副教授,研究方向:情报分析。通讯作者:徐建民(1966),男,教授,博士生导师,研究方向:信息检索。研究综述与前沿进展跨域推荐中的知识融合研究进展张彬1徐建民1*吴姣2(1 河北大学管理学院,河北 保定 071002;2 河北大学期刊社,河北 保定 071002)摘要:目的/意义 跨域推荐通过挖掘、迁移并融合利用不同来源的知识为用户提供个性化的推荐服务,近年来得到学术界和工业界的热点关注,文章从多个角度对跨域推荐中的知识融合研究进展进行梳理和归总。方法/过程 首先对跨域推荐问题进行了系统地分析,探讨了跨域推荐的“域”、跨域推荐场景和跨域推荐任务中的知识需求;其次对跨域推荐中的知识融合方法进行了分类,总结了基于聚类、基于语义、基于图模型和基于标签关联的跨域知识融合方法的优点和不足;然后分析了知识图谱技术对于跨域知识融合的启发;最后对跨域推荐研究中的知识融合进行了总结和展望。结果/结论 知识融合作为跨域推荐研究中的重要环节,可以在知识层面实现对数据的深度加工和有效利用,为跨域推荐问题研究与实践提供新的范式。关键词:跨域推荐;知识融合;个性化推荐;知识图谱DOI:103969/jissn10080821202303016中图分类号G254.9文献标识码A文章编号10080821(2023)03015710esearch Progress of Knowledge Fusion in Cross Domain ecommendationZhang Bin1Xu Jianmin1*Wu Jiao2(1 School of Management,Hebei University,Baoding 071002,China;2 Magazine House,Hebei University,Baoding 071002,China)Abstract:Purpose/Significance Cross Domain ecommendation provides personalized services for users by min-ing,migrating,and integrating preference knowledge from different sources,which has attracted the attention of academiaand industry in recent years This paper summarizes the research progress of knowledge fusion in cross domain recommenda-tion from multiple perspectives Method/Process Firstly,this paper systematically analyzed the problem of cross domainrecommendation,and discussed the domain of Cross Domain ecommendation,the CD task,and the knowledge require-ments in the CD task;Secondly,the knowledge fusion methods in CD were classified,and the advantages and disad-vantages of cross domain knowledge fusion methods based on clustering,semantics,graph model and label association weresummarized The inspiration of knowledge graph technology for cross domain knowledge fusion was analyzed,the challengesand development of Cross Domain ecommendation knowledge fusion were discussed Finally,the knowledge fusion incross domain recommendation research was summarized esult/Conclusion Knowledge Fusion is an important part ofcross domain recommendation research It can realize the deep processing of data at the knowledge level,and provide a newparadigm for the research and practice of cross domain recommendationKey words:cross domain recommendation;knowledge fusion;personalized recommendation;knowledge graph7512023 年 3 月第 43 卷第 3 期现 代 情 报Journal of Modern InformationMar,2023Vol.43No.3随着互联网、大数据和云计算技术的快速发展,数据呈爆炸式增长,信息过载问题日趋严重,跨域推荐通过挖掘、迁移并融合利用不同来源的知识为用户提供个性化推荐服务,近年来得到学术界和工业界的热点关注1。知识融合在跨域推荐中具有重要作用,可以在知识层面实现对数据的深度加工和有效利用2,为跨域推荐问题研究与实践提供新的范式。跨域推荐针对传统单域推荐的局限,从对辅助域知识进行融合的角度出发,利用多域的用户行为数据挖掘用户偏好特征,以提高推荐的准确性和多样性3。传统的信息推荐系统主要采用基于内容、协同过滤或混合推荐等算法为用户提供推荐服务,在单域推荐场景下取得了较好的效果;但随着数据规模的增大,进行精确推荐服务的难度提高,单域推荐的问题和局限也更加突出。首先是稀疏性问题,单域场景下的用户与项目的交互数据稀疏问题较为普遍,大数据环境下高维数据的稀疏性更加明显,给定用户或项目之间的相似性或相关性甚至为零,无法进行有效过滤,影响推荐效果4。然后是冷启动问题,大量的新用户或新项目进入推荐系统时,由于缺少必要的兴趣或评分数据,难以建立用户与项目的关联,推荐系统无法推断用户偏好进行推荐。大数据场景下,跨域推荐系统从更加丰富的知识源获取有效的用户偏好或项目特征信息,进行整合加工来丰富目标域中的数据,可以有效解决单域推荐面临的数据稀疏和冷启动问题,提高用户满意度,改善用户体验5。事实上,跨域推荐研究尚处于起步阶段,多数研究仅关注有两域或少数域间的知识迁移,较难应用于具有多辅助域的跨域推荐场景,对于外部知识、用户兴趣知识、社交网络知识等多源异构数据的知识融合利用和跨域交互等问题缺乏理论指导和系统研究。知识融合的概念源于 20 世纪 90 年代的信息融合,现有文献对于知识融合的定义尚未统一2。以KAFT 项目为代表的文献认为6,知识融合是指从众多分布式异构的网络资源中搜索和抽取相关知识,并转换为统一的知识模式,从而为某一领域的问题求解构造有效的知识资源7。知识融合是情报学领域的重要发展方向,是面向行业、面向领域或面向学科的复杂问题的解决过程,相关理论和实践的研究对跨域推荐具有借鉴作用8。跨域推荐本质上可以划分为跨域知识融合和利用知识推荐两个子问题,跨域知识融合是对多源知识进行有效整合、加工和利用的关键步骤,因此有必要从知识融合的角度出发,对目前跨域推荐的相关研究进行梳理和分析,以期对今后的跨域推荐和知识融合研究提供参考。1跨域推荐系统概述1.1跨域推荐问题的提出国外关于跨域推荐的研究由 Winoto P 等9 首先提出,认为跨域推荐会比单域推荐更加多样化,可以提供更高的用户满意度和参与度,该研究确定了 3 个重要的问题:验证不同域中用户对项目偏好的全局相关性;设计模型利用用户在来源域的喜好来预测用户在目标域的偏好;制定适合跨域推荐的评价方法5,10。Li B 等11、Azak M12 也证明了跨域推荐能够解决单域推荐一直以来的冷启动和数据稀疏性问题。陈雷慧等5 认为,跨域推荐模型设计与传统单域推荐系统类似,也由用户建模模块、推荐对象建模模块和推荐算法模块13 组成,区别在于跨域推荐利用的是融合多个辅助域信息的数据,而不仅仅是目标域提供的数据资源。因此,如何有效地融合各域知识,并在不同域间对知识进行传递和利用,是跨域推荐研究中的关键问题。1.2跨域推荐中的“域”跨域推荐研究中尚没有形成关于“域”的统一定义,学术界提出了多种关于“域”的划分依据,在具体研究中主要按照系统11、数据源14、项目概念15 或项目类别16 等方式划分域。较多研究者认可 Li B 等17 的分类定义5,按照系统域(SystemDomain)、数据域(Data Domain)和时间域(TemporalDomain)划分不同的域。系统域按照推荐项目所属的系统划分,如豆瓣和亚马逊网站属于不同的系统域;数据域按照多源异构的数据源划分,各数据源属于不同的数据域;时间域按照行为产生的时间跨度进行分片,各分片属于不同的时间域,适用于行为数据具有时间戳的场景。陈雷慧等5、陶鸿等3 8512023 年 3 月第 43 卷第 3 期跨域推荐中的知识融合研究进展wwwxdqbnetMar,2023Vol.43No.3综合不同域划分的研究,在上述域分类的基础上提出了“概念域”的划分方式,按照推荐物品的类型或概念层次进行划分。知识融合主要针对不同的知识来源,多源异构的大数据环境下,不同的知识源可以划分为独立的数据域,不同系统域或时间域的数据也可根据推荐任务需求,定制或重组数据集到不同的数据域,因此基于知识融合思想采用“数据域”的划分方式更为合理。国内部分研究者亦称“跨域推荐”为“跨领域推荐”1,3,5,两种表述方式均源自英文“CrossDomain ecommendation”的翻译。在计算机术语中,“域”字的使用较为频繁(如网络域、控制域、域名和子域等),泛指具有边界的对象;辞海中“领域”二字释义为“学术思想或社会活动的范围”,范围相较于“域”窄,与“概念域”范畴较为接近。因此,在推荐对象属于不同概念域时(如图书、电影或音乐属于不同的类型),两种表述方式都适合。但是,如果按照数据域、时间域的划分方式,不同域中的项目可能会属于相同的概念域(如 MovieLens、Netflix 和豆瓣的推荐对象均为电影),此时使用“跨领域”表述不够准确。因此,从域的涵盖范围来看,“跨域推荐”比“跨领域推荐”的范畴更大,“跨领域推荐”只是利用概念划分域的一种特殊情况,不能涵盖所有域划分场景,本文统一采用“跨域推荐”的表述。1.3跨域推荐场景在跨域推荐中,根据两域之间用户知识和项目知识的重叠程度差异,分为不同的知识重叠场景。设两个域分别为 DA、DB,两个域的用户集分别为UA、UB,项目集分别为 IA、IB;同时出现在两个域的用户知识交集为重叠用户集,UAB=UAUB;同时出现在两个域的项目知识交集为重叠项目集,IAB=IAIB。参照 Cremonesi P 等研究者关于协同过滤数据重叠的思想,可分为 4 种知识重叠情况