结合
内容
特征
提取
弹幕
文本
视频
推荐
模型
构建
仿真
骆欣
收稿日期:2022-11-29基金项目:西安市社科基金项目感性共同体视角下短视频与西安城市形象的建构(22LW199)作者简介:骆欣(1981-),女,陕西咸阳人,硕士研究生,副教授。结合内容特征提取和弹幕文本的短视频推荐模型构建及仿真骆 欣1,纪 颖2(1.西安翻译学院,西安,710105;2.上海微电子装备(集团)股份有限公司,上海 201203)摘 要:针对现有短视频推荐准确率不高的问题,提出一种融合视频内容与弹幕文本分析的短视频推荐方法。该推荐方法中首先采用 LDA 模型提取弹幕文本主题,然后提取出短视频内容特征,再根据短视频的高光时刻生成候选推荐列表;在候选推荐列表生成基础上,运用 RNN 对用户的长期兴趣进行建模,使用门控单元 GRU 处理短期兴趣,最终提出了一种结合长短期的短视频推荐模型,对用户进行推荐。结果证明,深度学习方法可最大化地获取短视频的内容特征,提高处理效率;结合用户长短期兴趣的短视频推荐模型在准确率、召回率以及 MRR 平均倒数排名等评价指标上优于其他目前使用广泛的推荐模型。由此说明,提出的推荐方法,可以更好地运用在实际推荐中。关键词:个性化推荐;弹幕文本;视频内容特征;长短期兴趣 中图分类号:TP399 文献标识码:A DOI 编码:10.14016/ki.1001-9227.2023.01.042Construction and Simulation of short video recommendation model combining content feature extraction and bullet screen textLUO Xin1,JI Ying2(1.Xian Fanyi University,Xian 710105,China;2.Shanghai Microelectronics Equipment(Group)Co.,Ltd.,Shanghai 201203,China)Abstract:Aiming at the problems of low accuracy and low efficiency in the existing short video recommendation algo-rithms,a short video recommendation method combining video content and bullet screen text analysis is proposed.This recom-mendation method uses LDA model to analyze the bullet screen text and determine its theme,then extracts the content features of short video through deep learning method and CNN analysis,and finally generates a candidate recommendation list accord-ing to the highlight time of short video.In this method,users long-term and short-term interests are combined to generate a short video recommendation model combining users long-term and short-term interests.After the comparative experiment,the experimental results show that the short video recommendation model combined with users long-term and short-term in-terests is superior to other mainstream short video recommendation methods in accuracy,recall rate,MRR average reciprocal ranking and other evaluation indicators.This shows that the recommendation method proposed in this paper has better accura-cy and execution efficiency.Key words:personalized recommendation;barrage text;video content features;long term and short-term interests0 引言随着互联网和大数据时代的到来,各大热门视频软件媒体产生的视频内容数据量剧增,用户想要在海量数据中筛选出感兴趣的数据,逐渐成为当前短视频个性化推荐的一大难题。随着推荐算法的广泛应用和发展,从海量数据中快速找到用户感兴趣的内容并进行推荐,逐渐成为当前短视频发展领域研究的重点。而如何采取有效的推荐算法是当前该领域的热门话题。因此,学者们也在短视频推荐算法上进行了大量的研究,汤志鹏1提出了一种基于 Faster R-CNN 深度学习网络的视频内容检测方法,来对短视频推荐的准确率进行提高,并在分析常用短视频推荐算法的优劣势以及效果后,再运用到复杂的实际场景中,证明了使用混合推荐算法可有效地提高推荐的准确率;王宁等2在传统协同过滤算法的基础上,融合进了隐语义模型来进行短视频推荐,隐语义模型可以增加推荐的多样性,而协同过滤算法可以保证推荐的及时性,两种算法的融合使推荐结果更加多样化和及时;彭宇等3提出在 LFM 算法的基础上,结合协同过滤算法来实现短视频的推荐。在该算法中,使用到了 ItemCF 算法计算相似视频中用户未观看过的视频,再结合 Redis 缓存数据库,对短视频在线实时推荐,提高了短视频推荐的实时性。在上述学者对短视频推荐的研究中,使得短视频推荐的实时性和及时性得到了提高,并且证明了混合推荐算法在短视频推荐的准确率上得到提升,但仍没有达到最优结果。因此,将对弹幕特征24结合内容特征提取和弹幕文本的短视频推荐模型构建及仿真 骆 欣,等和视频内容特征进行提取,依据高光时刻生成候选推荐列表,再结合用户的长短期兴趣,生成结合用户长短期兴趣的短视频推荐模型,来提升短视频推荐的准确率和效率。1 初始推荐列表1.1 弹幕特征提取将采用 LDA 主题模型(Latent Dirichlet Allocation)进行弹幕文本分析。公式(1)是某个单词 w 在整个弹幕信息中所占据的概率大小:p(w|d)=zi=1p(w|zi)p(zi|d)(1)式中,d 和 z 分布表示的是代表弹幕文本和弹幕文本的某个主题,p(zi|d)表示在弹幕文本中某个主题的概率,p(w|zi)表示在当前弹幕主题中不同单词的分布概率。Z代表弹幕文本中弹幕主体个数的数值大小,并且会对准确率产生影响。最后进行抽样,建模,利用相关公式,计算单词概率,确定出弹幕文本主题4。p(zi=n|w1,di,z-i)cwzwin+wcwzw+w.cDZdin+Zd1z+za(2)式中,cDZ和 ckz分别表示的是文本中主题的分布矩阵以及主题-单词的分布矩阵;和 是其中的调节参数。若在 Gibbs 中进行重复抽样直至满足要求,弹幕文本中隐含的主题将会趋于稳定,参数 和 也会达到收敛值。先验概率如下所示:p(wi|zi=n)=cwzwin+wcwzw+w(3)p(zi=n|di)=cDZdin+zd1z+za(4)在 LDA 模型中,可以得出主题的分布,以此来确定短视频的主题,再对其进行划分5。研究发现,短视频弹幕具有“内容相关性”的特质,也就是指当有用户发送弹幕后,其他用户会对当前的弹幕进行参考,使得相邻弹幕的语义相似。因此,当观众在观看到视频的精彩部分时,可通过发送弹幕的形式来表达对视频内容的评价和自我感受,这时会产生弹幕内容主题,并且这时的弹幕最为密集,而这一时刻就称作为“高光时刻”。因此,在视频中,视频的核心和重点就是“高光时刻”,同时也是最吸引用户的部分。1.2 内容特征提取 在对弹幕文本进行 LDA 主题模型的分类后,视频将依据弹幕信息进行主题划分。再确定视频的高光时刻作为输入,便可得出短视频的内容特征。深度学习模型在对视频、图像和文字内容的识别上具有重大作用6。“高光时刻”利用卷积神经网络进行处理,如图 1 所示:图 1 卷积神经网络模型 内容特征提取的稳定性可通过两次卷积加池化成的方式得到一定的保证。将高光时刻作为网络的输入。在第一次卷积加池化的过程中,将卷积核设为 55,输入输出通道数分别为 1 和 32,得出的 C1 特征图作为第一次池化的输入7。在第二次卷积加池化的过程中,输入和输出通道数都分别将增加到 32 和 64。短视频主题的分类将通过短视频内容特征的提取完成。1.3 生成候选推举列表通过短视频中高光时刻的内容特征,可以确定短视频的主题,其中的短视频主要来源于用户平时的观看记录。最终候选推荐列表的形成将依据在同个主题下进行相似度计算后,排名靠前的短视频。公式如下:sim(D1,D2)=nk=1lk(D1)(D2)(nk=1l2k(D1)(nk=1l2k(D2)(5)式中,D1 和 D2 都表示高光时刻,其中 D1 表示用户近期观看记录中的视频的高光时刻,D2 表示相同主题下不同视频的高光时刻8;分子和分母分别表示两个视频向量的点乘积和视频向量是模的乘积,然后进行相似度计算。2 考虑兴趣的混合动态推荐2.1 用户长期兴趣建模简单的 RNN 建模对于用户的长期兴趣建模具有一定的困难。这是由于序列中的位置会随着时间发生变化,而新加入的序列的效果更好,但是用户的行为具有不确定性,如果用户加入了一个新的兴趣元素,那么这个新元素将会对下一次的推荐产生更大的影响。RNN模型在长期兴趣的数据收集中,将会增加新的输入单元,以此提升模型的推荐效率,又不会改变模型内存。因为在实际情况中,不能满足所有的输入单元对应到内存中,就会对模型的训练及其结果产生影响。如图 2所示:图 2 输入 RNN 模型RNN 模型用于输入用户的长期兴趣,且在收集过程中,将用户的历史信息和历史元素进行融合。而对于新加入的兴趣元素,将利用单独的输入单元对其进行处理,以保持长期兴趣的稳定。新加入的长期兴趣会对用户之后的项目选择产生影响,将用公式(6)来计算用户新加入的长期兴趣,并且还会接受来自用户的长期兴趣来进行用户历史元素的计算9。Xskx=max(xk1,xk2,xkn)(6)34自动化与仪器仪表2023 年第 1 期(总第 279 期)Xskx=1nni=1xki(7)2.2 用户短期兴趣建模短期兴趣推荐要注重时效性,因为用户的短期兴趣受外界影响大,所以在用户的兴趣推荐过程中,假设短期兴趣的影响更大。短期兴趣也可能转换为长期兴趣,因此同等重要。将在当前时间窗观看的短期视频历史记录作为用户的短期兴趣。将采用 GRU 处理用户的短期兴趣,神经元的输入向量选用 one-hot 编码,代表了用户看过主题类型的短视频,而短期兴趣较长期兴趣相比,变化较快,为了使推荐结果中既考虑到用户的长期兴趣的变化,又能兼顾用户的短期兴趣的变化,将添加更新门和重置门10。图 3 GRU 网络模型2.3 混合动态推荐框架依据弹幕文本和内容特征生成的候选推荐列表,没有考虑到用户的兴趣,并不能准确地为用户进行短视频推荐。在此候选推荐列表上,将增加用户兴趣,并且考虑兴趣的变化,从而生成一个更为准确的推荐列表。由于用户在观看短视频的过程中,兴趣受到环境和心情的影响,变化较大,因此,使用动态推荐系统可以依据用户兴趣的变化进行实时更新,更好地为用户进行短视频推荐。将上文中对用户的长短期兴趣的建模考