现代计算机ModernComputer第29卷第12期2023年6月25日基于LERT⁃RCNN的中文弹幕文本情感多分类研究孔玲玲1,黄旭1,2,曾孟佳1,2*(1.湖州师范学院信息工程学院,湖州313000;2.湖州学院电子信息学院,湖州313000)摘要:为提高弹幕文本情感分类准确率,提出基于LERT⁃RCNN的弹幕文本情感多分类模型。首先使用LERT预训练语言模型获取文本动态特征表示,减少弹幕文本中一词多义对情感分类准确率带来的影响;其次使用BiLSTM和CNN提取更深层次语义特征;最后经全连接层后送入softmax函数得到情感分类结果。实验结果表明,基于LERT⁃RCNN的弹幕文本情感分类模型的准确率、精确率、召回率及F1值分别为96.17%、94.54%、92.56%及93.51%,与传统文本情感分析模型及单一预训练语言模型LERT相比有明显提升。关键词:弹幕;情感分类;卷积神经网络;预训练语言模型;双向长短时记忆网络文章编号:1007⁃1423(2023)12⁃0001⁃09DOI:10.3969/j.issn.1007⁃1423.2023.12.001收稿日期:2023⁃02⁃16修稿日期:2023⁃04⁃12基金项目:湖州市科技计划工业公关项目(GG201829);湖州市2022科技特派员专项(2021KT02)作者简介:孔玲玲(1997—),女,浙江湖州人,硕士生,研究方向为自然语言处理文本分类;黄旭(1977—),男,博士,副教授,硕士研究生导师,研究方向为生物计算;*通信作者:曾孟佳(1980—),女,湖北荆州人,硕士研究生导师,副教授,研究方向为智能计算,E⁃mail:zmj@zjhu.edu.cn0引言随着互联网技术的飞速发展,网络视频的受众越来越广,弹幕由于其互动性高、趣味性强逐渐成为国内外主流视频网站的重要特色之一。弹幕起源于日本的Niconico视频网站[1],用户在观看视频时可实时发送评论,多条评论内容可像子弹一样在屏幕上自左向右移动,因而称为弹幕。与传统评论文本不同,由于其实时发送的特点,弹幕中蕴含了用户更强烈的情感倾向与评价观点,分析其中包含的情感对舆情分析[2]、广告营销[3]、视频推荐和检索[4⁃5]等领域都具有重要意义。但弹幕的简短、口语化、一词多义以及包含大量网络用语等特点增加了弹幕文本情感分析的难度。因此,弹幕情感分析成为不少国内外学者关注的热点。作为文本情感分析的传统方法,情感词典在弹幕情感分析领域得到了应用。郑飏飏等[5]利用句子级情感分析方法建立了基于情感词典的弹幕情感分析模型,结合时间序列对弹幕数据进行了可视化。文献[6⁃8]分别建立了基于表情和语气的情感词典以及对应的情...