研究论文数据分析与知识发现基于多标签Seq2Seq模型的情绪-原因对提取模型*张思阳1魏苏波2,3孙争艳4张顺香2,3朱广丽2,3吴厚月2,31(安徽理工大学数学与大数据学院淮南232001)2(安徽理工大学计算机科学与工程学院淮南232001)3(合肥综合性国家科学中心人工智能研究院合肥230026)4(淮南师范学院计算机学院淮南232038)摘要:【目的】提出基于多标签Seq2Seq模型的情绪-原因对提取方法,提高情绪-原因对抽取效果。【方法】使用BERT预训练得到语义丰富的词向量,通过Bi-GRU和LSTM进行编码分别得到文本的全局特征和局部特征,引入混合注意力机制实现二者的融合,提高文本语义特征捕获的完整度。【结果】相较于FSS-GCN模型,本文模型对情绪-原因对的联合抽取F1值在两个数据集上分别提升0.98个百分点和11.60个百分点,情绪抽取子任务分别提升0.87个百分点和1.10个百分点,原因抽取子任务分别提升0.79个百分点和2.31个百分点。【局限】模型主要考虑显式情绪-原因对,未针对隐式情绪-原因对进行探讨。【结论】本文提出的模型能提高情绪-原因对抽取效果。关键词:情绪-原因对抽取多标签Seq2Seq模型BERT分类号:TP393G250DOI:10.11925/infotech.2096-3467.2022.0985引用本文:张思阳,魏苏波,孙争艳等.基于多标签Seq2Seq模型的情绪-原因对提取模型[J].数据分析与知识发现,2023,7(2):86-96.(ZhangSiyang,WeiSubo,SunZhengyan,etal.ExtractingEmotion-CausePairsBasedonMulti-LabelSeq2SeqModel[J].DataAnalysisandKnowledgeDiscovery,2023,7(2):86-96.)1引言情绪-原因对分析是文本情绪分析中非常重要的研究方向之一,能为情感分析、情绪分类、人格特征预测等任务的进一步研究提供技术支持,受到了广泛关注[1-2]。同时,对文本中存在的情绪子句和原因子句进行分析,并结合场合和角色的不同,获取情绪的结构和其关系[3],进一步挖掘文本的潜在信息,具有较高商业价值。传统的情绪分析任务主要是情绪分类和情绪识别,近年来,针对情绪原因任务,越来越多的专家和学者进行了深入的研究。针对已经标注好的情绪得到情绪产生的原因即ECE(EmotionCauseExtraction)任务。但早期的数据集需要大量的人工标注且标注时往往会忽略情绪和原因之间的联系,因此考虑到情绪与原因的匹配关系,Xia等[4]提出情绪-原因对抽取任务(Emotion-CausePairExtraction,ECPE)。该任务需要同时识别情感及其原因,并将获得的情感和原因进行配对。为完成ECPE任务,早期的研究主...