分享
互联网用户的情绪表达方法研究分析 工商管理专业.docx
下载文档

ID:249951

大小:172.02KB

页数:43页

格式:DOCX

时间:2023-03-15

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
互联网用户的情绪表达方法研究分析 工商管理专业 互联网 用户 情绪 表达 方法 研究 分析 工商管理 专业
互联网用户的情绪表达方法研究 摘 要:网络信息技术的飞跃发展正在全方位、深层次地改变着我们的生产与生活方式。信息发布均传输的方式正经历着巨大变革。互联网等新兴信息载体的出现一方而为社会大众提供了的所未有的海量信息资源;另一方面也为民众提供了便捷地表达各自观点的平台。互联网逐步成为网络信息时代主流传输载体,不仅改变人们对于大众媒体的传统认识,而且也极大地改变了传统的信息传播程式。与此同时,网络舆论以交互的自由性和方式的多样性,已经成为关乎社会稳定的一股不可忽视的力量。如何做到在庞大的互联网网络中对互联网用户表达信息的甄别以及大部分网民对某些事件的情绪的大致轮廓的了解,利用计算机等技术进行包括互联网用户情绪表达分析在内的舆情监督是近几年计算机人工智能研究的热点。本文征对信息传播动力学、舆论演化模型提出了一种互联网用户的情绪表达方法。 关键词:情绪表达;舆情分析;互联网用户;互联网 Abstract The rapid development of information technology networks are comprehensive, in-depth changing our production and lifestyle. Information dissemination both transmission mode is undergoing tremendous change. Internet and other new information appears one carrier which provides for unprecedented massive public information resources ; it also provides a platform for people to express their ideas easily . Internet Network Information Age has gradually become the mainstream transport carrier, has not only changed people for the traditional understanding of the mass media , but also greatly changed the traditional information dissemination program. At the same time , the network of public opinion the way to freedom and diversity of interaction has become a force to be reckoned with in relation to social stability. How do the vast Internet network for Internet users to express and understand screening information for most users mood of the broad contours of certain events , the use of computers and other technology , including public opinion supervision of Internet users , including emotional expression analysis is nearly years of computer artificial intelligence research hotspot. This article levy dynamics of information dissemination , public emotional expression evolution model proposed method for Internet users . Key words : emotional expression ; public opinion analysis ; Internet users ; Internet 目 录 第一章 绪论 1 1.1 研究背景 1 1.2 国内外研究现状 1 1.3 研究意义 3 第二章 主要理论 4 2.1 社会物理学及三大理论 4 2.1.1 社会物理学研究概述 4 2.1.2 社会燃烧理论 5 2.1.3 社会激波理论 6 2.1.4 社会行为熵理论 6 2.2 信息传播动力学 7 2.3 舆论演化模型 10 2.3.1 舆论波及其波动律 10 2.3.2 舆论演化过程中的“三从”行为 11 2.3.4 舆论演化的概念建模 13 2.3.5 舆论演化的建模仿真 14 第三章 关键技术 15 3.1 舆情热点的自动发现 15 3.2 舆情热点的关键词和摘要提取 16 3.3 互联网用户情绪的倾向性分析 17 3.4 舆情热点传播动态分析 19 3.5 舆情热点的趋势分析和关联分析 20 第四章 互联网用户情绪表达设计 20 4.1 中文信息的特征抽取 21 4.1.1 文本信息的特征抽取和选择 21 4.1.2 中文的语义特征抽取 22 4.1.3 特征子集选择 24 4.1.4 特征重构 25 4.1.5 向量生成 26 4.2 基于粒网络生成规则的文本情感识别 26 4.2.1 文本预处理模块 26 4.2.2 粒网络生成规则模块 29 4.2.3 对测试集应用规则得到分类结果并评价 31 第五章 互联网用户情绪表达实现 31 5.1 确定互联网用户用词的褒贬倾向 34 5.2 实现语句的情感识别 35 5.3 互联网用户情绪表达 37 5.3.1 极性情绪发现 37 5.3.2 对立情绪发现 37 第六章 论文总结 38 参考文献 40 第一章 绪论 1.1 研究背景 随着网络技术的飞速发展,互联网已经成为报纸等传统大众媒介之外的第四舆论传播新势力,网络用户量和信息量已经超过了传统媒介。互联网的发展不仅革新了信息传播技术,也改变了人们的生活方式及人际交往方式,极大影响着人们社会生活的多个领域。网络已经成为人们每天获取信息、相互交流必不可少的方式。特别是进入到Web 2.0时代之后,网络用户既是网络信息的消费者,也是网络内容的缔造者。网络是现实社会的镜像,现实生活中局部的问题,在网络中可能被放大而引发大量的讨论,直接反作用于真实社会,影响着人们的生活。而一些负面和极端的言论,可能危害网络内容安全及社会的稳定。 2012年7月19日,中国互联网络信息中心(CNNIC)在京发布的《第30次中国互联网络发展状况统计报告》中指出,截至2012年6月底,中国网民数量达到5.38亿。报告中显示,用户数量增长达到一个稳定的水平,互联网的普及率大大地提高。更加引人注目的是,手机用户急速增加,手机上网用户数超过台式机接入网络用户数0.08亿,这是由于移动终端上网方便快捷,成本较低,且能够随时随地。同时,我国的网络技术也日新月异,网络国际出口带宽到达1,548,811Mbps, IPv6地址数爆发增长,已经跃居全球前三位。各种网络应用的增幅明显,即时通信增长提速,微博和博客的数量较2011年底增长了近10%,信息传播方式更加多元化。网络舆论以交互的自由性和方式的多样性,已经成为关乎社会稳定的一股不可忽视的力量。如何做到在庞大的互联网网络中对互联网用户表达信息的甄别以及大部分网民对某些事件的情绪的大致轮廓的了解,利用计算机等技术进行包括互联网用户情绪表达分析在内的舆情监督是近几年计算机人工智能研究的热点。 1.2 国内外研究现状 互联网和通信技术的发展使得网络成为人们获取信息分享信息的主要渠道,越来越多的用户参与到网络活动中。用户创造了海量的网络信息,且互联网是一个开放的平台,通过网络信息采集工具可以获取大量的网络数据,从而为互联网的实证分析提供了丰富可靠的数据来源。高性能处理器的出现及并行计算能力的提高,使得对大数据的处理有了可能,因此对互联网海量数据的分析逐渐被提上日程。目前实证分析的研究不断涌现,挖掘用户情绪表达特点,分析网络人际关系,发现潜在的客观规律,有助于互联网理论模型的有效性验证及参数调整。 文献[1]对博客及社交网络服务等Web 2.0网络的用户拓扑关系进行了分析。作者分别抓取了人人网及新浪博客数据,新浪博客是单向网络,而人人网是无向网络。研究发现,新浪博客的入度及出度均服从幕律分布,但出度分布的具有更大的幂指数,这表示博客用户并未添加很多好友,甚至有32.6%的人未添加任何好友。活跃用户喜欢连接名人或其他活跃用户,因此网络的入链--出链及出链--出链的度相关系数为正。而新浪博客的出链--入链及入链--入链的度相关系数为负。人人网的度服从双尺度的幂律分布,平均最短路径长度更短,节点簇系数按节点度呈幂律减小,且节点度正相关。 文献[2]分析了Twitter用户的地域分布、用户的好友粉丝数及用户的度相关系数,并将Twitter的用户进行了分类。文献[3]计算了 Twitter微博的平均最短距离长度、最大转帖深度、帖子生存时间、用户排序等特征。作者将Twitter中的用户按粉丝数及PageRank值排序,发现两种方法的排序结果近似一致,而将用户按转发数排序则得到的结果有明显区别,这表示用户的转发数与粉丝数之间并非呈严格的依赖关系。97.6%的转帖深度在6跳之内,而转帖深度不会超过11跳。文献[4]比较了 Twitter用户的帖子转发数、回复数与好友数的相关性,分析了信息传播过程中用户的影响力特征。文献[5]进一步分析了 Twitter中与帖子获得转发相关的因素。根据帖子作者的好友数、账号创建时间等9个因素对Twitter数据进行主分量分析,发现帖子的内容特征及作者特征都具有较强的区分度,是影响帖子转发的重要因素。通过对大量实际数据的验证,描绘出了帖子被转发的概率近似随着帖子作者的好友数、粉丝数、用户创建时间呈上升趋势。 文献[6]对某经济物理学网站的文章下载量进行了统计分析,发现论文的下载次数以Zipf律递减,且幂指数随着时间的推移而降低,这意味着用户并不总是下载排名靠前的文章,而会翻页去查看其它非推荐的文章。不同文章的单位时间下载率按指数衰减,且文章的平均下载率及方差近似满足指数分布,其中a位于0.6到0.9之间,不同于之前的研究,早先的研究认为序参数的方差与平均值的分布指数a为0.5或1。 目前的研究主要针对用户关系的宏观结构或用户个体的微观交互单独建模,未能分析驱动网络用户情绪表达的本质因素,也未能解释参与人群情绪表达偏好及用户性格习惯的异质性对群体结构演化的作用,对网络宏观结构的产生原因未达成共识,因此,这些研究在理解网络用户客观规律上面临着诸多的挑战。 1.3 研究意义 互联网用户情绪表达分析及信息演化机制研究,借助社会物理学、计算机科学、信息科学、系统科学及复杂网络等理论,通过计算机建模和数据挖掘的方法,分析用户情绪表达的内在动机,建立用户参与情绪表达模型,建模网络个体观点交互过程,揭示宏观舆论与微观个体情绪表达的联系,探索群体性意见的出现条件,预测信息传播趋势及用户的传播行动,这些研究具有重要的理论意义和应用价值。互联网用户情绪表达分析及信息演化机制研究,有助于生物群体情绪表达及群落结构演化的研究,为社会学等学科的研究提供数据获取和处理方法。网络用户的发帖、转帖、回帖及用户之间的交流等情绪表达,反映了用户的生活习惯和个体特性,通过对用户情绪表达的分析能够掌握大众的情绪表达特

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开