**在线社交网络情感分析,**属于观点挖掘的范畴,是依据用户在社交网络中的行为(如评论、口碑等),以逻辑学、语言学、心理学理论为基础,采用自然语言处理等方法,分析用户对实体(如产品、服务、个人、事件等)表达的观点、情绪、态度12。
目录:
1. 定义
2. 在线社交网络情感分析的应用
3. 在线社交网络情感分析的技术
一.定义
**在线社交网络情感分析,**属于观点挖掘的范畴,是依据用户在社交网络中的行为(如评论、口碑等),以逻辑学、语言学、心理学理论为基础,采用自然语言处理等方法,分析用户对实体(如产品、服务、个人、事件等)表达的观点、情绪、态度。虽然自然语言处理方法已有多年的研究,但情感分析仍然是一个热点研究。其原因有:(1)在线社交网络情感分析,有着广泛的应用,尤其是在工业界。(2)随着网络社交媒体的发展,在线社交网络的情感分析面临一些新的挑战和新的视角,如数据的海量性对情感分析算法的影响。
二.在线社交网络情感分析的应用
情感分析最常见的应用是分析在线评论中消费者对产品及服务的观点。Twitter 和Facebook是许多情感分析应用的焦点,最普遍的应用利用Twitter 和Facebook数据检测特定品牌的声誉。同时,情感分析也可以被应用到政治领域,如追踪社交网络上用户对选民对候选人演讲和行为的看法。另外,在金融市场上,社交网络情感分析也有普遍的应用,如情绪分析系统利用从多个在线平台收集的讨论企业的文章,分析总体情感分值,并将该分值应用到交易系统中3。
三.在线社交网络情感分析的技术
在线社交网络的新特点给传统情感分析带来了一些新的研究问题,进而也催生了一些新的在线社交网络情感分析技术。例如,专门处理短小文本的情感分析技术、利用社交网络中群体间的相互作用的情感分析技术,以及应对社交网络中的垃圾用户、垃圾意见可能对真实情感分析带来的影响的一系列垃圾数据处理技术等。
3.1 面向短文本的情感分析技术
随着Twitter 、Facebook、新浪微博等社交网络的迅速发展,人们可以随时随地地在网络上发表自己的观点及意见。不同于传统新闻、报道等长文本,社交网络中文本短小、语法不规则性,并含有大量的噪声,针对社交网络中的短文本的情感分析技术具有十分重要的意义。
Go Alec等人在2009年测试了监督学习算法在Twitter短文本上的情感分类效果,如多项式贝叶斯分类、最大熵模型及支持向量机模型4。不同于在长文本中依靠人工标注获得的训练集,Go Alec等人采用Twitter中的表情符号获取正面评论和负面评论,从而省去了大量的人工标注成本,同时提升了训练集的规模。
随着微博的兴起,针对短文本的情绪分析成为社交网络分析的一个重点。目前,很多注重于情感分析的评测会议,如自然语言处理与中文计算会议(NLP&CC)、全国信息检索会议(CODE)等,都将情绪分析作为一个重要的部分。Zhang Lumin(张鲁民)等人5采用情感向量模型对社交网络中用户的多元化情感进行表示,并基于聚类构造情感向量的层次化结构。
针对短文本话题的情感识别方面,Wang xiaolong(王晓龙)等人6针对Twitter中的话题标签(hashtag),通过构造hashtag-graph模型在话题层次上进行情感分析。
3.2 基于群体智能的情感分析技术
在社交网络中,用户不仅仅能随意表达自己的观点意见,同时基于社交网络中连接结构,使得用户的情感不自觉受到社交网络总其他节点的影响。社交网络提供的交互功能更加增强了用户情感的交互,使得情感信息沿着社交网络结构进行扩散。
Thelwall Mike针对MySpace上的朋友关系网络进行情感分析,发现相连接的用户往往具有相同的情感倾向7。Bollen Johan等人8在2011年基于Twitter上的大规模的海量数据,研究了社交网络中幸福感的同质现象,表明用户更倾向于选择具有相同幸福感指数的人进行交互。
3.3 社交网络的垃圾意见挖掘技术
社交网络中的垃圾用户、网络推手等为推搞产品销售量或推高某个时间而发布大量的虚假信息,检测分析社交网络中的垃圾意见对于抽取真实的信息再要具有十分重要的意义。Jindal Nitin和Liu Bing9在情感分析的基础上,首次提出了针对产品垃圾意见检测的概念。其将垃圾意见检测看做二元分类问题,基于亚马逊580万产品评论,根据评论的重合度,采用Logistic回归方式将用户意见分为垃圾意见和非垃圾意见两类。
本词条内容贡献者为:
李磊 - 合肥工业大学副教授 - 国家973计划“社交网络分析与网络信息传播的基础研究”项目组