在线社交网络情感强度分析,指在社交网络环境下,分析社交网络内容情感倾向的强度或褒贬情感的强弱的分析。情感极性分析只是对用来判断社交网络内容是正面的还是负面的,而情感强度分析是用来分析社交网络内容正面或者负面的强度1。
目录:
1.定义
2.在线社交网络情感强度分析技术
一**.**定义
在线社交网络情感强度分析,指在社交网络环境下,分析社交网络内容情感倾向的强度或褒贬情感的强弱的分析。情感极性分析只是对用来判断社交网络内容是正面的还是负面的,而情感强度分析是用来分析社交网络内容正面或者负面的强度。情感强度分析有助于理解用户的消费习惯、捕获热点事件的舆情,为企业和政府的决策提供依据。
二**.**在线社交网络情感强度分析技术
目前,针对在线社交网络情感强度分析的研究,主要采用等级分类方法,将情感强度划分为不同的级别,在判断情感强度属于哪个级别。情感强度分析方法主要分为两大类:词汇情感强度的计算方法和句子或篇章情感强度的计算方法。
词汇情感强度的计算方法主要包括:基于情感词典的方法、基于词频统计的方法以及基于不同词性组合的方法。基于情感词典的方法主要是利用已有的情感词典,判断情感词的强度,如朱嫣岚等人2使用WordNet定义词汇的关联关系来计算情感词与一组情感倾向已有的词的距离,从而分析情感强度。基于词频统计的方法就是统计情感词在文本中出现的频率来判断词的情感极性及其强度。LW Ku等人3假设汉语词汇的情感倾向是由组成词汇的字组成)通过计算单字在特定的情感数据集中出现的频率表征单字的情感强度,而词汇的情感强度则由单字合成,等于各字情感度的平均值。基于不同词性组合的方法主要利用的是不同的词性组合在表达情感时会表征出不同的程度。例如,“手机功能强大”,与“手机功能非常强大”,显然,副词修饰的形容词比单个形容词表达的情感强烈。
句子或篇章情感强度的计算方法包括多分类方法以及计算情感得分方法。多分类方法将强度分成几个等级,每个强度等级当作一个类别,构造分类器对其分类。WH Lin等人4在研究语料的观点类型时,将强度类别分为5类,通过改进朴素贝叶斯模型,构建分析句子情感强度的LSPM模型,该模型在判别句子的情感强度类别时,准确率达到75.29%,略低于篇章级别的准确率。计算情感得分方法,情感强度的变化是连续的,多分类方法忽略了这种连续性,造成训练模型不够准确,影响了情感强度的判断。为此,不少研究通过计算情感得分的方法计算句子或篇章的情感强度。王洪伟等人5认为情感句子权重应考虑情感句子在段落中出现的位置,出现在段首或段末的情感句子权重应当大于段中的情感句子权重,基于这一假设,分别对酒店评论和手机评论进行情感强度分析,取得了较好的效果。
本词条内容贡献者为:
李磊 - 合肥工业大学副教授 - 国家973计划“社交网络分析与网络信息传播的基础研究”项目组