在线社交网络群体情感计算主要分析方法分为:基于语义规则的情感分析方法、基于监督学习的情感分析方法和基于话题模型的情感分析方法。
目录:
1. 概述
2. 典型分析技术
一**.** 概述
在线社交网络的情感分析技术很大一部分源于文本情感分析。此处的文本与微博等社交网络不同,通常指“长文本”,如网络新闻、网民博客、论坛帖子等。其主要分析方法分为:基于语义规则的情感分析方法、基于监督学习的情感分析方法和基于话题模型的情感分析方法1。
二**.** 典型分析技术
1,基于语义规则的情感分析方法
基于语义规则的情感分析方法在情感词典的基础上,通过语义规则计算评价词与情感词典中种子词的距离,从而达到情感分类的目的。基于语义规则的情感分析方法本质上是无监督学习方法,典型的算法是Peter D.Turney提出的SO-PIM算法2。
2,基于监督学习的情感分析方法
有监督的情感分析模型主要包括朴素贝叶斯模型、最大熵模型和支持向量机模型。朴素贝叶斯方法通过训练集学习先验概率分布及条件概率分布,从而达到情感分类目的3。最大熵的主要思想是在只掌握关于未知分布的部分知识时,应选择符合这些条件但熵最大的概率分布4。支持向量机采用间隔最大化求解最优化的分离超平面实现分类的目的5。
3,基于话题模型的情感分析方法
基于话题模型PLSA或LDA,在话题模型的基础上,增加情感词变量,从而识别出所谈论的话题以及情感倾向。PLSA和LDA都属于贝叶斯生成模型,可参考《Pattern recognition and machine learning》6详细解读。
本词条内容贡献者为:
李磊 - 合肥工业大学副教授 - 国家973计划“社交网络分析与网络信息传播的基础研究”项目组