在线社交网络情感极性分析**,**又称为在线社交网络情感倾向性分析,指在社交网络环境下,抽取观点持有者对评价对象的情感倾向性,一般用三元分类(如正面、中立、负面)或数值评分(1到5分)进行表示。
目录:
1. 定义
2. 在线社交网络情感极性分析技术
一.定义
在线社交网络情感极性分析**,**又称为在线社交网络情感倾向性分析,指在社交网络环境下,抽取观点持有者对评价对象的情感倾向性,一般用三元分类(如正面、中立、负面)或数值评分(1到5分)进行表示。在线社交网络情感极性分析,很大一部分是源于文本情感的极性分析,往往需要建立情感本体,如Yan等利用HowNet建立了情感本体,包含5500个动词和113种不同的情感类别1。
二.在线社交网络情感极性分析技术
在线社交网络情感分析的技术包括粗粒度情感极性分类技术和细粒度情感分类技术。
粗粒度情感分类技术重要用于判断文本整体的情感倾向,主要方法包括基于传统文本分类的方法、基于褒贬词汇的统计方法、基于回归模型与序列标注的方法,还有一些采用多种方法混合的方式进行。文本分类常用的分类器包括支持向量机(SVM)、最大熵(ME)、朴素贝叶斯(NB)。
细粒度情感极性分析技术,主要注重的是从社交网络文本中识别产品和服务的属性,并判断不同个体对于不同属性的情感极性。在实践中,细粒度情感极性分类对于顾客优化购买决策,或者企业改进产品都具有重要指导意义,研究工作主要集中在主题词和情感词的提取上。主题词提取指与产品有关的显示属性与隐式属性2。显示属性指在产品评论中直接描述出产品的功能或者性能的名词或名词性短语。隐式属性指没有直接在语句中描述,而是根据上下文语境才能够获得。Kobayashi等建立了汽车和旅游的产品属性,每个属性用三元组表示,其中Subject表示产品,Attribute表示属性,Value表示用户对属性的观点,再以人工的上式进行标注3。情感词提取是采用一定的方法(人工标注、机器学习等)提取句子中带有感情倾向的词汇。Tong手工建立了针对电影的评论情感词典4。王素格等5利用已有的五种资源,构建了中文情感词词典。Hu6假定属性与情感词在评论的句子中会一起出现,基于关联规则算法找出高频出现的名词作为产品属性,取属性附近的形容词作为该属性的情感词。
本词条内容贡献者为:
李磊 - 合肥工业大学副教授 - 国家973计划“社交网络分析与网络信息传播的基础研究”项目组