基于情感词典的文本情感分析方法

大致流程:
基于情感词典的文本情感分析方法

一、确定情感词典:

情感词典分为极性词典和量化词典(自己整理定义)。
1.若选择量化词典可直接进行第二步(适合情感词较少的短文本,重点在于区分情感程度);
2.若选择极性词典,需要先对消极和积极的情感词进行赋值,如:积极词赋值0.1,消极词赋值0.001(适合长文本,重点在于判断文章情感倾向)。

二、读取文件:

1.读取情感词典文件,建立情感词典对象,定义为key.value。
2.读取否定词词典,采用List文件即可。
3.读取程度副词词典,定义为key.value。

三、计算得分:

1.将文章进行分词处理;
2.遍历分词结果,根据第二步中导入的情感词典对象,定位情感词,并判断情感词之间是否有程度副词和否定词
3.初始情感词权重(w)赋值为1,若出现否定词,下一情感词权重值取反(-w);若出现程度副词,下一情感词权重为乘以程度副词权重(
4.情感词得分为:权重*初始赋值
5.文章得分为文中所有情感词分值之和

四、分析结果:

根据最终文章得分即可判断文章的情感倾向及情感强烈程度。

**

词典介绍:

**

一、情感词典:

(一)量化词典:
将不同词的情感倾向量化,用数值表示。其中负数代表偏负面的词语,非负数代表偏正面的词语,正负的程度可以由数值的大小反应出。
基于情感词典的文本情感分析方法
(二)极性词典:
将词分为积极和消极,或乐、好、怒、哀、惧、恶、惊等词性。
基于情感词典的文本情感分析方法

二、否定词词典:

基于情感词典的文本情感分析方法

三、程度副词词典:

基于情感词典的文本情感分析方法