大数据案例分析学习笔记1.5(一致性的评价方法)

什么是一致性评价?

一致性评价: 指对两个或多个相关的变量进行分析,从而衡量其相关性的密切程度

一致性评价——皮尔森相关系数法(pearson)

皮尔森相关系数的应用背景:
1、用来衡量两个用户之间兴趣的一致性
2、用来衡量预测值与真实值之间的相关性
3、既适用于离散的,也适用于连续变量的相关分析
大数据案例分析学习笔记1.5(一致性的评价方法)
取值区间为[-1,1]。-1是完全负相关,+1表示完全正相关,0表示没有线性相关

一致性评价——Cohen’s kappa相关系数

一、
Cohen’s kappa相关系数也可用于衡量两个评价者之间的一致性。其特点在于:

  • 与皮尔森相关系数的区别:Cohen’s kappa相关系数通常用于离散的分类的一致性评价
  • 其通常被认为比两人之间的简单一致性百分比更强壮,因为Cohen’s kappa考虑到了二人之间的随机一致的可能性
  • 如果评价者多于2认时,可以考虑使用Fleiss’kappa

二、Cohen’s kappa计算方法
大数据案例分析学习笔记1.5(一致性的评价方法)

Cohen’s kappa取值的含义

kappa score是一个介于-1到+1之间的数
+1表示结果完全一致
-1表示结果完全不一致
大于等于0.8表示已经取得相当满意的一致程度
小于0.4表示一致程度不够理想
0或更低表示不一致

Fleiss’s kappa

衡量多于2人评价者的一致性
大数据案例分析学习笔记1.5(一致性的评价方法)大数据案例分析学习笔记1.5(一致性的评价方法)

大数据案例分析学习笔记1.5(一致性的评价方法)