四种相关关系的对比

名称 解释 分类 使用条件
积差相关 反应两个变量之间的线性关系 Pearson (1)两个变量都是由测量获得的连续型数据;
(2)两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布;
(3)必须是成对的数据,即两个变量应来自对同一总体或样本的测量;
(4)两个变量之间呈线性关系;
(5)大样本,n≥30 。
等级相关 反应两个变量之间的非线性关系 Spearman 1) 顺序变量之间的相关。顺序变量的取值转换成等级值;             
2) 适用于原始资料为顺序变量的数据;
3) 原始资料为等距或等比变量,但总体分布非正态,不宜用积差相关分析的数据。
4) 样本量不要求非要大于30。
Kendall 有n个统计对象,每个对象有两个属性的系数。将所有统计对象按属性1取值排列,不失一般性,设此时属性2取值的排列是乱序的。设P为两个属性值排列大小关系一致的统计对象对数。
质量相关 一个变量为质,另一个变量为量 点二列相关(真实的二分类变量) 连续变量(或等距变量或等比变量)服从正态分布,或接近正态分布。不用考虑二分变量的数据分布是否是正态分布。变量之间是线性关系。二分变量是真正的二分类,如性别、硬币的正反、题目的对错。其分界点尽量靠近中值。样本容量大于80。SPSS中是pearson相关系数的特例。
二列相关(人为的二分类变量) 连续变量服从正态分布,或接近正态分布。变量之间是线性关系。二分变量是人为划分的,如按照考试成绩分为合格与不合格。其分界点尽量靠近中值。样本容量大于80。在SPSS中,也相当于计算两个连续变量的pearson相关系数。
多系列相关 两个变量都是连续变量,其中一个变量按照一定标准被人为的分成多个类别。二列相关是多系列相关的特例。
品质相关 两个变量的值都是按照性质划分为几种类别 列联相关 当两列变量中的一列变量或两列变量被分成三个或三个以上类别,用来表示两列变量之间的相关。
φ相关 当两列变量都是二分变量,不论是真正的二分还是人为的二分,都可以用。
四分相关 两列变量都是正态连续变量,而且呈现直线关系,只是两列变量都被人为的变成二分变量,表示这两列变量之间的相关。

 四种相关关系的对比

一个小栗子: 

四种相关关系的对比