四种相关关系的对比
名称 | 解释 | 分类 | 使用条件 |
积差相关 | 反应两个变量之间的线性关系 | Pearson | (1)两个变量都是由测量获得的连续型数据; (2)两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布; (3)必须是成对的数据,即两个变量应来自对同一总体或样本的测量; (4)两个变量之间呈线性关系; (5)大样本,n≥30 。 |
等级相关 | 反应两个变量之间的非线性关系 | Spearman | 1) 顺序变量之间的相关。顺序变量的取值转换成等级值; 2) 适用于原始资料为顺序变量的数据; 3) 原始资料为等距或等比变量,但总体分布非正态,不宜用积差相关分析的数据。 4) 样本量不要求非要大于30。 |
Kendall | 有n个统计对象,每个对象有两个属性的系数。将所有统计对象按属性1取值排列,不失一般性,设此时属性2取值的排列是乱序的。设P为两个属性值排列大小关系一致的统计对象对数。 | ||
质量相关 | 一个变量为质,另一个变量为量 | 点二列相关(真实的二分类变量) | 连续变量(或等距变量或等比变量)服从正态分布,或接近正态分布。不用考虑二分变量的数据分布是否是正态分布。变量之间是线性关系。二分变量是真正的二分类,如性别、硬币的正反、题目的对错。其分界点尽量靠近中值。样本容量大于80。SPSS中是pearson相关系数的特例。 |
二列相关(人为的二分类变量) | 连续变量服从正态分布,或接近正态分布。变量之间是线性关系。二分变量是人为划分的,如按照考试成绩分为合格与不合格。其分界点尽量靠近中值。样本容量大于80。在SPSS中,也相当于计算两个连续变量的pearson相关系数。 | ||
多系列相关 | 两个变量都是连续变量,其中一个变量按照一定标准被人为的分成多个类别。二列相关是多系列相关的特例。 | ||
品质相关 | 两个变量的值都是按照性质划分为几种类别 | 列联相关 | 当两列变量中的一列变量或两列变量被分成三个或三个以上类别,用来表示两列变量之间的相关。 |
φ相关 | 当两列变量都是二分变量,不论是真正的二分还是人为的二分,都可以用。 | ||
四分相关 | 两列变量都是正态连续变量,而且呈现直线关系,只是两列变量都被人为的变成二分变量,表示这两列变量之间的相关。 |
一个小栗子: