第三章 转向高维数据
3.1 协方差
协方差:度量随机变量间的依赖关系(仅衡量线性依赖关系)
协方差经验形式:
p维多元变量的协方差矩阵:
正协方差对应向上倾斜的散点图
负协方差对应向下倾斜的散点图
协方差有量纲,不同单位的协方差的数值可能不同
小样本用n-1代替n,修正至较小偏差
3.2 相关系数
定义:(无量纲)
经验形式:
相关系数矩阵:
定理3.1:若X与Y互相独立,则相关系数和协方差为0(逆定理不成立,在两个变量均为正态分布时成立)
通过检验二元正态随机变量相关系数是否为0判断独立性:费希尔的Z变换对相关系数进行变换
假设检验原理:https://blog.****.net/ch1209498273/article/details/78314138
例题:
标准正态分布表:
注:5%的显著水平:1.96
3.3概括统计量
将矩阵表示的基本统计量进行线性变换。
3.3.1 基本统计量的矩阵表示
假定数据矩阵X:
均值矩阵:
协方差矩阵:
相关系数矩阵:
3.3.2 矩阵线性变换
变换后均值矩阵:
变换后方差矩阵:
非齐次变换: