第三章 转向高维数据

3.1 协方差

协方差:度量随机变量间的依赖关系(仅衡量线性依赖关系)第三章 转向高维数据
协方差经验形式:
第三章 转向高维数据
p维多元变量的协方差矩阵:
第三章 转向高维数据

正协方差对应向上倾斜的散点图
负协方差对应向下倾斜的散点图
协方差有量纲,不同单位的协方差的数值可能不同
小样本用n-1代替n,修正至较小偏差

3.2 相关系数

定义:(无量纲)
第三章 转向高维数据
经验形式:
第三章 转向高维数据
相关系数矩阵:
第三章 转向高维数据

定理3.1:若X与Y互相独立,则相关系数和协方差为0(逆定理不成立,在两个变量均为正态分布时成立)
通过检验二元正态随机变量相关系数是否为0判断独立性:费希尔的Z变换对相关系数进行变换
第三章 转向高维数据

假设检验原理:https://blog.****.net/ch1209498273/article/details/78314138
例题:
第三章 转向高维数据

标准正态分布表:
第三章 转向高维数据

注:5%的显著水平:1.96

3.3概括统计量

将矩阵表示的基本统计量进行线性变换。

3.3.1 基本统计量的矩阵表示

假定数据矩阵X:
第三章 转向高维数据
均值矩阵:第三章 转向高维数据
协方差矩阵:第三章 转向高维数据
相关系数矩阵:
第三章 转向高维数据

3.3.2 矩阵线性变换第三章 转向高维数据

变换后均值矩阵:第三章 转向高维数据
变换后方差矩阵:第三章 转向高维数据
非齐次变换:
第三章 转向高维数据

3.3.3马哈拉诺比斯变换

第三章 转向高维数据
第三章 转向高维数据