统计学6:卡方分布

一、什么是 χ2\chi^2 分布?

χ2\chi^2概率分布主要用于检查实际结果与期望结果之间何时存在显著差异。χ2\chi^2是一种检验统计量。
主要作用:
1)检验拟合优度:检验观察频数是否和假设的概率分布相吻合
2)检验变量的独立性:判断两种因素是否相互独立

二、用χ2\chi^2 分布进行假设检验

检验步骤:

  1. 确定要检验的原假设 H0H_0 和备择假设 H1H_1
  2. 求出期望频数和自由度 ν=\nu=组数-限制数
    (1)拟合优度检验:
    期望频数:根据假设的概率分布求
    自由度 ν=\nu=组数-限制数
    (2)独立性检验:
    期望频数:=×期望频数=\frac{行合计\times列合计}{总和}
    自由度:ν=(h1)(k1)\nu =\left(h-1\right)\left(k-1\right)
  3. 先确定显著性水平 α\alpha,再用 χ2\chi^2 概率表找拒绝域临界值 xx
    P(χα2(ν)x)=αP\left(\chi_\alpha^2\left(\nu\right)\geq x \right)=\alpha
  4. 计算检验统计量 χ2\chi^2
    χ2=(OE)2E\chi^2=\sum \frac{(O-E)^2}{E}
    O:观察频数,E:期望频数
  5. 查看检验统计量是否位于拒绝域以内
  6. 做出决策
    检验统计量位于拒绝域以内 χ2>x\chi^2>x,则拒绝原假设,接受备择假设
    检验统计量位于拒绝域以外 χ2<x\chi^2<x,则接受原假设

拟合优度检验备注:

不同频率分布的自由度

统计学6:卡方分布

独立性检验备注:

  1. 自由度计算方法:

统计学6:卡方分布求自由度就是数有多少个需要直接计算的值 VijV_{ij},由于已知各行各列的总数 TijT_{ij},所以各行各列都有一个数不用直接计算,TijVijT_{ij}-V_{ij} 可间接算出

  1. 如果用显著性水平 α\alpha 和自由度 ν\nu进行检验,则表示为 χα2(ν)\chi_\alpha^2\left(\nu\right)

实例

1. 拟合优度检验

统计学6:卡方分布
统计学6:卡方分布

2. 独立性检验

统计学6:卡方分布
统计学6:卡方分布
χ2\chi^2 概率分布表
统计学6:卡方分布
参考资料:
可汗学院统计学:https://www.bilibili.com/video/av7199273/?p=73
《深入浅出统计学》