概率论与数理统计——多方法解决-双样本方差的F检验-Excel/SPSS

本篇将结合一个例题,借助Excel工具和SPSS,分别从不同的拒绝域位置和利用不同的函数,多方法地总结双样本的F检验的思路和方法。
参数假设检验的内容请参考《概率论与数理统计——参数假设检验》

【例题】
有A、B两个语料库,从中各抽取5篇,分别统计出每篇的句数,假设两个语料库的语篇句数是正态分布,以0.05的显著水平来检验两个语料库的语篇句数的变异程度是否一致。

A 20 18 12 24 26
B 24 22 18 22 14

要想检验两个样本的变异程度是否一致,就要看二者的方差是否一致,显然采用F检验。

解法一:双尾检验+比较统计量

第一步

根据问题的要求提出:

H0σ1σ2=1      H1σ1σ21 原假设H_0:\frac{\sigma_1}{\sigma_2}=1\ \ \ \ \ \ 备择假设H_1:\frac{\sigma_1}{\sigma_2} \neq 1

第二步

构造统计量:

F=S12/S22σ12/σ22 F=\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}

代入数据:

F=42/3.5821=1.25 F=\frac{4^2/3.58^2}{1}=1.25

第三步

设定显著水平:
α=0.05 \alpha=0.05

第四步

该检验是双尾检验,利用Excel的FINV()函数,求得两个临界点为:

Fα2=9.065F1α2=0.104 F_\frac{\alpha}{2}=9.065 \\ F_{1-\frac{\alpha}{2}}=0.104

比较可得:

0.104<1.25<9.065 0.104<1.25<9.065

即:

F1α2<F<Fα2 F_{1-\frac{\alpha}{2}}<F<F_\frac{\alpha}{2}

故,统计量位于接受域。因此,拒绝H1H_1,接受H0H_0
结论为:95%的把握肯定, A、B语料库的语篇句数的变异程度一致。


解法二:双尾检验+比较统计量的概率

前三步参考解法一

第四步

该检验是双尾检验,利用Excel的FTEST()函数,求得双尾概率为:

P(F)=0.83 P(F)=0.83

FTEST(array1,array2)函数返回的是F检验array1 和 array2 中的方差没有显著差异的双尾概率。
本方法的使用语句为:=FTEST({20,18,12,24,16},{24,22,18,22,14})。当然,在实际的操作中,可以将两个数组替换为对应的表格区域。

比较可得:

0.025<0.83<0.975 0.025<0.83<0.975

即:

P(F1α2)<P(F)<P(Fα2) P(F_{1-\frac{\alpha}{2}})<P(F)<P(F_\frac{\alpha}{2})

故,统计量位于接受域。因此,拒绝H1H_1,接受H0H_0
结论为:95%的把握肯定, A、B语料库的语篇句数的变异程度一致。


解法三:左右单尾检验结合+比较统计量

这个方法的思路是,进行两次单位检验,从而检验出σ1σ21\frac{\sigma_1}{\sigma_2}\le 1σ1σ21\frac{\sigma_1}{\sigma_2}\ge 1同时显著成立,进而推导出σ1σ2=1\frac{\sigma_1}{\sigma_2}=1显著成立。

第一次检验:右单尾检验

第一步

根据问题的要求提出:

H0σ1σ21      H1σ1σ2>1 原假设H_0:\frac{\sigma_1}{\sigma_2}\le 1\ \ \ \ \ \ 备择假设H_1:\frac{\sigma_1}{\sigma_2} > 1

第二步

构造统计量:

F=S12/S22σ12/σ22 F=\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}

代入数据:

F=42/3.5821=1.25 F=\frac{4^2/3.58^2}{1}=1.25

第三步

设定显著水平:
α=0.05 \alpha=0.05

第四步

该检验是右尾检验,利用Excel的FINV()函数,求得临界点为:

Fα=6.388 F_\alpha=6.388

比较可得:

1.25<6.388 1.25<6.388

即:

F<Fα F<F_\alpha

故,统计量位于接受域。因此,拒绝H1H_1,接受H0H_0
结论为:95%的把握肯定,σ1σ21\frac{\sigma_1}{\sigma_2}\le 1

第二次检验:左单尾检验

第一步

根据问题的要求提出:

H0σ1σ21      H1σ1σ2<1 原假设H_0:\frac{\sigma_1}{\sigma_2}\ge 1\ \ \ \ \ \ 备择假设H_1:\frac{\sigma_1}{\sigma_2} < 1

第二步至第四步类比参考第一次检验

最后可以得到结论为:95%的把握肯定,σ1σ21\frac{\sigma_1}{\sigma_2}\ge 1

综合两次的检验结果可得:95%的把握肯定,σ1σ2=1\frac{\sigma_1}{\sigma_2}= 1即 A、B语料库的语篇句数的变异程度一致。


解法四:左右单尾检验结合+比较统计量的概率

该解法的思路和解法三基本相同,只是在检验时,比较的是统计量的概率。
统计量的概率可以通过FDIST()函数来实现。
除此之外,也可以利用解法二里的FTEST()函数,不过该函数返回的是双尾概率,在单尾检验时要除以2才能表示单尾概率。


解法五:利用Excel的数据分析工具

该解法的思路是和解法三、解法四类似的,都是结合左右单尾检验,不同的是直接利用工具完成构造统计量和求临界点等步骤。

点击Excel中的数据菜单,点击分析子菜单的数据分析按钮
概率论与数理统计——多方法解决-双样本方差的F检验-Excel/SPSS

然后在分析工具里选择F-检验 双样本方差,点击确定
概率论与数理统计——多方法解决-双样本方差的F检验-Excel/SPSS

然后在弹出的对话框里输入所要分析的两组数据的区域,并填写好α\alpha,选择好输出的位置,点击确定
概率论与数理统计——多方法解决-双样本方差的F检验-Excel/SPSS

然后会产生下面的表格:
F-检验 双样本方差分析

- 变量1 变量2
平均 18 20
方差 20 16
观测值 5 5
dfdf 4 4
FF 1.25
P(Ff)P(F\le f) 0.41701
FF单尾临界 6.388233

小数点的位数会根据单元格的数值格式的设定变化,并非产生的一定就是表中小数体现的位数。

先解释一下表里面的数据的含义,均值和方差不必多数;这里的观测值是样本的个数;dfdf是自由度,为样本的个数减一;FF即根据公式构造的统计量的值;P(Ff)P(F\le f)FF的右尾概率,相当于FTEST({20,18,12,24,16},{24,22,18,22,14})/2FDIST(1.25,4,4)的结果。
所以,
设计右尾检验:
比较可得:

1.25<6.388 1.25<6.388
故,拒绝H1H_1,接受H0H_0,即σ1σ21\frac{\sigma_1}{\sigma_2}\le 1

设计左尾检验:
比较可得:

1.25>0.157 1.25>0.157

其中0.157为左尾临界值

故,拒绝H1H_1,接受H0H_0,即σ1σ21\frac{\sigma_1}{\sigma_2}\ge 1

综上可得,σ1σ2=1\frac{\sigma_1}{\sigma_2}= 1


解法六:利用SPSS进行F检验

既然进行统计检验,当然少不了专业的SPSS。
用SPSS检验的结果如下:
概率论与数理统计——多方法解决-双样本方差的F检验-Excel/SPSS

其中Sig>0.05Sig>0.05显然成立,因此可以判定两组数据的方差显著一致。

在SPSS中检验出的结果是1,也就是表明两组数据方差非常一致,几乎没有差别。例题的数据只是一个示例,并不符合实际的数据情况。



总结

这六种方法主要是从不同的软件出发,分别利用双尾检验或左右单尾检验的方式完成F检验,其中涉及到使用不同的Excel函数和Excel工具,这些函数和工具各有千秋,可以根据实际需求选择合适的方案。