(补基础)数据分析系列:假设检验的基础知识

JunLiang 数据科学家联盟 

目录:

  • 0x00 前言

  • 0x01 基本思想

  • 0x02 检验方向

    • 拒绝域(拒绝域是由显著性水平围成的区域)

    • 1.双尾检验

    • 2.单尾检验

  • 0x03 一类错误和二类错误

  • 0x04 假设检验的步骤

  • 0x0FF 总结

 

0x00 前言

我们经常会遇到这样的问题:

  • 在ABTest中,怎么衡量实验结果是否显著?置信度是多少?

  • 两组销售数据,如何判断一组销售数据是否比另外一组销售数据更好?

  • 如何检验减肥药食用前后同一批人的体重是否有变化?

  • 如何检验教育程度是否显著影响薪水?

接下来,我们聊一聊假设检验的相关知识:假设检验的基础知识、假设检验的应用及代码实现和假设检验在数据分析中的应用案例。本篇先聊一下假设检验的基础知识。

0x01 基本思想

假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设 H0 是否正确,首先假定该假设 H0 正确,然后根据样本对假设 H0 做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设 H0 ,否则应接受假设 H0 。

显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著。经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的。

0x02 检验方向

通常假设检验的目的是两总体参数是否相等,以两样本均数比较为例,无效假设为两样本所代表的总体均数相等;备择假设为不相等(有可能甲大于乙,也有可能甲小于乙)既两种情况都有可能发生。
而研究者做这样的假设说明:
(1)他没有充分的理由判断甲所代表的总体均数会大于乙的或甲的会小于乙的;
(2)他只关心甲乙两个样本各自所代表的总体均数是否相等,至于哪个大不是他关心的问题。这时研究者往往会采用双侧检验。

拒绝域(拒绝域是由显著性水平围成的区域)

拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。给定显著性水平 α 后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。

1.双尾检验

  • 双侧检验:H0: μ = μ0, H1: μ ≠ μ0;

(补基础)数据分析系列:假设检验的基础知识

双尾检验更加严谨,更难拒绝 H0 假设,所以它应用得更为广泛。只有当我们的研究真的非常有方向性的时候,才考虑单尾检验。

当 P < α/2 时拒绝 H0。

2.单尾检验

当研究假设具有明确方向性时使用单尾检验,在一侧尾部上拒绝 H0。

  • 左尾检验:H0: μ ≥ μ0, H1: μ < μ0;

  • 右尾检验:H0: μ ≤ μ0, H1: μ > μ0;

如果研究者从专业知识的角度判断甲所代表的总体均数不可能大于(或小于)乙的,这时一般就采用单侧检验。

例子:
要比较经常参加体育锻炼的中学男生心率是否低于一般中学男生的心率,就属于单侧检验。因为根据医学知识知道经常锻炼的中学男生心率不会高于一般中学男生,因此在进行假设检验时应使用单侧检验。

  • H0:经常参加体育锻炼的中学男生心率 ≥ 一般中学男生的心率;

  • H1:经常参加体育锻炼的中学男生心率 < 一般中学男生的心率;

1)左尾检验

 

(补基础)数据分析系列:假设检验的基础知识

2)右尾检验

(补基础)数据分析系列:假设检验的基础知识

无论是左尾检验还是右尾检验,当 P < α 时拒绝 H0。

单尾检验和双尾检验的区别:
他们拒绝 H0 的标准。单尾检验允许你在差异相对较小时拒绝 H0,这个差异被规定了方向。另一方面,双尾检验需要相对较大的差异,这个差异不依赖于方向。

0x03 一类错误和二类错误

(补基础)数据分析系列:假设检验的基础知识

其中 α 错误又称为“弃真”错误(一类错误),β 错误又称为“纳伪”错误(二类错误)。在日常实际应用中,通常我们采用的是显著性水平检验,即求犯“弃真”错误的概率;我们常说在α = 0.05的水平进行显著性检验,α = 0.05即是我们的犯“弃真”错误的概率,又称为显著性水平;1 - α (95%) 即是我们说的置信度水平。

0x04 假设检验的步骤

  • 提出关于总体的研究假设(H1),H0 为 H1 的对立假设;

  • 选择检验统计量;

  • 确定用于做决策的拒绝域;

  • 求出检验统计量的 P 值(计算样本数据在比较分布中的位置);

  • 查看样本结果是否位于拒绝域为;

    • p < α,拒绝 H0

    • p > α,接受 H0

  • 作出决策;

0x0FF 总结

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。常用的假设检验方法有 Z 检验、t 检验、卡方检验、F 检验等。

我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。

本篇文章主要讲了假设检验的基础知识,后续文章我们再来讲讲假设检验的使用方法以及假设检验在数据分析中的实际使用案例。

 

参考资料

[1] 假设检验(Hypothesis Testing). https://www.cnblogs.com/HuZihu/p/9692828.html
[2] 假设检验. https://wiki.mbalib.com/wiki/%E5%81%87%E8%AE%BE%E6%A3%80%E9%AA%8C
[3] 双尾检验和单尾检验. http://blog.sina.com.cn/s/blog_6fc04b2b0100zen2.html