机器学习|参数的假设检验（显著性检验）-- 例题引入、解题方法、基本思想|20mins 入门|概统学习笔记（三十）

引入：在这讨论不同于参数估计的另一类重要的统计推断问题。这就是根据样本的信息检验关于总体的某个假设是否正确。这类问题称作假设检验问题(显著性检验)。

假设检验分为：

参数假设检验：总体分布已知，检验关于未知参数的某个假设
非参数假设检验：总体分布未知时的假设检验问题

参数的假设检验

引入：罐装可乐的容量标准应在350毫升和360毫升之间。生产流水线上罐装可乐不断地封装，然后装箱外运。怎么知道这批罐装可乐的容量是否合格呢？

把每一灌都打开倒入量杯，看容量是否合于标准？（这样做显然不行）

通常的办法是进行抽样检查。

每隔一定时间，抽查若干罐。如每隔一小时，抽查5罐，得5个容量的值 $X_1,...,X_5$ ，根据这些值来判断生产是否正常。

如发现不正常，就应停产，找出原因，排除故障，然后再生产；如没有问题，就继续按规定时间再抽样，以此监督生产，保证质量。

很显然，不能由5罐容量的数据，在把握不大的情况下就判断生产不正常，因为停产的损失是很大的。

当然也不能总认为正常，有了问题不能及时发现，这也要造成损失。

如何处理这两者的关系，假设检验面对的就是这种矛盾。

——————————————————思路过程—————————————————

在正常生产条件下，由于种种随机因素的影响，每罐可乐的容量应在355毫升上下波动。这些因素中没有哪一个占有特殊重要的地位。因此，根据中心极限定理，假定每罐容量服从正态分布是合理的。

这样，我们可以认为 $X_1,...,X_5$ 是取自正态分布 $N(\mu,\sigma^2)$ 的样本，当生存比较稳定时； $\sigma^2$ 是一个常数。现在要检验的假设是：
$H_0:\mu=\mu_0(\mu_0=355)$
(在实际工作中，往往把不轻易否定的命题作为原假设)

它的对立假设是：
$H_1:\mu \neq \mu_0$
称 $H_0$ 为原假设（或零假设，解消假设）；

称 $H_1$ 为备选假设（或对立假设）。

问题1：那么如何判断原假设 $H_0$ 是否成立呢？

由于 $\mu$ 是正态分布的期望值，它的估计量是样本均值 $\overline X$ ，因此可以根据 $\overline X$ 与 $\mu_0$ 的差距 $|\overline X-\mu_0|$ 来判断 $H_0$ 是否成立。

当 $|\overline X-\mu_0|$ 较小时，可以认为 $H_0$ 是成立的；

当 $|\overline X-\mu_0|$ 较大时，应认为 $H_0$ 不成立，即生产已不正常。

问题2：但是，较大、较小是一个相对的概念，合理的界限在何处？应由什么原则来确定？

问题归结为对差异作定量的分析，以确定其性质。

差异可能是由抽样的随机性引起的，称为抽样误差或随机误差。这种误差反映偶然、非本质的因素所引起的随机波动。

然而，这种随机性的波动是有一定限度的，如果差异超过了这个限度，则我们就不能用抽样的随机性来解释了。必须认为这个差异反映了事物的本质差别，即反映了生产已不正常。这种差异称作系统误差。

问题3：根据所观察到差异，如何判断它究竟是由于偶然性在起作用（抽样误差），还是生产确实不正常（系统误差）呢？如何给出一个量的界限呢？

这里用到在实践中普遍采用的一个原则：小概率事件在一次试验中基本上不会发生。

例如：有两个盒子，A盒里装有999个红球和1个白球，B盒里装有999个白球和1个红球

现从两盒中随机取出一个盒子，问这个盒子是A盒还是B盒呢？

不妨先假设：这个盒子是B盒。

现在从这个盒子中随机摸出一个球，发现是红球。

此时该如何判断这个假设是否成立呢？

如果假设该盒是B盒，摸出红球的概率只有 $\frac{1}{1000}$ ，这是小概率事件。

小概率事件在一次试验中竟然发生了，不能不使人怀疑所作的假设是否正确。

这个例子中所使用的推理方法，可以称为带概率性质的反证法，简称概率反证法。

它不同于一般的反证法，一般的反证法要求在原假设成立的条件下导出的结论时绝对成立的，如果事实与之矛盾，则完全绝对地否定原假设。

概率反证法的逻辑是：如果小概率事件在一次试验中居然发生，我们就以很大的把握否定原假设

在假设试验中，我们称这个小概率为显著性水平，用 $\alpha$ 表示。

$\alpha$ 的选择要根据实际情况而定。常取 $\alpha=0.1,\alpha=0.01,\alpha=0.05$

现在再次回到前面罐装可乐的例子中：罐装可乐的容量按标准应在350毫升和360毫升之间。一批可乐出厂前应进行抽样检查，现抽查了n罐，测得容量为 $X_1,X_2,...,X_n$ ，问这一批可乐的容量是否合格？

问题4：在提出原假设 $H_0$ 后，如何作出接受和拒绝 $H_0$ 的结论呢？

原假设为 $H_0:\mu=355$

对立假设为 $H_1:\mu \neq 355$

由于 $\sigma_1$ 已知，选检验统计量 $U=\frac{\overline X-\mu_0}{\sigma/\sqrt n}\sim N(0,1)$

它能衡量差异 $|\overline X-\mu_0|$ 大小且分布已知。

对给定的显著性水平 $\alpha$ ，可以在 $N(0,1)$ 表中查到分位点的值 $u_{a/2}$ ，使得
$P\{|U|>u_{a/2}\}=\alpha$
也就是说， $|U|>u_{\alpha/2}$ 是一个小概率事件。

故我们可以取的拒绝域为：
$W:|U|>u_{\alpha/2}$

如果由样本值算得该统计量的实测值落入区域W，则拒绝 $H_0$ ；否则，不能拒绝 $H_0$ .
基本思想：如果 $H_0$ 是对的，那么衡量差异大小的某个统计量落入区域W（拒绝域）是个小概率事件。如果该统计量的实测值落入W，也就是说， $H_0$ 成立下的小概率事件发生了，那么就认为 $H_0$ 不可信而否定它。否则我们就不能否定 $H_0$ ，而只好接受它。

不否定 $H_0$ 并不是肯定 $H_0$ 一定对，而只是说差异还不够显著，还没有达到足以否定 $H_0$ 的程度。所以假设检验又叫”显著性检验“。

如果显著性水平 $\alpha$ 取得很小，则拒绝域也会比较小。

其产生的后果是： $H_0$ 难于被拒绝。

如果在 $\alpha$ 很小的情况下 $H_0$ 仍被拒绝了，则说明实际情况很可能与之有显著差异。

基于这个理由，人们常把 $\alpha=0.05$ 时拒绝 $H_0$ 称为是显著的，而把在 $\alpha=0.01$ 时拒绝 $H_0$ 称为是高度显著的。

机器学习|参数的假设检验（显著性检验）-- 例题引入、解题方法、基本思想|20mins 入门|概统学习笔记（三十）

参数的假设检验

相关推荐