假设检验

假设检验

先来举一个投掷硬币的例子。现在有一个硬币,我给你投10次,你觉得会出现几个正面,几个反面,出现什么情况的时候我们会觉得这个硬币是有问题的
证明一个问题有两种方法

  1. 我们取高概率的事件

我们先假设这个硬币是均匀的,
第一次扔出一个正面,OK,概率是0.5
第二次扔出一个正面,OK,概率是0.50.5=0.25
第三次扔出一个正面,OK,概率是0.5
0.50.5=0.125
第四次扔出一个正面,OK,概率是0.5
0.5*0.5=0.0625
依次类推

这个时候我们就会想,如果硬币均匀,出现四次的概率只有0.0625,这么低概率的情况竟然出现了,这个硬币可能是有点猫腻啊,然后又丢了一次

第五次扔出一个正面,OK,概率是0.50.50.5*0.5=0.03125
这回就彻底不干了,这概率也太低了,事件出现的概率越低,当发生时,所包含的信息是非常多的,这个硬币是有问题的。

反复扔硬币应该符合二项分布(这就不解释了),表达式为:

X − B ( n , μ ) X-B(n,\mu) XB(n,μ)
如果硬币是均衡的, μ \mu μ就是0.5,n=10,然后绘制出曲线
假设检验
假如出现了8次或者8次以上的正面,那么概率就是

假设检验
P ( 8 < = X < = 10 ) = 0.05 P(8<=X<=10)=0.05 P(8<=X<=10)=0.05,我们知道落在0-2,8-10的区间概率是非常低,当在一次实验中出现这样的极端事件,我们会觉得硬币是有问题的。我们可以考虑一下,当出现的概率非常低的时候,比如低于0.05,我们就认为这个假设是不合理,即硬币不均匀。

有个数学大佬出来定义了一个称为(p-value)的概念:即把八次正面的概率,与更极端的九次正面、十次正面的概率加起来: p _ v a l u e = P ( X > = 8 ) p\_value=P(X>=8) p_value=P(X>=8),根据扔硬币这个例子,可能你会觉得,我知道八次正面出现不正常就行了,干嘛要把九次、十次加起来?
首先连续的概率密度无法计算单点的概率(概率等于概率密度的积分,如果一个点的话上下值都是一样的,积分等于0),其次区间会更加的稳定,如果我们做多次实验(每次都投500次),那么每次的概率值都是不同的,但是大多数都大于某一个值,例如530等,所以比单一值更好(有点像是置信区间)。

假设检验

组与次数
你研究了两组人,你把他们分成三个类别,单身、已婚和离婚:
三个类别的数据是不同的,但是 ……

  • 这是不是随机的?
  • 还是真有实质的不同?

卡方检验 可以给你一个 “p” 值去判定!
例子:“你喜欢哪种度假方式?”

沙滩 邮轮
209 280
225 248

性别对度假方式的偏爱有影响吗?
如果性别(男或女)真的对度假方式的偏爱有影响,它们便是相依的。

我们可以用一个特别的算法(在下面有说明)算出一个 “p” 值:

p值是 0.132

通常 p < 0.05 代表变量是相依的。在这例子里,p 大于 0.05,所以我们相信变量是独立(没关联)的。

就是说,男人和女人对沙滩度假和邮轮度假的偏爱可能是没有分别的。