统计推断——假设检验——检验的功效(势)

统计推断——假设检验——检验的功效(势)

一、假设检验的两类错误:

第Ⅰ类错误:实际情况与统计推断——假设检验——检验的功效(势) 一致时,却根据统计量数值拒绝统计推断——假设检验——检验的功效(势),这样的错误称为第Ⅰ类错误;出现第Ⅰ类错误的概率用统计推断——假设检验——检验的功效(势)表示。

第Ⅱ类错误:实际情况与统计推断——假设检验——检验的功效(势)不一致时,却根据统计量数值不拒绝统计推断——假设检验——检验的功效(势),这样的错误称为第Ⅱ类错误;出现第Ⅱ类错误的概率用统计推断——假设检验——检验的功效(势)表示。

二、假设检验的两类错误为什么不能同时变小?

假如理论告诉我们参数统计推断——假设检验——检验的功效(势)只可能在0和1之间取值,检验统计量服从统计推断——假设检验——检验的功效(势)分布。检验统计量可取值于整个统计推断——假设检验——检验的功效(势),我们想要划分统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势),使得落在统计推断——假设检验——检验的功效(势)时接受统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)的假设,而落在统计推断——假设检验——检验的功效(势)时接受统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)的假设。

现在问题是如何划分统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)。事实上不同的原则可以导出不同的划分方法,其中每一个都是不同的检验。其中每种检验都对应相应的的第一类第二类错误概率值,所谓第一类第二类错误值不能同时减小,指的就是在这一阶段不可能通过单纯改变统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)的划分方式来同时降低两类错误概率。

至于为什么这一阶段不可能通过改变统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)划分来降低两类错误概率,由下图所示:

若以1/2为分隔点,当检验统计量落在其左边接受统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)落在右边时接受统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)

统计推断——假设检验——检验的功效(势)的确为0时,即统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)假设正确时,错误概率为落在1/2右边的概率(第一类错误发生的概率统计推断——假设检验——检验的功效(势))。如下图所示:

统计推断——假设检验——检验的功效(势)

统计推断——假设检验——检验的功效(势)的确为1时,错误概率(第二类错误发生的概率统计推断——假设检验——检验的功效(势))为落在1/2左边,如下图所示: 

统计推断——假设检验——检验的功效(势)

将分割线移到0时,统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)错误率升为 

统计推断——假设检验——检验的功效(势)

此时,统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势)时错误率降为 

统计推断——假设检验——检验的功效(势)

由以上分析可获结论:对于某一具体的检验来说,当样本量统计推断——假设检验——检验的功效(势)一定时, 统计推断——假设检验——检验的功效(势)越小 统计推断——假设检验——检验的功效(势) 越大,统计推断——假设检验——检验的功效(势)越大 统计推断——假设检验——检验的功效(势)越小。 

三、检验的功效

统计推断——假设检验——检验的功效(势)实际上不成立时,根据统计量的数值拒绝统计推断——假设检验——检验的功效(势), 做对了!这样的概率,称为检验功效(power of test),记为统计推断——假设检验——检验的功效(势)

检验功效的意义:当两个总体参数的确存在差异时,所使用的统计检验能够发现这种差异的概率。 

例 如果统计推断——假设检验——检验的功效(势) =  0.90,则意味着当统计推断——假设检验——检验的功效(势) 实际上不成立时,理论上在每100次检验中,平均有90次能拒绝统计推断——假设检验——检验的功效(势)

单样本设计资料t 检验的功效

例  已知北方地区一般儿童前囟门闭合月龄的均值为14.1,某研究人员从东北某缺钙地区抽取36名儿童,得前囟门闭合月龄均值为14.3,标准差为5.08。问该县儿童前囟门闭合月龄是否大于一般儿童的前囟门闭合月龄? 

分析:根据医学专业知识,缺钙地区不会闭合得更快,但有可能闭合得慢些,故可作单侧检验。

结论:经统计推断——假设检验——检验的功效(势)假设,得统计推断——假设检验——检验的功效(势)=0.236,统计推断——假设检验——检验的功效(势)>0.05,不拒绝统计推断——假设检验——检验的功效(势)。 

但是以上的结论也可能样本量小, 检验的功效不够大导致的,所以我们要计算该检验的功效统计推断——假设检验——检验的功效(势)

功效计算公式

统计推断——假设检验——检验的功效(势)

统计推断——假设检验——检验的功效(势) : 样本量 

统计推断——假设检验——检验的功效(势) : 欲发现的最小差异(或容许误差) 

统计推断——假设检验——检验的功效(势): 总体标准差; 

统计推断——假设检验——检验的功效(势): 标准正态分布的临界值。单侧检验时取单侧临界值; 双侧检验时取双侧临界值

统计推断——假设检验——检验的功效(势): 标准正态分布的单侧临界值(永远是一个单侧的临界值,即标准正态分布上侧尾部面积为统计推断——假设检验——检验的功效(势)所对应的那个临界值)。

算得统计推断——假设检验——检验的功效(势)后,反查标准正态分布表来确定统计推断——假设检验——检验的功效(势),进而得到统计推断——假设检验——检验的功效(势)

根据现有知识,统计推断——假设检验——检验的功效(势)= 0.5月,统计推断——假设检验——检验的功效(势) = 5月,  统计推断——假设检验——检验的功效(势)=1.645 (单侧)

统计推断——假设检验——检验的功效(势)

由标准正态分布表查得统计推断——假设检验——检验的功效(势)= 0.8531,统计推断——假设检验——检验的功效(势)= 0.1469 欲发现统计推断——假设检验——检验的功效(势)= 0.5 月的差别,概率只有 14.69%,检验功太小! 

三、影响检验功效的主要因素 

统计推断——假设检验——检验的功效(势)

1、参数间(两均数统计推断——假设检验——检验的功效(势)统计推断——假设检验——检验的功效(势))差异越大,功效越大 

2、个体差异越小,功效越小 

3、样本量越大,功效越大(样本量小曲线较胖,样本量大曲线较瘦) 

4、统计推断——假设检验——检验的功效(势)越大,功效越大 

在假设检验结果的解释和评价中,特别是分析那些未能拒绝 统计推断——假设检验——检验的功效(势)的假设检验结果,事后估计统计推断——假设检验——检验的功效(势)的值,有助于判断是总体的参数确实没有差别,还是由于样本量太小,而导致检验效能不足,如统计推断——假设检验——检验的功效(势)< 80%。