UA MATH566 统计理论7: Multiple Test
Multiple test就是同时做多个假设检验,回归和试验设计都有涉及到,那两个系列用的是Bonferroni方法和WHS方法。这里也介绍一下Bonferroni方法,另外再介绍一个Fisher方法。
Bonferroni调整
假设要同时做m个假设检验,第i个的p值为pi,i=1,⋯,m,第i个检验出现type I error的事件为Ai。定义Family-wise error rate (FWER)表示至少有一个检验出现type I error的概率,αB表示单个检验的显著性水平。假设α为这m个联合检验的显著性水平,根据Bonferroni不等式
α=P(i=1⋃mAi)≤i=1∑mP(Ai)=mαB
因此拒绝第i个检验的原假设的条件可以写为
pi≤mα≤αB
这说明要同时做m个假设检验的话,如果要求的显著性水平为α,那么对单个检验做判断时显著性水平应该用α/m。
注意到Bonferroni不等式在所有的Ai都独立时取等,此时
α=P(i=1⋃mAi)=1−P(i=1⋂mAiC)=1−i=1∏mP(AiC)=1−(1−αB)m
Benjamini-Hochberg方法
当m比较大之后,要拒绝原假设的条件会变得非常苛刻,甚至到几乎不可能的程度。为了得到更合理的推断,Benjamini-Hochberg方法用了比Bonferroni调整更宽松的条件:
假设p(i)是这m个p值的次序统计量,search
k=i=1,2,⋯,m,p(i)≤kmαargmaxi
拒绝这k个p(1),⋯,p(k)对应的原假设。
Fisher方法
Fisher方法比较有意思,第五讲提到了原假设下p值服从均匀分布U[0,1]:
p1,⋯,pm∼iidU[0,1]
根据概率论推导过的结论,它等价于
−2lnp1,⋯,−2lnpm∼iidexp(1/2)
因为m个指数分布exp(1/2)的和是gamma分布Γ(21,m),它其实就是卡方分布χ2(2m)。因此上面的结果可以写成
−2lnp1−⋯−2lnpm∼χ2(2m)
因此m个联合检验的原假设下,可以用−2lnp1−⋯−2lnpm作为检验的统计量构造一个卡方检验。
False Discovery Rate
这里引入false discovery rate的概念,它是p值的一个替代品之一。这里就直接用我老师的ppt截图了
![UA MATH566 统计理论7: Multiple Test UA MATH566 统计理论7: Multiple Test](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzcxMS8xYmI5MzA0MTVkOThjNjk0N2NkZmE0ZWRlYjhiZWQ5Ny5wbmc=)
简单解释一下这张表,首先一共要同时做m个检验,其中有mπ0个检验的原假设是真命题,m(1−π0)个检验的备择假设是真命题。我们拒绝了R个原假设,接受了m−R个原假设。每个检验有四种可能的结果:原假设为真、拒绝原假设;原假设为假,拒绝原假设;原假设为真,接受原假设;原假设为假,接受原假设,符合这四个结果的检验数目分别为V,S,U,T。其中V,T分别是type I error的数目和type II error的数目。
先讨论一下false discovery rate (FDR),ppt里面那个定义的意思就是FDR就是在拒绝原假设的条件下,原假设为真的概率。根据Hierarchical Model,p值服从混合分布
Fpvalue(x)=π0x+(1−π0)ROC(x)
如果选择α作为p值的上限,则
FDR=P[H0 is true∣reject H0]=P[reject H0]P[reject H0∣H0 true]P[H0 true]=Fpvalue(α)απ0
也就是说
FDR=π0α+(1−π0)(1−β)π0α