UA MATH566 统计理论8 用Pivot构造置信区间
上一讲介绍的构造置信区间的方法是根据假设检验导出置信区间,但我们感兴趣的分布不一定有耳熟能详的假设检验,就只能考虑用其他方法。这一讲介绍用Pivot构造置信区间。对于样本
X={X1,⋯,Xn},Xi∈R,定义
Q(X,θ),如果它的分布与参数
θ无关,则
Q被称为pivot。需要注意的是Pivot和辅助统计量是不同的东西,Pivot是下面这样的映射
Q(x,θ):Rn×Θ→Rl
原像空间是样本和参数空间的直积,而辅助统计量只是样本的函数。
例1 Location Family的Pivot
用f(x−θ)表示Location family的密度函数,则
Q(X,θ)=i=1∑nai(Xi−θ)
是pivot,其中ai是常数,所有的ai不能同时为0,比如ai取1/n,那Q(X,θ)=Xˉ−θ。这个构造比较直观,因为Xi−θ的密度函数就是把f(x−θ)向右平移θ,也就是f(x)。
例2 Scale Family的Pivot
用β1f(x/β)表示Scale family的密度函数,则
Q(X,θ)=β∑i=1naiXi
是pivot,其中ai是常数,所有的ai不能同时为0,比如ai取1,那Q(X,θ)=β∑i=1nXi。这个构造也比较直观,因为Xi/β的密度函数就是把f(x/β)沿x轴拉长β倍变成f(x)。
例3 Location-Scale Family的Pivot
用β1f((x−θ)/β)表示Location-Scale family的密度函数,则
Q(X,θ)=β∑i=1nai(Xi−θ)
是pivot,其中ai是常数,所有的ai不能同时为0。同样用函数变换的方式就会发现βXi−θ的密度是f(x)。
用Pivot构造置信区间
假设有一个pivot Q(X,θ),假设存在l,u满足
P(l≤Q(X,θ)≤u)=γ
则C(X)={θ:l≤Q(X,θ)≤u}满足P(θ∈C(X))=γ,根据这个不等式
l≤Q(X,θ)≤u
解出θ的取值范围就是一个γ-level的CI。
例如Q(X,θ)关于θ单调递增,则根据
Q(X,θ^l)=l,Q(X,θ^u)=u
求解出θ^l(X)和θ^u(X),就可以得到置信区间
C^(X)={θ:θ^l(X)≤θ≤θ^u(X)}
例1续 Location Family的置信区间
用Q(X,θ)=Xˉ−θ作为Location family的pivot,显然Q(X,θ)关于θ是单调递减的,因此求解:
Q(X,θ^l)=Xˉ−θ^l=u⇒θ^l=Xˉ−uQ(X,θ^u)=Xˉ−θ^u=l⇒θ^u=Xˉ−l
可以得到置信区间
C^(X)={θ:Xˉ−u≤θ≤Xˉ−l}
其中l,u满足
P(l≤Q(X,θ)≤u)=γ
例4 均匀分布的pivot
因为这个操作太简单了,这里就提一下pivot选取。对于均匀分布U[0,θ],定义
Q(X,θ)=θX(n)=(θX)(n)
也就是说Q(X,θ)的分布与U[0,1]的最后一个次序统计量的分布相同,即FQ(x)=xn,显然Q(X,θ)是一个pivot。
一般性方法
如果不是Location-Scale Family,也没办法一眼找出Pivot出来,可以用下面这个定理。
定理 如果统计量T(X)的分布为FT(t∣θ),假设α1和α2分别是置信区间左侧和右侧的之外的概率,即
P(θ<θ^l)=α1,P(θ>θ^u)=α2
如果α1+α2=1−γ,FT(t∣θ)关于θ递减,定义θ^l和θ^u满足
FT(t∣θ^u(t))=α1,FT(t∣θ^l(t))=1−α2
则[θ^l(T),θ^u(T)]是γ-置信区间。
注:这个定理其实没啥好证的,因为
P{θ∈[θ^l(T),θ^u(T)]}=P{ θ:α1≤FT(T∣θ)≤1−α2}
要推广到递增的情况或者单侧置信区间都比较直接。然后使用这个定理主要的问题就是怎么选统计量T(X),个人建议是不知道挑啥就用充分统计量或者MLE吧,毕竟它们性质那么好不是放在那儿好看的。
例4续 均匀分布的置信区间(这道题我不想打了,直接贴我老师的slides)
最优置信区间
我们总是希望置信区间越短越好,可以写成最优化问题
minE[θ^u−θ^l]s.t.P[θ^l≤θ≤θ^u]≥γ
有一个比较有用的性质,对于有单峰且对称的密度函数的统计量T(X),最优置信区间一定也是对称的。这个性质可以给之前的双边Z检验和t检验提供依据。
证明
假设Θ⊂R,考虑上面那个优化的对偶问题:给定置信区间的长度为c,想要找一个左端点a使得置信区间覆盖的概率最大,即
amaxFT(a+c)−FT(a)
简单求导一下
fT(a+c)−fT(a)=0
因为密度函数单峰且对称,根据这个一阶条件:a和a+c要关于a+2c对称。
置信区间的频率派解释
置信区间的构造靠的是θ^l(X)和θ^u(X)这两个统计量,需要注意的是这两个统计量的表达式是我们在进行试验或者收集数据之前就自然存在的,他们是简单随机样本的函数,是两个随机变量。
一旦我们收集到了数据,相当于就有了一组简单随机样本的realization,这组数据就是确定的数,根据那两个统计量表达式确定出来的置信区间的上界和下界也就是确定的数,置信区间也就是一个确定的区间了。在统计频率派观点中,真实的参数值是确定的数值,因此这个确定的置信区间包含真实参数与否就是包含/不包含这两种确定的结果,包含就是包含,不包含就是不包含,不存在说包含的概率就是置信度。
那么置信度γ应该怎么理解呢?
如果我们重复抽取多组随机样本,每一组都算出一个置信区间,那么当我们抽取的随机样本的组数越来越多的时候,置信区间包含真实参数的频率也就越来越接近γ。这个才是按频率派对置信区间的解读。