《统计推断第二版》笔记——区间估计

区间估计

9.1 引言

前面讨论过参数θ\theta的点估计,那里的推断是猜测一个单个值作为θ\theta的值,这一章我们讨论区间估计及更一般的集合估计。

集合估计问题中的推断就是陈述 θC\theta\in C,其中CΘC\subset\Theta并且C=C(X)C=C(\mathbf X)是一个由观测数据X=x\mathbf X=\mathbf x的值决定的集合。

定义9.1.1 一个实值参数θ\theta的区间估计是样本的任意一堆函数L(x1,,xn)L(x_1, \cdots,x_n)U(x1,,xn)U(x_1,\cdots, x_n),对于所有的xX\mathbf x \in \mathcal X满足L(x)U(x)L(\mathbf x)\leqslant U(\mathbf x). 如果观测到样本X=x\mathbf X=\mathbf x,就做出推断L(x)θU(x)L(\mathbf x)\leqslant \theta\leqslant U(\mathbf x). 随机区间[L(x),U(x)][L(\mathbf x), U(\mathbf x)]叫做区间估计量。

《统计推断第二版》笔记——区间估计
使用区间估计而不使用点估计,目的在于对于捕获感兴趣的参数有某种保证。这个保证的确定是用以下定义量化的。

定义9.1.4 对于一个对参数θ\theta的区间估计量[L(x),U(x)][L(\mathbf x), U(\mathbf x)][L(x),U(x)][L(\mathbf x), U(\mathbf x)]的覆盖概率是指随机区间[L(x),U(x)][L(\mathbf x), U(\mathbf x)]覆盖真实参数θ\theta的概率。在符号上记作Pθ  (θ[L(x),U(x)])P_{\theta}\ \ (\theta\in [L(\mathbf x), U(\mathbf x)]).

定义9.1.5 对于一个参数θ\theta的区间估计量[L(x),U(x)][L(\mathbf x), U(\mathbf x)][L(x),U(x)][L(\mathbf x), U(\mathbf x)]的置信系数是指覆盖概率的下确界infθ Pθ  (θ[L(x),U(x)])inf_{\theta}\ P_{\theta} \ \ (\theta\in [L(\mathbf x), U(\mathbf x)])

因为我们不知道θ\theta的真实值,所以我们只能保证一个覆盖概率的下确界,即置信系数。在某些情况这并不紧要,因为覆盖概率是θ\theta的一个常数函数。而某些情况,覆盖概率可能随θ\theta不同而有很大变化。
《统计推断第二版》笔记——区间估计
《统计推断第二版》笔记——区间估计