统计学——小样本容量置信区间
一般来讲,n<30,不能进行好的估计,针对这种情况,给出t distribution对sample mean分布进行修正。
T分布和正态分布相似,具有fatter tail,因为低估了S。对应的,不再去查z table,而是去查t table。T table的列为*度degrees of freedom,即n-1。
有些记法在上面加了个帽子记为,表示这是由样本标准差估算出来的sample mean的standard devication。
例题:7名学生在使用了新研制的钙片3个月后,他们的血液中的钙含量分别上升了1.5, 2.9, 0.9, 3.9, 3.2, 2.1, 1.9。所有使用新钙片的学生的钙含量增加的平均值的95%的置信区间。
分析:首先,我们有一个抽样样本,样本的容量为7,均值为:2.34,无偏方差为1.04。
我们知道,样本的无偏方差可以认为是总体的方差,所以总体的方差为1.04,抽样样本均值的方差即为1.04/7 = 0.149,抽样样本均值的标准差为:0.385.
因为样本小于30,所以样本均值的分布服从t分布,下图是t分布表,我们看双侧,同时需要看*度:(n-1)=6,得到的值为:2.447。所以意味着需要离开均值2.447个标准差的置信区间是95%。
所以本题相当于:
所以总体的真实均值为[2.34-2.447*0.385, 2.34+2.447*0.385],即总体均值在[1.39, 3.28]的置信度为95%