抽样分布
一、统计量
样本均值:即在总体中的样本数据的均值,反映样本数据的集中趋势。
样本方差:每个样本值与全体样本值平均数之差的平方值的平均数;方差是用来衡量随机变量和其数学期望(均值)之间的偏离程度。
样本变异系数:变异系数又称为离散系数,定义为标准差与平均值之比,样本变异系数即样本数据的标准差与其均值之比。
样本k阶中心矩:在概率论中,矩是用来描述随机变量的某些特征的数字,即求平均值;随机变量X的K阶中心矩定义:对于正整数k,如果E(X)存在,
E[(X-E(X))^K] <无穷大,
则 E[(X-E(X))^K] 为x的k阶中心矩。
样本偏度:常用作总体偏度的估计量和检验总体分布正态性的统计量,样本三阶中心距除以二阶中心距的3/2次幂的商记为SK;而总体偏度是一个描述总体分布不对称性的数字特征,正态分布的偏度为0。
样本峰度:常用以作为总体峰度的估计量,样本的四阶中心距除以样本二阶中心距平方的商再减去3,记为ku;正态分布的峰度为0。
二、抽样分布
1、卡方分布(x^2分布)
定义
设随机变量X1,X2,..Xn相互独立,且Xi(i=1,2,......,n)服从标准正态分布,则他们的平方和 服从自由度为n的X^2分布
这是统计学书籍的介绍不是很理解,但是通过下述公式描述就比较好理解了
X~N(μ, )
由上述可知,卡方分布是由标准正态分布平方之和构成
当总体 X~N(μ, ),从中抽取容量n的样本则
特性
数学期望
方差
=2n
可加性,即若
2、t分布
定义
设随机变量 X~N(0,1 ),Y~X^2(n),且X与Y独立,则
其分布称为t分布,记为t(n),其中,n为自由度。
当n>=2,t分布的数学期望E(t)=0
当n>=3,t分布的方差D(t)=n/n-2
自由度为1的分布称为柯西分布,随着自由度n的增加,t分布的密度函数越来越接近标准正态分布的密度函数,一般n>=30,t分布就与标准正态分布非常接近
t分布有关的抽样分布
设X1,X2,...Xn是来自正态分布 X~N(μ, )的一个样本,
则有
称为服从自由度为(n-1)的t分布
F分布
定义
设随机变量Y与Z互相独立,且Y和Z分别服从自由度为m和n的X^2分布(卡方分布),随机变量X有如下表达式
则称X服从第一自由度为m,第二自由度为n的F分布,记为F(m, n),简记为X~F(m, n)
数学期望
E(X)=n/n-2 ,n>2
方差
D(X)=2n^2(m+n-2)/m(n-2)(n-4), n>4
中心极限定理:即不论总体服从什么分布,只要从总体中抽取的样本容量足够大,这些样本组成的样本均值的抽样分布都近似于正态分布。
样本方差的分布:作为随机变量的函数,样本方差本身就是一个随机变量,S^2服从卡方分布,
转载于:https://my.oschina.net/u/1785519/blog/1060322