本篇博文我们讲介绍伽玛(Γ),卡方(χ2)与贝塔(β)分布。在高等微积分中已经证明过,对于α>0,积分
∫∞0yα−1e−ydy
存在且积分值为正数,这个积分称为α的伽玛函数,写成
Γ(α)=∫∞0yα−1e−ydy
如果α=1,显然
Γ(1)=∫∞0e−ydy=1
如果α>1,用分部积分法可得
Γ(α)=(α−1)∫∞0yα−2e−ydy=(α−1)Γ(α−1)
因此如果α是比1大的正整数,那么
Γ(α)=(α−1)(α−2)⋯(3)(2)(1)Γ(1)=(α−1)!
因为Γ(1)=1,这表明我们可以取0!=1。
我们用积分形式定义了Γ(α),现在我们引入新变量y=x/β,其中β>0,那么
Γ(α)=∫∞0(xβ)α−1ex/β(1β)dx
或者等价的
1=∫∞01Γ(α)βαxα−1e−x/βdx
因为α>0,β>0,Γ(α)>0,所以
f(x)={1Γ(α)βαxα−1e−x/β00<x<∞elsewhere
是连续型随机变量的pdf,有这种pdf形式的随机变量X满足参数为α,β的伽玛分布,写作X满足Γ(α,β)分布。
注1:伽玛分布是等待时间的概率模型;例如在寿命测试中,直到死亡的等待时间是用伽玛分布建模的随机变量。为了理解这个,假设泊松假定以及区间长度w是时间区间,特别地令随机变量W是得到k变化量所需要的时间,其中k是固定的正整数,那么W的cdf为
G(w)=P(W≤w)=1−P(W>w)
然而对于w>0,事件W>w等价于时间区间w内少于k变化量的概率,即如果随机变量X是区间w内的变化量,那么
P(W>w)=∑x=0k−1P(X=x)=∑x=0k−1(λw)xe−λwx!
读者需要证明
∫∞λwzk−1e−z(k−1)!dx=∑x=0k−1(λw)xe−λwx!
如果我们接受这个结论,那么对w>0我们有
G(w)=1−∫∞λwzk−1e−zΓ(k)dz=∫λw0zk−1e−zΓ(k)dz
且对于w≤0,G(w)=0。如果我们改变积分变量,将z=λy代入的
G(w)=∫w0λkyk−1e−λyΓ(k)dy,w>0
且对于w≤0,G(w)=0。所以W的pdf为
g(w)=G′(w)={λkyk−1e−λyΓ(k)00<w<∞elsewhere
即W满足α=k,β=1/λ的伽玛分布,如果W是第一次变化的等待时间,即k=1,那么W的pdf为
g(w)={λe−λw00<w<∞elsewhere
W满足参数为λ的指数分布。
接下来计算伽玛分布的mgf。因为
M(t)=∫∞0etx1Γ(α)βαxα−1e−x/βdx=∫∞01Γ(α)βαxα−1e−x(1−βt)/βdx
我们可以令y=x(1−βt)/β,t<1/β或者x=βy/(1−βt) 得到
M(t)=∫∞0β/(1−βt)Γ(α)βα(βy1−βt)α−1e−ydy
即
M(t)=(11−βt)α∫∞01Γ(α)yα−1e−ydy=1(1−βt)α,t<1β
现在
M′(t)=(−α)(1−βt)−α−1(−β)
且
M″(t)=(−α)(−α−1)(1−βt)−α−2(−β)2
因此对于伽玛分布我们有
μ=M′(0)=αβ
且
σ2=M″(0)−μ2=α(α+1)β2−α2β2=αβ2
例1:令等待时间W满足α=k,β=1/λ的伽玛pdf,那么E(W)=k/λ。如果k=1,那么E(W)=1/λ;即对于k=1变化的期望等待时间等于λ的倒数。
例2:令X表示随机变量,使得
E(Xm)=(m+3)!3!3m,m=1,2,3,…
那么X的mgf为级数
M(t)=1+4!33!1!t+5!323!2!t2+6!333!3!t3+⋯
然而这是(1−3t)−4的麦克劳林级数,假设−1<3t<1。因此X满足α=4,β=3的伽玛分布。
注2:伽玛分布不仅是等待时间的模型,也是许多非负连续型随机变量的模型。例如某些收入的分布可以用伽玛分布来建模,这是因为α,β提供了很大的灵活性,图1给出了几个伽玛概率密度函数。
图1
现在我们考虑伽玛分布的一个特例,即α=r/2,其中r是一个正数且β=2。对于一个连续型的随机变量,其pdf为
f(x)={1Γ(r/2)2r/2xr/2−1e−x/200<x<∞elsewhere
且mgf为
M(t)=(1−2t)−r/2,t<12
那么称该变量满足卡方分布,任意这种形式的f(x)称为卡方pdf,卡方分布的均值与方差分别为μ=αβ=(r/2)2=r,σ2=αβ2=(r/2)22=2r,我们称参数r为卡方分布的*度。因为卡方分布在统计中扮演着重要角色且经常出现,所以为了简洁X是χ2意味着随机变量X满足*度为r的卡方分布。
例3:如果X满足pdf
f(x)={14xe−x/200<x<∞elsewhere
那么X是χ2(4),这里μ=4,σ2=8,M(t)=(1−2t)−2,t<12。
例4:如果X有mgfM(t)=(1−2t)−8,t<12,那么X是χ2(16)。
如果随机变量X是χ2(r),那么c1<c2时我们有
P(c1<X<c2)=P(X≤c2)−P(X≤c1)
这是因为P(X=c2)=0。为了计算概率,我们需要像
P(X≤x)=∫x01Γ(r/2)2r/2wr/2−1e−w/2dw
这样的值,这些值有表可供查询。
下面的结论之后还会用几次;因此我们用定理的形式给出。
定理1:令X满足χ2(r)分布,如果k>−r/2,那么E(Xk)存在且等于
E(Xk)=2kΓ(r2+k)Γ(r2),if k>−r/2
证明:注意
E(Xk)=∫∞01Γ(r2)2r/2x(r/2)+k−1e−x/2dx
变量替换u=x/2可得
E(Xk)=∫∞01Γ(r2)2r/2−12(r/2)+k−1u(r/2)+k−1e−udu
这就是要求的揭露。||
注意如果k是一个非负整数,那么k>−(r/2)总是为真,因此χ2分布的所有矩存在且k阶矩如定理所示。
例5:令X是χ2(10),那么通过查表可得,
P(3.25≤X≤20.5)=P(X≤20.5)−P(X≤3.5)=0.975−0.025=0.95
如果P(a<X)=0.05,那么P(X≤a)=0.95,通过查表可得a=18.3。
例6:令X满足α=r/2的伽玛分布,其中r是正整数且β>0。定义随机变量Y=2X/β,我们要求Y的pdf。现在Y的cdf为
G(y)=P(Y≤y)=P(X≤βy2)
如果y≤0,那么G(y)=0;但是如果y>0,那么
G(y)=∫βy/201Γ(r/2)βr/2xr/2−1e−x/βdx
因此Y的pdf为
g(y)=G′(y)=β/2Γ(r/2)βr/2(βy/2)r/2−1e−y/2=1Γ(r/2)2r/2yr/2−1e−y/2
即Y是χ2(r)。
伽玛分布最重要的一条性质是其加性。
定理2:令X1,…,Xn是独立随机变量,假设对于i=1,…,n,Xi满足Γ(αi,β)分布,令Y=Σni=1Xi,那么Y满足Γ(Σni=1αiβ)分布。
证明:利用独立性与伽玛分布的mgf,对于t<1/β我们有
MY(t)=E[exp{t∑i=1nXi}]=∏i=1nE[exp{tXi}]=∏i=1n(1−βt)−αi=(1−βt)−Σni=1αi
这就是Γ(Σni=1αi,β)分布的mgf。||
之后我们会用到χ2分布的一个性质,为了方便我们将结论以推论的形式给出,因为β=2,Σαi=Σri/2。
推论1:令X1,…,Xn是独立随机变量,对于i=1,…,n,假设Xi满足χ2(ri)分布,令Y=Σni=1Xi,那么Y满足χ2(Σni=1ri)分布。
最后在介绍一个重要的分布,即贝塔分布,它是由一对独立的Γ随机变量推导来的。令X1,X2是满足Γ分布的两个独立随机变量,其联合pdf为
h(x1,x2)=1Γ(α)Γ(β)xα−11xβ−12e−x1−x2,0<x1<∞,0<x2<∞
其余地方为零,其中α>0,β>0。令Y1=X1+X2且Y2=X1/(X1+X2),我们将说明Y1,Y2是独立的。
空间是x1x2平面的第一象限,排除坐标轴上的点。那么
y1=u1(x1,x2)=x1+x2y2=u2(x1,x2)=x1x1+x2
可以写成x1=y1y2,x2=y1(1−y2),所以
J=∣∣∣y21−y2y1−y1∣∣∣=−y1≢0
这个变换时一对一的且将映射到y1y2平面上的={(y1,y2):0<y1<∞,0<y2<1},那么Y1,Y2的联合pdf为
g(y1,y2)=(y1)1Γ(α)Γ(β)(y1y2)α−1[y1(1−y2)]β−1e−y1={yα−12(1−y2)β−1Γ(α)Γ(β)yα+β−11e−y100<y1<∞,0<y2<1elsewhere
所以他们是独立的随机变量。Y2的边缘pdf为
g2(y2)=yα−12(1−y2)β−1Γ(α)Γ(β)∫∞0yα+β−11e−y1={Γ(α+β)Γ(α)Γ(β)yα−12(1−y2)β−100<y2<1elsewhere0<y1<∞dy1
这个pdf就是参数为α,β的贝塔分布。因为g(y1,y2)≡g1(y1)g2(y2),所以Y1的pdf一定为
g1(y1)={1Γ(α+β)yα+β−11e−y100<y1<∞elsewhere
这是参数值为α+β,1的伽玛分布。
很容易得出参数为α,β的贝塔分布其均值与方差分别为
μ=αα+β,σ2=αβ(α+β+1)(α+β)2
最后这个例子中随机变量的分布是由伽玛随机变量变换推导出来的。
例7:(狄利克雷函分布)令X1,X2,…,Xk+1是独立随机变量,每个都满足β=1的伽玛分布,这些变量的联合pdf可能写成
h(x1,x2,…,xk+1)={∏k+1i=11Γ(αi)xαi−1ie−xi00<xi<∞elsewhere
令
Yi=XiX1+X2+⋯+Xk+1,i=1,2,…,k
且Yk+1=X1+X2+⋯+Xk+1表示k+1个新变量,相关变换将={(x1,…,xk+1):0<xi<∞,i=1,…,k+1} 映射到空间
={(y1,…,yk,yk+1):0<yi,i=1,…,k,y1+⋯+yk<1,0<yk+1<∞}
单值逆函数是x1=y1yk+1,…,xk=ykyk+1,xk+1=yk+1(1−y1−⋯−yk),使得雅克比为
J=∣∣∣∣∣∣∣∣∣yk+10⋮0−yk+10yk+1⋮0−yk+1⋯⋯⋯⋯00⋮yk+1−yk+1y1y2⋮yk(1−y1−⋯−yk)∣∣∣∣∣∣∣∣∣=ykk+1
因此Y1,…,Yk,Yk+1的联合pdf为
yα1+⋯+αk+1−1k+1yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1e−yk+1Γ(α1)⋯Γ(αk)Γ(αk+1)
其余地方为零,这里(y1,…,yk,yk+1)∈。Y1,…,Yk 的联合pdf为
g(y1,…,yk)=Γ(α1+⋯+αk+1)Γ(α1)⋯Γ(αk+1)yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1
0<yi,i=1,…,k,y1+⋯+yk<1,函数g在其他地方等于零。有这种联合pdf形式的随机变量Y1,…,Yk 有狄利克雷pdf,而且从Y1,…,Yk,Yk+1的联合pdf 可以看出Yk+1满足参数为α1+⋯+αk+αk+1,β=1的伽玛分布,Yk+1与Y1,Y2,…,Yk无关。