二维函数Z=g(X,Y)型,用卷积公式求概率密度,积分区域如何确定(上)
因为关于二维随机变量主题内容重要,难度大,例题多,最主要是积分区间的确定是难点,同时关联卷积概念,求二维函数Z=g(X,Y)型,用卷积公式求概率密度,卷积公式容易,积分区间难以确定,所以分成上中下三篇博客写。
一。问题的引入
有一大群人,令X和Y分别表示一个人的年龄和体重,Z表示该人的血压,并且已知Z与X,Y的关系为 Z=g(X,Y), 如何通过X,Y的分布确定Z的分布?
二。公式
Fz(z)=P(Z⩽z)=∫∫g(x,y)⩽zf(x,y)dxdy
特殊类型:Z=X+Y,怎样确定Z的分布?如何求Z的概率密度?
fz(z)=∫∞−∞f(x,z−x)dx=∫∞−∞f(z−y,y)dy
当X与Y相互独立时,
就得到所谓的卷积公式
fz(z)=fx∗fy=∫∞−∞fX(x)fY(z−x)dx=∫∞−∞fX(z−y)fY(y)dy
这就是所谓的卷积积分
三。已知f(x,y),如何计算Z=X+Y型的概率密度fz(z) 及概率分布 Fz(z)?
根据理解或者根据上面的公式,我们知道 fz(z) 是将f(x,y)求一次积分,Fz(z)是求二次积分,难点问题在于如何确定积分区间?需要分成几个区间?
对于Z=X+Y型的关系,假设对x求一次积分,得到fz(z)
表示成
fz(z)=∫∞−∞f(x,z−x)dx
,那么我们要画出一个 x–z的坐标,确定积分区间
1)积分区间的左右两边,由x的上下区间决定
假设 x的区间在[a,b]之间, a⩽x⩽b
那么积分的左右边界就是a到b
2)根据关系式
z=x+y, 由于坐标系是x–z的关系,那么y就是变常量
z的最小值:zmin=x+ymin
z的最大值:zmax=x+ymax
积分的上下边界就是 zmin到 zmax
因为我们讨论的f_{z}(z)是按照x积分:
fz(z)=∫∞−∞f(x,z−x)dx
所以按照x积分,积分区间就要分成三段:红色区间,蓝色区间,绿色区间
1)红色区间,
Xmin+Ymin⩽z<Xmin+Ymax
x积分区间= a 到 Z-Ymin
∫z−yminadx
2)蓝色区间,
Xmin+Ymax⩽z<Xmax+Ymin
x积分区间= Z-Ymax 到 Z-Ymin
∫z−yminz−ymaxdx
3)绿色区间,
Xmax+Ymin⩽z<Xmax+Ymax
x积分区间= Z-Ymax 到 1
∫bz−ymaxdx
当x的a,b左右对称时,中间蓝色区间没有,只有两个积分区间:
红色区间和 绿色区间
=========================
【例一】设(X,Y)的联合密度函数为
f(x,y)={ e−y,0⩽x⩽1,y⩾0, 0,others
(1)问X,Y是否独立?
(2)求Z=2X+Y的密度函数
fz(z)和分布函数
Fz(z)
(3)求P{Z>3}
【解】
(1) 问X,Y是否独立?
X,Y独立的条件 f(x,y)=fx(x)∗fy(y)
fX(x)=∫∞−∞f(x,y)dy
fX(x)=∫∞0e−ydy=−e−y|∞0=e−y|0∞=1
fY(y)=∫∞−∞f(x,y)dx
fY(y)=∫∞0e−ydx=∫10e−ydx=e−y∗(x)|10=e−y
所以 f(x,y)=fX(x)∗fY(y)
(2)求Z=2X+Y的密度函数fz(z)和分布函数Fz(z)
(2.1)先求密度函数fz(z)
Z=g(X,Y)=2X+Y
求fz(z)可以利用卷积公式
fZ(z)=∫∞−∞f(x,z−x)dx
画一个 x-z 的坐标系
Z方向下限:
Zmin=g(X,Ymin)=2X+Ymin = 2X+0
Z方向上限:
Zmin=g(X,Ymin)=2X+Ymax=2X+∞=∞
所以,对公式 fZ(z)=∫∞−∞f(x,z−x)dx
当 0⩽z<2:0⩽x<z2
fZ(z)=∫z20f(x,z−x)dx=∫z20e−(z−2x)dx
∫z20e2x−zdx(设t=2x−z,dt=2dx)
=12e2x−z|z20
=12(1−e−z)
当 2⩽z<∞:0⩽x⩽1
fZ(z)=∫10f(x,z−x)dx=∫10e−(z−2x)dx
∫10e2x−zdx(设t=2x−z,dt=2dx)
=12e2x−z|10
=12(e2−1)e−z
所以
fZ(z)=⎧⎩⎨⎪⎪ 0,z<0, 12(1−e−z),0⩽z⩽2, 12(e2−1)e−z,z>2
(2.2) 求分布函数Fz(z)
由分布函数Fz(z)的定义可以知道,就是对z再积分
Fz(z)与相应的概率密度函数fZ(z)的积分区间的关系是怎样呢?
概率密度函数fZ(z)是对横坐标x积分,分布函数Fz(z)是对纵坐标z进行积分。通过z进行分区段,Fz(z)与fz(z)是一样的,但是Fz(z)是把fz(z)再次对z求积分,z的上下限的取值与z的分段不完全一样。
对z积分上下限取值原则:z的取值一直是从小到大方向,下限固定,上限活动,上限就是z
FZ(z)=∫∞−∞fZ(z)dz
根据fZ(z)的分段,分段再积分
所以,
z<0 时,F_{Z}(z)=0
当 0⩽z<2 : z的积分区间:下限固定,下限是0,上限活动,上限是z,所以就是 在0⩽z<z
FZ(z)=∫z0fZ(z)dz=∫z012(1−e−z)dz
=12(z+e−z)|z0=12(z−1+e−z)
当 2⩽z<∞ : 注意分布函数与密度函数的区别,分布函数是对z的累加,要把前面的所有区间全部累加起来
当 2⩽z<∞:z的积分区间为前面一段区间: 0到2,再加上当前区间,下限固定,下限就是2,上限活动,上限就是z
FZ(z)=∫20fZ(z)dz+∫z2fZ(z)dz=
=∫2012(1−e−z)dz+∫z212(e2−1)e−zdz
=1+12(1−e2)e−z
所以
FZ(z)=⎧⎩⎨⎪⎪ 0,z<0 12(z−1+e−z),0⩽z<2 1+12(1−e2)e−z,z⩾2
(3)求P{Z>3}
求P(f(Z))总是跟分布函数FZ(z)联系在一起的。根据概率分布函数的定义 FZ(z)指的是从−∞到当前z的累加,运算值和查表值都只是 −∞到某个当前z值得积分,即,积分的结果表示的是 P(Z⩽z)的值
所以
P(Z>3)=1−P(Z⩽3)=1−FZ(z)(z=3)
根据上面的积分结果
FZ(3)=(1+12(1−e2)e−z)|z=3
P(Z>3)=1−(1+12(1−e2))e−3
=12(e2−1)e−3≈0.1591
参考书目:
张天德,叶宏 《星火燎原·概率论与数理统计辅导及习题精解》(浙大·第4版)第三章