二维函数Z=g(X,Y)型，用卷积公式求概率密度，积分区域如何确定（上）

因为关于二维随机变量主题内容重要，难度大，例题多，最主要是积分区间的确定是难点，同时关联卷积概念，求二维函数Z=g(X,Y)型，用卷积公式求概率密度，卷积公式容易，积分区间难以确定，所以分成上中下三篇博客写。

一。问题的引入

有一大群人，令X和Y分别表示一个人的年龄和体重，Z表示该人的血压，并且已知Z与X,Y的关系为 Z=g(X,Y), 如何通过X,Y的分布确定Z的分布？
二维函数Z=g(X,Y)型，用卷积公式求概率密度，积分区域如何确定（上）

二。公式

$F_{z} (z) = P (Z ⩽ z) = \int \int_{g (x, y) ⩽ z} f (x, y) d x d y$

特殊类型：Z=X+Y，怎样确定Z的分布？如何求Z的概率密度？
$f_{z} (z) = \int_{- \infty}^{\infty} f (x, z - x) d x = \int_{- \infty}^{\infty} f (z - y, y) d y$

当X与Y相互独立时，
就得到所谓的 $卷积公式$
$f_{z} (z) = f_{x} * f_{y} = \int_{- \infty}^{\infty} f_{X} (x) f_{Y} (z - x) d x = \int_{- \infty}^{\infty} f_{X} (z - y) f_{Y} (y) d y$
这就是所谓的卷积积分

三。已知f(x,y)，如何计算Z=X+Y型的概率密度 $f_{z} (z)$ 及概率分布 $F_{z} (z)$ ？

根据理解或者根据上面的公式，我们知道 $f_{z} (z)$ 是将f(x,y)求一次积分， $F_{z} (z)$ 是求二次积分，难点问题在于 $如何确定积分区间？需要分成几个区间？$

对于Z=X+Y型的关系，假设对x求一次积分，得到 $f_{z} (z)$
表示成

$f_{z} (z) = \int_{- \infty}^{\infty} f (x, z - x) d x$

，那么我们要画出一个 x–z的坐标，确定积分区间

1）积分区间的左右两边，由x的上下区间决定
假设 x的区间在[a,b]之间, $a ⩽ x ⩽ b$
那么积分的左右边界就是a到b
2）根据关系式
z=x+y，由于坐标系是x–z的关系，那么y就是变常量
z的最小值： $z_{m i n} = x + y_{m i n}$
z的最大值： $z_{m a x} = x + y_{m a x}$
积分的上下边界就是 $z_{m i n}$ 到 $z_{m a x}$

因为我们讨论的f_{z}(z)是按照x积分：
$f_{z} (z) = \int_{- \infty}^{\infty} f (x, z - x) d x$

二维函数Z=g(X,Y)型，用卷积公式求概率密度，积分区域如何确定（上）

所以按照x积分，积分区间就要分成三段：红色区间，蓝色区间，绿色区间

1) $红色区间$ ，
$X_{m i n} + Y_{m i n} ⩽ z < X_{m i n} + Y_{m a x}$
x积分区间= a 到 Z-Ymin
$\int_{a}^{z - y_{m i n}} d x$

2) $蓝色区间$ ，
$X_{m i n} + Y_{m a x} ⩽ z < X_{m a x} + Y_{m i n}$
x积分区间= Z-Ymax 到 Z-Ymin
$\int_{z - y_{m a x}}^{z - y_{m i n}} d x$

3) $绿色区间$ ，
$X_{m a x} + Y_{m i n} ⩽ z < X_{m a x} + Y_{m a x}$

x积分区间= Z-Ymax 到 1
$\int_{z - y_{m a x}}^{b} d x$

当x的a,b左右对称时，中间蓝色区间没有，只有两个积分区间：
$红色区间$ 和 $绿色区间$

=========================
【例一】设(X,Y)的联合密度函数为

f (x, y) = {\begin{cases} e^{- y}, 0 ⩽ x ⩽ 1, y ⩾ 0, \\ 0, o t h e r s \end{cases}

(1)问X,Y是否独立？
(2)求Z=2X+Y的密度函数

f_{z} (z)

和分布函数

F_{z} (z)

(3)求P{Z>3}

【解】
(1) 问X,Y是否独立？
X,Y独立的条件 $f (x, y) = f_{x} (x) * f_{y} (y)$
$f_{X} (x) = \int_{- \infty}^{\infty} f (x, y) d y$
$f_{X} (x) = \int_{0}^{\infty} e^{- y} d y = - e^{- y} |_{0}^{\infty} = e^{- y} |_{\infty}^{0} = 1$

$f_{Y} (y) = \int_{- \infty}^{\infty} f (x, y) d x$
$f_{Y} (y) = \int_{0}^{\infty} e^{- y} d x = \int_{0}^{1} e^{- y} d x = e^{- y} * (x) |_{0}^{1} = e^{- y}$
所以 $f (x, y) = f_{X} (x) * f_{Y} (y)$

(2)求Z=2X+Y的密度函数 $f_{z} (z)$ 和分布函数 $F_{z} (z)$

(2.1)先求密度函数 $f_{z} (z)$

Z=g(X,Y)=2X+Y

求 $f_{z} (z)$ 可以利用卷积公式
$f_{Z} (z) = \int_{- \infty}^{\infty} f (x, z - x) d x$

画一个 x-z 的坐标系

Z方向下限：
$Z_{m i n} = g (X, Y_{m i n}) = 2 X + Y_{m i n}$ = 2X+0

Z方向上限：
$Z_{m i n} = g (X, Y_{m i n}) = 2 X + Y_{m a x} = 2 X + \infty = \infty$
二维函数Z=g(X,Y)型，用卷积公式求概率密度，积分区域如何确定（上）

所以，对公式 $f_{Z} (z) = \int_{- \infty}^{\infty} f (x, z - x) d x$

当 $0 ⩽ z < 2 : 0 ⩽ x < \frac{z}{2}$
$f_{Z} (z) = \int_{0}^{\frac{z}{2}} f (x, z - x) d x = \int_{0}^{\frac{z}{2}} e^{- (z - 2 x)} d x$
$\int_{0}^{\frac{z}{2}} e^{2 x - z} d x (设 t = 2 x - z, d t = 2 d x)$
= $\frac{1}{2} e^{2 x - z} |_{0}^{\frac{z}{2}}$
= $\frac{1}{2} (1 - e^{- z})$

当 $2 ⩽ z < \infty : 0 ⩽ x ⩽ 1$
$f_{Z} (z) = \int_{0}^{1} f (x, z - x) d x = \int_{0}^{1} e^{- (z - 2 x)} d x$
$\int_{0}^{1} e^{2 x - z} d x (设 t = 2 x - z, d t = 2 d x)$
= $\frac{1}{2} e^{2 x - z} |_{0}^{1}$
= $\frac{1}{2} (e^{2} - 1) e^{- z}$

所以

f_{Z} (z) = {\begin{cases} 0, z < 0, \\ \frac{1}{2} (1 - e^{- z}), 0 ⩽ z ⩽ 2, \\ \frac{1}{2} (e^{2} - 1) e^{- z}, z > 2 \end{cases}

(2.2) 求分布函数 $F_{z} (z)$

由分布函数 $F_{z} (z)$ 的定义可以知道，就是对z再积分
$F_{z} (z)$ 与相应的概率密度函数 $f_{Z} (z)$ 的积分区间的关系是怎样呢？
概率密度函数 $f_{Z} (z)$ 是对横坐标x积分，分布函数 $F_{z} (z)$ 是对纵坐标z进行积分。通过z进行分区段， $F_{z} (z)$ 与 $f_{z} (z)$ 是一样的，但是 $F_{z} (z)$ 是把 $f_{z} (z)$ 再次对z求积分，z的上下限的取值与z的分段不完全一样。

$对 z 积分上下限取值原则： z 的取值一直是从小到大方向，下限固定，上限活动，上限就是 z$

$F_{Z} (z) = \int_{- \infty}^{\infty} f_{Z} (z) d z$
根据 $f_{Z} (z)$ 的分段，分段再积分
所以，
z<0 时，F_{Z}(z)=0
当 $0 ⩽ z < 2$ : z的积分区间： $下限固定，下限是 0 ，上限活动，上限是 z$ ，所以就是在 $0 ⩽ z < z$
$F_{Z} (z) = \int_{0}^{z} f_{Z} (z) d z = \int_{0}^{z} \frac{1}{2} (1 - e^{- z}) d z$
= $\frac{1}{2} (z + e^{- z}) |_{0}^{z} = \frac{1}{2} (z - 1 + e^{- z})$

当 $2 ⩽ z < \infty$ : 注意分布函数与密度函数的区别，分布函数是对z的累加， $要把前面的所有区间全部累加起来$
当 $2 ⩽ z < \infty$ ：z的积分区间为前面一段区间： 0到2，再加上当前区间， $下限固定，下限就是 2 ，上限活动，上限就是 z$

$F_{Z} (z) = \int_{0}^{2} f_{Z} (z) d z + \int_{2}^{z} f_{Z} (z) d z =$
$= \int_{0}^{2} \frac{1}{2} (1 - e^{- z}) d z + \int_{2}^{z} \frac{1}{2} (e^{2} - 1) e^{- z} d z$
$= 1 + \frac{1}{2} (1 - e^{2}) e^{- z}$

所以

F_{Z} (z) = {\begin{cases} 0, z < 0 \\ \frac{1}{2} (z - 1 + e^{- z}), 0 ⩽ z < 2 \\ 1 + \frac{1}{2} (1 - e^{2}) e^{- z}, z ⩾ 2 \end{cases}

(3)求P{Z>3}

求P(f(Z))总是跟分布函数 $F_{Z} (z)$ 联系在一起的。根据概率分布函数的定义 $F_{Z} (z)$ 指的是从 $- \infty$ 到当前z的累加，运算值和查表值都只是 $- \infty$ 到某个当前z值得积分，即，积分的结果表示的是 $P (Z ⩽ z)$ 的值

所以
$P (Z > 3) = 1 - P (Z ⩽ 3) = 1 - F_{Z} (z) (z = 3)$

根据上面的积分结果
$F_{Z} (3) = (1 + \frac{1}{2} (1 - e^{2}) e^{- z}) |_{z = 3}$

$P (Z > 3) = 1 - (1 + \frac{1}{2} (1 - e^{2})) e^{- 3}$
$= \frac{1}{2} (e^{2} - 1) e^{- 3} \approx 0.1591$

参考书目：

张天德，叶宏《星火燎原·概率论与数理统计辅导及习题精解》（浙大·第4版）第三章

二维函数Z=g(X,Y)型，用卷积公式求概率密度，积分区域如何确定（上）