概率论复习笔记(二)随机变量及其分布

基本概念

随机变量

随机变量 : 设随机试验EE的样本空间为Ω\Omega, 如果对于Ω\Omega内的每一个样本点ee都有一个实数x 与之对应, 则称XX为随机变量, 记为 X=X(e).X= X(e).

简言之, 随机变量就是定义在样本空间Ω\Omega上的样本点 e 的实值单值函数X(e).X(e).我们一般用大写字母如XYZ,X,Y,Z,\dots表示随机变量 。

随机变量的分类 :
{{ 随机变量 \begin{cases} 离散型 \\ 非离散型 \begin{cases} 连续型 \\ 其他 \end{cases} \end{cases}

不要误以为 , 一个随机变量如果不是离散型就是连续型的.实际上还存在非离散非连续型的 。

随机变量的取值是有概率规律的, 这种概率规律叫做随机变量的概率分布.在概率分布的描述上,离散型随机变量和连续型随机变量所采用的方法是不同的.前者主要采用列举法, 后者主要采用积分法.

离散型随机变量

离散型随机变量

若随机变量XX的全部可能取值是有限个或可列个, 则称XX为离散型随机变量.

分布律

离散型随机变量XX所有可能取值为xk(k=1,2,),x_k(k=1,2,\cdots), 事件{X=xk}\{X=x_k\}的概率为P{X=xk}=pk(k=1,2,),P\{X=x_k\}=p_k(k=1,2,\cdots),这里有0pk1,0\leq p_k\leq 1,并且kpk=1\sum_kp_k=1则 称 P{X=xk}=pk(k=1,2,)P\{X=x_k\}=p_k(k=1,2,\cdots)XX的分布律或分布列。

分布律也可以写成表格形式:

XX x1x_1 x2x_2 \cdots xkx_k \cdots
PP p1p_1 p2p_2 \cdots pkp_k \cdots

性质

离散型随机变量 x的分布律的性质:

  1. P{X=xk}=pk0(k=1,2,)P\{X=x_k\}=p_k\geq0(k=1,2,\cdots)
  2. kP{X=xk}=kpk=1\sum_kP\{X=x_k\}=\sum_kp_k=1

几个重要的离散型随机变量

(0—1) 分布

设随机变量 X只可能取 0 与1 两个值, 它的分布律是 P{X=k}=pk(1p)1k,k=0,1,0<p<1P\{X=k\}=p^k(1-p)^{1-k},k=0,1,0<p<1

XX 0 1
pkp_k 1p1-p pp

(0 — 1) 分布是经常遇到的一种分布, 用来描述只有两种对应结果的伯努利试验( 如成功与失败, 合格与不合格, 出现与不出现等).这些时候我们可以定义一个服从(0 — 1) 分布的随机变量:
X={0,A1,A X= \begin{cases} 0,A不发生\\ 1,A发生 \end{cases}

二项分布

伯努利试验

设试验EE只有两种可能结果,A 及A\overline{A}, 则EE称为伯努利试验.若将试验EE独立地重复进行nn次, 则称这个试验为nn重伯努利试验.

二项分布

nn重伯努利试验中,若P(A)=pP(A)=1p.P(A)= p,P(\overline{A})= 1—p.记X为nn次试验中事件A 发生的次数,显然XX是一个随机变量, 它的取值为$ 0,1,2,\dots,n.$它的分布律为
P{X=k}=Cnkpk(1p)nkk=012,n, P\{X = k\}= C^k_np^k(1 —p)^{n-k} ,k = 0,1, 2, \dots,n,
称 X服从参数为n,pn,p的二项分布,记为
XB(n,p) X\sim B(n,p)

二项分布与(0 — 1)分布有着密切关系
  1. 在二项分布中, 若n=1,n=1, 二项分布就变成 (0 — 1) 分布;

  2. nn次伯努利试验中, 若只考虑某一次试验,比如第ii次试验, 可定义随机变量XiX_i如下:
    Xi={1,Ai0,Ai,i=1,2,,n, X_i= \begin{cases} 1,当A_i发生时\\ 0,当\overline{A_i}发生时 \end{cases},i=1,2,\cdots,n,

    XiX_i服从( 0 — 1) 分 布. 对前面的XX,显然有X=i=1nXi.X=\sum_{i=1}^{n}X_i.XX服从二项分布.所以说:nn个服从(0-1)分布的且相互独立的随机变量XiX_i的和服从二项分布.

泊松分布

泊松分布的定义

对于常数λ>0\lambda>0,如果随机变量 XX的分布律为
P{X=k}=λkekk!,k=0,1,2,, P\{X=k\}=\frac {\lambda^ke^k}{k!},k=0,1,2,\cdots,
则称XX服从参数为 A 的泊松分布, 记为XB(λ)X\sim B(\lambda).

泊松定理

设有XB(n,pn)X\sim B(n,p_n)和常数λ>0,\lambda> 0,如果npn=λ,np_n=\lambda,
limnCnkpnk(1pn)nk=λkeλk!,k=0,1,2,. \lim_{n\to \infty} C^k_np^k_n(1-p_n)^{n-k}=\frac {\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots.

①泊松定理说明,当nn\to \infty时,二项分布的极限分布为泊松分布.这从理论上说明了泊松分布的来源.

另一方面也表明 , 当 nn很大很大时,二项分布可以用泊松分布近似代替.

实践中, 对XB(n,p)X\sim B(n,p)的情况, 当n50,np10n\geq50,np\leq10时,记λ=np.\lambda=np.则有
Cnkpk(1p)nkλkeλk!. C^k_np^k(1-p)^{n-k}\approx\frac {\lambda^ke^{-\lambda}}{k!}.

② 具有泊松分布的随机变量在实际应用中是很多的, 如一本书一页中的印刷错误字数、 一段时间内电话用户对电话站的呼唤次数 、 电影院的观众数 , 等等. 泊松分布也是概率论中的一种重要分布.

超几何分布

超几何分布定义

KaTeX parse error: No such environment: align at position 57: …{N}^{n}} \begin{̲a̲l̲i̲g̲n̲}̲ ,k=0,1,2,\cdot…

随机变量 X 服从参数为$n, N,M 的超几何分布, 记为X\sim H( n,N,M)$

超几何分布的含义

NN个球, 其中有 MM个白球,NMN—M个黑球.从中取出nn个球, 取到 kk个白球的概率.

几何分布

几何分布定义

P{X=k}=qk1p,k=1,2,3P \{ X = k \} = q^{k-1}p,k = 1,2,3,\cdots, 其中p0,q=1p.p\geq0,q=1-p.随机变量XX服从参数为pp的几何分布, 记为XG(p).X\sim G(p).

几何分布的背景

每次 A 发生的概率为p,p,而直到第kk次才出现A.

随机变量的分布函数

分布函数

XX 是一个随机变量,x,x是任意实数, 函数
F(x)=P{Xx},<x< F(x)=P\{X\leq x\},-\infty<x<\infty

称为XX的分布函数.

分布函数的性质

  1. 单调性:F(x)F(x)是一个单调不减的函数, 即当x1<x2x_1<x_2,F(x1)F(x2);,F(x_1)\leq F(x_2);

  2. 有界性 :
    0F(x1)1,F(+)=limx+F(x)=1;F()=limxF(x)=0; 0\leq F(x_1)\leq 1,且\\ F(+\infty)=\lim_{x\to+\infty}F(x)=1;\\ F(-\infty)=\lim_{x\to-\infty}F(x)=0;

  3. 连续性:F(x+0)=F(x),F(x+0)=F(x),F(x)F(x)是右连续函数.

用分布函数表示概率:

P{X=a}=P{Xa}P{X<a}=F(a)F(a0)P{X>a}=1P{Xa}=1F(a)P{a<Xb}=P{Xb}P{Xa}=F(b)F(a)P{a<X<b}=P{X<b}P{Xa}=F(b0)F(a)P{aXb}=P{Xb}P{X<a}=F(b)F(a0)P{aX<b}=P{X<b}P{X<a}=F(b0)F(a0) P\{X=a\}=P\{X\leq a\}-P\{X<a\}=F(a)-F(a-0)\\ P\{X>a\}=1-P\{X\leq a\}=1-F(a)\\ P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a)\\ P\{a<X<b\}=P\{X<b\}-P\{X\leq a\}=F(b-0)-F(a)\\ P\{a\leq X\leq b\}=P\{X\leq b\}-P\{X<a\}=F(b)-F(a-0)\\ P\{a\leq X<b\}=P\{X<b\}-P\{X<a\}=F(b-0)-F(a-0)\\

离散型随机变量XX的分布律与分布函数和事件概率的关系

  1. 如果已知XX的分布律为P{X=xk}=pk(k=1,2,),P\{X=x_k\}=p_k(k=1,2,\cdots),XX的分布函数
    F(x)=P{Xx}=xkxpk; F(x)=P\{X\leq x\}=\sum_{x_k\leq x}p_k;
    而事件的概率为
    P{a<Xb}=a<xkbpk. P\{a<X\leq b\}=\sum_{a<x_k\leq b}p_k.

  2. 如果已知XX的分布函数F(x),F(x),XX的分布律为
    P{X=xk}=F(xk)F(xk0),k=1,2,, P\{X=x_k \}=F( x_ k ) — F ( x_ k — 0),k=1,2,\cdots,

F(x)F(x) 的值是X=xX=x点的左边(含xx点)全部所有点概率值的累加和.

F(x)F(x)的图形是右升的台阶形, 每个台阶处的跃度等于XX取该值的概率.基于这点 , 由XX的分布函数的图形可以求出XX的分布律

连续型随机变量及其概率密度

连续型随机变量

如果对于随机变量XX的分布函数F(x),F(x),存在非负函数f(x),f(x),使对于任意实数xx
F(x)=xf(t)dt, F(x)=\int_{-\infty}^{x}{f(t)dt},
则称XX为连续型随机变量, 其中函数f(x)f(x)称为XX的概率密度函数, 简称概率密度.

概率密度的性质

  1. f(x)0;f(x)\geq 0;

  2. +f(x)dx=1;\int _{-\infty}^{+\infty}f(x)dx=1;

  3. 对于任意实数x1,x2(x1x2),x_1,x_2(x_1\leq x_2),
    P{x1<Xx2}=F(x2)F(x1)=x1x2f(x)dx; P\{x_1<X\leq x_2\}=F(x_2)-F(x_1)=\int_{x1}^{x2}{f(x)dx;}

  4. f(x)f(x)若在点xx处连续,则有F(x)=f(x).F'(x)=f(x).

常见连续型随机变量

均匀分布

均匀分布定义

若连续型随机变量XX具有概率密度
f(x)={1ba,a<x< b0,其他, f(x)= \begin{cases} \frac{1}{b-a}, \text{a<x< b} \\ 0, \text{其他,} \end{cases}
则称 X 在区间(a,b)(a,b)上服从均匀分布. 记为XU(a,b).X\sim U(a,b).

XX的分布函数为
f(x)={0,x<a1ba,ax<b,1,xb f(x)= \begin{cases} 0, x<a,\\ \frac{1}{b-a},a\leq x< b,\\ 1, x\geq b \end{cases}

均匀分布的性质

(c,d)(a,b),(c,d)\subset(a,b),则有
P{cXd}=dcba(). P\{c\leq X\leq d\}=\frac{d-c}{b-a}(几何概率).

指数分布

指数分布定义

若连续型随机变量 XX 的概率密度为
f(x)={λeλx,x>00,x0. f(x)= \begin{cases} \lambda e^{-\lambda x}, x>0,\\ 0,x\leq 0.\\ \end{cases}
其中λ>0\lambda>0为常数,则称XX服从参数为λ\lambda的指数分布.

XX的分布函数为F(x)={0,x>01eλx,x0.F(x)= \begin{cases} 0, x>0,\\ 1-e^{-\lambda x},x\leq 0.\\ \end{cases}

指数分布的性质(无记忆性)

XE(λ),X\sim E(\lambda),则对任何正数x,x0,x,x_0,必有
P{X>x+x0X>x0}=P{X>x}. P\{X>x+x_0\mid X>x_0\}=P\{X>x\}.

指数分布常用作描述一些电子元件的使用寿命,当x>0x>0,P{X>x}=eλx,P\{X>x\}=e^{-\lambda x}

记住积分公式0+xnexdx=n!\int_{0}^{+\infty}{x^ne^{-x}dx}=n!对指数分布的计算很有帮助, 可能减少许多积分过程.

正态分布

正态分布定义

若连续型随机变量XX的概率密度函数为
f(x)=12πσe(xμ)22σ2(<x<+), f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}(-\infty<x<+\infty),
其中的正态分布μ\muσ>0\sigma>0都是常数,则称服从参数为μ\muσ\sigma的正态分布.简记为XN(μ,σ2).X\sim N(\mu,\sigma^2).

正态分布的性质
  1. f(x)f(x)的图形关于x=μx =\mu对称;

  2. x=μx =\mu时,f(μ)=12πσf(\mu)=\frac{1}{\sqrt{2\pi}\sigma}为最大值.

    XX的分布函数为
    F(x)=12πσxe(tμ)22σ2dt. F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int _{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt.

标准正态分布

μ=0,σ=1\mu=0,\sigma=1时称随机变量XX服从标准正态分布.其概率密度和分布函数分别用φ(x),Φ(x)\varphi(x),\Phi(x)表示,即有
φ(x)=12πσet22,Φ(x)=12πσxet22dt. \varphi(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{t^2}{2}},\\ \Phi(x)=\frac{1}{\sqrt{2\pi}\sigma}\int _{-\infty}^{x}e^{-\frac{t^2}{2}}dt.

标准正态分布的性质
  1. Φ(x)=1Φ(x)\Phi(-x)=1-\Phi(x)Φ(0)=12\Phi(0)=\frac {1}{2}此性质在计算和查表时都是很有用的.

  2. XN(μ,σ2),X\sim N(\mu,\sigma^2),Z=XμσN(0,1).Z=\frac{X-\mu}{\sigma}\sim N(0,1).

    XX得到ZZ这种做法叫正态分布的标准化步骤.解决正态分布的计算问题最重要的, 首先要考虑的就是对XX进行标准化.

  3. XN(μ,σ2),X\sim N(\mu,\sigma^2),
    P{aXb}=Φ(bμσ)Φ(aμσ). P\{a\leq X\leq b\}=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma}).
    特例:
    P{μkσXμ+kσ}=Φ(μ+kσμσ)Φ(μkσμσ)=Φ(k)Φ(k)=2Φ(k)1 P\{\mu-k\sigma\leq X\leq \mu+k\sigma\}\\ =\Phi(\frac{\mu+k\sigma-\mu}{\sigma})-\Phi(\frac{\mu-k\sigma-\mu}{\sigma})\\ =\Phi(k)-\Phi(-k)\\ =2\Phi(k)-1

它的等价形式为
P{Xμkσ}=2Φ(k)1 P\{\mid X-\mu\mid\leq k\sigma\}=2\Phi(k)-1
此概率值与μ,σ\mu,\sigma大小无关,只与kk的数值有关.

kk P{Xμkσ}P\{\mid X-\mu\mid\leq k\sigma\}
1 0.6826
2 0.9544
3 0.9974

随机变量的函数的分布

这里要解决的问题是: 已知随机变量XX的分布,Y=g(X),g,Y=g(X),g是连续函数,求随机变量YY的分布.

离散型随机变量函数的分布

设随机变量 X 的 分布律为P{X=xk}=pk,k=1,2,,P\{X=x_k\}=p_k,k=1,2,\cdots, 则当Y=g(X)Y=g(X)的所有取值为:yj(j=1,2,)y_j(j=1,2,\cdots)时, 随机变量YY有分布律
P{Y=yj}=g(xi)=yjP{X=xi}. P\{Y=y_j\}=\sum_{g(x_i)=y_j}P\{X=x_i\}.

连续型随机变量函数的分布

分布函数法

设随机XX的慨率密度函数为fX(x)(<x<+),f_X(x)(-\infty<x<+\infty),那么Y=g(X)Y=g(X)的分布函数为
FY(y)=P{Yy}=P{g(X)y}=g(x)yfX(x)dx, F_Y(y)=P\{Y\leq y\}=P\{g(X)\leq y\}=\int_{g(x)\leq y}{f_X(x)dx},
其概率密度为fY(y)=FY(y).f_Y(y)=F'_Y(y).

公式法

设随机变量XX具有概率密度函数fX(x)(<x<+),g(x)f_X(x)(-\infty<x<+\infty),g(x)(<x<+)(-\infty<x<+\infty)内的严格单调的可导函数,则随机变量Y=g(X)Y=g(X)的概率密度为
fY(y)={fX[h(y)]h(y),α<y<β0,. f_Y(y)= \begin{cases} f_X[h(y)]\mid h'(y)\mid,\alpha<y<\beta\\ 0,其他.\\ \end{cases}
其中h(y)h(y)g(x)g(x)的反函数,
α=min{g(),g(+)},β=max{g(),g(+)} \alpha=min\{g(-\infty),g(+\infty)\},\\ \beta=max\{g(-\infty),g(+\infty)\}
其分布函数为FY(y)=yfY(t)dt.F_Y(y)=\int^{y}_{-\infty}{f_Y(t)dt}.

典型例题

一维随机变量的分布函数

概率论复习笔记(二)随机变量及其分布
概率论复习笔记(二)随机变量及其分布

一维离散型随机变量的计算

二项分布与超几何分布

袋中装有6个大小相同的球,4个红色,2个白色.现从中连取5次,每次取一球,求取得红球的个数X的分布律:
(1)每次取出球观察颜色后,即放回袋中,拌匀后再取下一个球;
(2)每次取出球观察颜色后,不放回袋中,再取下一个球.

解:

(1) 随机变量X服从二项分布,则X(5,23)X\sim (5,\frac{2}{3})
P{X=k}=C5k(23)k(13)5kk=0123,4,5, P\{X = k\}= C^k_5(\frac{2}{3})^k(\frac{1}{3})^{5-k} ,k = 0,1, 2,3,4,5,
因此X的分布律为

XX 0 1 2 3 4 5
pkp_k 1243\frac{1}{243} 10243\frac{10}{243} 40243\frac{40}{243} 80243\frac{80}{243} 80243\frac{80}{243} 32243\frac{32}{243}

(2)随机变量XX服从超几何分布,故
P{X=k}=C4kC645kC65,k=3,4 P\{X=k\}=\frac {C_4^k·C_{6-4}^{5-k}}{C _{6}^{5}},k=3,4
因此XX的分布律为

XX 3 4
pkp_k 23\frac{2}{3} 13\frac{1}{3}

几何分布

一房间有3扇同样大小的窗子,其中只有一扇是打开的,有一只鸟自开着的窗子飞入房间,它只能从开着的窗子飞出去。鸟在房子里飞来飞去,试图飞出房间。鸟飞向各扇窗子都是随机的。
(1)假定鸟是没有记忆的,以X表示鸟为了飞出房间试飞的次数,求X的分布律;
(2)户主称,他养的鸟是有记忆的,它飞向任一窗子的尝试不多于一次,以Y表示这只聪明的鸟为了飞出房间试飞的次数,如户主所说是确实的,试求Y的分布律.
解:

(1) X服从几何分布,每次只能从开着的窗子飞出去,飞出去的概率为13\frac{1}{3},因此XX的分布律为
P{X=k}=(23)k113(k=1,2,). P \{ X = k \} = (\frac{2}{3})^{k-1}\frac{1}{3}(k = 1,2,\cdots).
(2)当鸟是有记忆的时,由题意,Y的可能取值为1,2.3.
Y=1,表明鸟从3扇窗子中选对了1扇,因对鸟面言.3扇窗是等可能的,P{Y=1}=13,P\{Y=1\}=\frac{1}{3}
Y=2,表明鸟第1次试飞失败概率为23,\frac{2}{3},第二次,鸟舍弃已飞过的那扇窗,而从余下的一开一关两扇窗中选一,成功机会为12\frac{1}{2},故P{Y=2}=23×12=13P\{Y=2\}=\frac{2}{3}\times\frac{1}{2}=\frac{1}{3}
Y=3,表明鸟第1次试飞失败概率为23,\frac{2}{3},第二次,鸟舍弃已飞过的那扇窗,而从余下的一开一关两扇窗中选一,失败机会为12\frac{1}{2},第三次从剩下的唯开着的窗子飞出,成功的概率为1.故P{Y=3}=23×12×1=13P\{Y=3\}=\frac{2}{3}\times\frac{1}{2}\times1=\frac{1}{3}
因此Y的分布律为

Y 1 2 3
pkp_k 13\frac{1}{3} 13\frac{1}{3} 13\frac{1}{3}

泊松分布

由商店过去的销售记录知道,某商品每月的销售数可以用参数λ=10的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在上一个月底至少应进某种商品多少件?
解:

设该商店每月销售某种商品X件,X服从参数λ= 10的泊松分布,故

P{X=k}=10kekk!,k=0,1,2,, P\{X=k\}=\frac {10 ^ke^k}{k!},k=0,1,2,\cdots,
设月底的进货为a件,则当XaX\leq a时就不会脱销,因而按题意要求为P{Xa}0.95,P\{X\leq a\}\geq 0.95,

k=0a10ke10k!>0.95, \sum_{k=0}^{a}\frac {10 ^ke^{-10}}{k!}>0.95,
由泊松分布表可得
k=01410ke10k!0.9166<0.95,k=01510ke10k!0.9513>0.95. \sum_{k=0}^{14}\frac {10 ^ke^{-10}}{k!}\approx 0.9166<0.95,\\ \sum_{k=0}^{15}\frac {10 ^ke^{-10}}{k!}\approx 0.9513>0.95.
于是,这家商店只要在月底进货某种商品15件(假定上个月没存货),就可以95%以上的把握保证这种商品在下个月内不脱销.

一维连续型随机变量的计算

均匀分布

设X在[2,5]上服从均匀分布,求X的取值小于3的概率。

总长度:3

小于3的长度:1

P(X3)P_{(X的取值小于3)}=13\frac{1}{3}

指数分布

某种电子元件的使用寿命X (单位:小时)服从λ=1/2000\lambda=1/2000的指数分布。
求:(1)一个元件能正常使用1000小时以上的概率;
(2)一个元件能正常使用1000小时到2000小时之间的概率。
概率论复习笔记(二)随机变量及其分布

正态分布

概率论复习笔记(二)随机变量及其分布

一维随机变量函数的分布

公式法

概率论复习笔记(二)随机变量及其分布

分布函数法

概率论复习笔记(二)随机变量及其分布
概率论复习笔记(二)随机变量及其分布

本章小结

随机变量的分布函数、概率分布的概念、性质及其关系。

利用概率分布及分布函数计算有关事件的概率。

六种常用分布:即0-1分布、二项分布、泊松分布、均匀分布、指数分布、正态分布。

随机变量函数的分布。

重点与难点

重点

  1. 随机变量的分布函数概念及性质。
  2. 概率分布(离散型随机变量的分布律,连续型随机变量的概率密度)的概念及性质。
  3. 概率分布与分布函数的关系及正态分布的有关计算。
  4. 简单随机变量函数的分布。

难点

  1. 随机变量的分布函数、概率分布及其关系。
  2. 随机变量函数的分布。