基本概念
随机变量
随机变量 : 设随机试验E的样本空间为Ω, 如果对于Ω内的每一个样本点e都有一个实数x 与之对应, 则称X为随机变量, 记为 X=X(e).
简言之, 随机变量就是定义在样本空间Ω上的样本点 e 的实值单值函数X(e).我们一般用大写字母如X,Y,Z,…表示随机变量 。
随机变量的分类 :
随机变量⎩⎪⎨⎪⎧离散型非离散型{连续型其他
不要误以为 , 一个随机变量如果不是离散型就是连续型的.实际上还存在非离散非连续型的 。
随机变量的取值是有概率规律的, 这种概率规律叫做随机变量的概率分布.在概率分布的描述上,离散型随机变量和连续型随机变量所采用的方法是不同的.前者主要采用列举法, 后者主要采用积分法.
离散型随机变量
离散型随机变量
若随机变量X的全部可能取值是有限个或可列个, 则称X为离散型随机变量.
分布律
离散型随机变量X所有可能取值为xk(k=1,2,⋯), 事件{X=xk}的概率为P{X=xk}=pk(k=1,2,⋯),这里有0≤pk≤1,并且k∑pk=1则 称 P{X=xk}=pk(k=1,2,⋯)为X的分布律或分布列。
分布律也可以写成表格形式:
X |
x1 |
x2 |
⋯ |
xk |
⋯ |
P |
p1 |
p2 |
⋯ |
pk |
⋯ |
性质
离散型随机变量 x的分布律的性质:
- P{X=xk}=pk≥0(k=1,2,⋯)
- k∑P{X=xk}=k∑pk=1
几个重要的离散型随机变量
(0—1) 分布
设随机变量 X只可能取 0 与1 两个值, 它的分布律是 P{X=k}=pk(1−p)1−k,k=0,1,0<p<1
X |
0 |
1 |
pk |
1−p |
p |
(0 — 1) 分布是经常遇到的一种分布, 用来描述只有两种对应结果的伯努利试验( 如成功与失败, 合格与不合格, 出现与不出现等).这些时候我们可以定义一个服从(0 — 1) 分布的随机变量:
X={0,A不发生1,A发生
二项分布
伯努利试验
设试验E只有两种可能结果,A 及A, 则E称为伯努利试验.若将试验E独立地重复进行n次, 则称这个试验为n重伯努利试验.
二项分布
在n重伯努利试验中,若P(A)=p,P(A)=1—p.记X为n次试验中事件A 发生的次数,显然X是一个随机变量, 它的取值为$ 0,1,2,\dots,n.$它的分布律为
P{X=k}=Cnkpk(1—p)n−k,k=0,1,2,…,n,
称 X服从参数为n,p的二项分布,记为
X∼B(n,p)
二项分布与(0 — 1)分布有着密切关系
-
在二项分布中, 若n=1, 二项分布就变成 (0 — 1) 分布;
-
在n次伯努利试验中, 若只考虑某一次试验,比如第i次试验, 可定义随机变量Xi如下:
Xi={1,当Ai发生时0,当Ai发生时,i=1,2,⋯,n,
Xi服从( 0 — 1) 分 布. 对前面的X,显然有X=∑i=1nXi.而X服从二项分布.所以说:n个服从(0-1)分布的且相互独立的随机变量Xi的和服从二项分布.
泊松分布
泊松分布的定义
对于常数λ>0,如果随机变量 X的分布律为
P{X=k}=k!λkek,k=0,1,2,⋯,
则称X服从参数为 A 的泊松分布, 记为X∼B(λ).
泊松定理
设有X∼B(n,pn)和常数λ>0,如果npn=λ,则
n→∞limCnkpnk(1−pn)n−k=k!λke−λ,k=0,1,2,⋯.
①泊松定理说明,当n→∞时,二项分布的极限分布为泊松分布.这从理论上说明了泊松分布的来源.
另一方面也表明 , 当 n很大很大时,二项分布可以用泊松分布近似代替.
实践中, 对X∼B(n,p)的情况, 当n≥50,np≤10时,记λ=np.则有
Cnkpk(1−p)n−k≈k!λke−λ.
② 具有泊松分布的随机变量在实际应用中是很多的, 如一本书一页中的印刷错误字数、 一段时间内电话用户对电话站的呼唤次数 、 电影院的观众数 , 等等. 泊松分布也是概率论中的一种重要分布.
超几何分布
超几何分布定义
KaTeX parse error: No such environment: align at position 57: …{N}^{n}}
\begin{̲a̲l̲i̲g̲n̲}̲
,k=0,1,2,\cdot…
随机变量 X 服从参数为$n, N,M 的超几何分布,记为X\sim H( n,N,M)$
超几何分布的含义
有 N个球, 其中有 M个白球,N—M个黑球.从中取出n个球, 取到 k个白球的概率.
几何分布
几何分布定义
P{X=k}=qk−1p,k=1,2,3,⋯, 其中p≥0,q=1−p.随机变量X服从参数为p的几何分布, 记为X∼G(p).
几何分布的背景
每次 A 发生的概率为p,而直到第k次才出现A.
随机变量的分布函数
分布函数
设 X 是一个随机变量,x是任意实数, 函数
F(x)=P{X≤x},−∞<x<∞
称为X的分布函数.
分布函数的性质
-
单调性:F(x)是一个单调不减的函数, 即当x1<x2时,F(x1)≤F(x2);
-
有界性 :
0≤F(x1)≤1,且F(+∞)=x→+∞limF(x)=1;F(−∞)=x→−∞limF(x)=0;
-
连续性:F(x+0)=F(x),即F(x)是右连续函数.
用分布函数表示概率:
P{X=a}=P{X≤a}−P{X<a}=F(a)−F(a−0)P{X>a}=1−P{X≤a}=1−F(a)P{a<X≤b}=P{X≤b}−P{X≤a}=F(b)−F(a)P{a<X<b}=P{X<b}−P{X≤a}=F(b−0)−F(a)P{a≤X≤b}=P{X≤b}−P{X<a}=F(b)−F(a−0)P{a≤X<b}=P{X<b}−P{X<a}=F(b−0)−F(a−0)
离散型随机变量X的分布律与分布函数和事件概率的关系
-
如果已知X的分布律为P{X=xk}=pk(k=1,2,⋯),则X的分布函数
F(x)=P{X≤x}=xk≤x∑pk;
而事件的概率为
P{a<X≤b}=a<xk≤b∑pk.
-
如果已知X的分布函数F(x),则X的分布律为
P{X=xk}=F(xk)—F(xk—0),k=1,2,⋯,
F(x) 的值是X=x点的左边(含x点)全部所有点概率值的累加和.
F(x)的图形是右升的台阶形, 每个台阶处的跃度等于X取该值的概率.基于这点 , 由X的分布函数的图形可以求出X的分布律
连续型随机变量及其概率密度
连续型随机变量
如果对于随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有
F(x)=∫−∞xf(t)dt,
则称X为连续型随机变量, 其中函数f(x)称为X的概率密度函数, 简称概率密度.
概率密度的性质
-
f(x)≥0;
-
∫−∞+∞f(x)dx=1;
-
对于任意实数x1,x2(x1≤x2),
P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(x)dx;
-
f(x)若在点x处连续,则有F′(x)=f(x).
常见连续型随机变量
均匀分布
均匀分布定义
若连续型随机变量X具有概率密度
f(x)={b−a1,a<x< b0,其他,
则称 X 在区间(a,b)上服从均匀分布. 记为X∼U(a,b).
X的分布函数为
f(x)=⎩⎪⎨⎪⎧0,x<a,b−a1,a≤x<b,1,x≥b
均匀分布的性质
若(c,d)⊂(a,b),则有
P{c≤X≤d}=b−ad−c(几何概率).
指数分布
指数分布定义
若连续型随机变量 X 的概率密度为
f(x)={λe−λx,x>0,0,x≤0.
其中λ>0为常数,则称X服从参数为λ的指数分布.
X的分布函数为F(x)={0,x>0,1−e−λx,x≤0.
指数分布的性质(无记忆性)
若X∼E(λ),则对任何正数x,x0,必有
P{X>x+x0∣X>x0}=P{X>x}.
指数分布常用作描述一些电子元件的使用寿命,当x>0时,P{X>x}=e−λx
记住积分公式∫0+∞xne−xdx=n!对指数分布的计算很有帮助, 可能减少许多积分过程.
正态分布
正态分布定义
若连续型随机变量X的概率密度函数为
f(x)=2πσ1e−2σ2(x−μ)2(−∞<x<+∞),
其中的正态分布μ与σ>0都是常数,则称服从参数为μ与σ的正态分布.简记为X∼N(μ,σ2).
正态分布的性质
-
f(x)的图形关于x=μ对称;
-
当x=μ时,f(μ)=2πσ1为最大值.
X的分布函数为
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt.
标准正态分布
当μ=0,σ=1时称随机变量X服从标准正态分布.其概率密度和分布函数分别用φ(x),Φ(x)表示,即有
φ(x)=2πσ1e−2t2,Φ(x)=2πσ1∫−∞xe−2t2dt.
标准正态分布的性质
-
Φ(−x)=1−Φ(x)且Φ(0)=21此性质在计算和查表时都是很有用的.
-
若X∼N(μ,σ2),则Z=σX−μ∼N(0,1).
X得到Z这种做法叫正态分布的标准化步骤.解决正态分布的计算问题最重要的, 首先要考虑的就是对X进行标准化.
-
X∼N(μ,σ2), 则
P{a≤X≤b}=Φ(σb−μ)−Φ(σa−μ).
特例:
P{μ−kσ≤X≤μ+kσ}=Φ(σμ+kσ−μ)−Φ(σμ−kσ−μ)=Φ(k)−Φ(−k)=2Φ(k)−1
它的等价形式为
P{∣X−μ∣≤kσ}=2Φ(k)−1
此概率值与μ,σ大小无关,只与k的数值有关.
k |
P{∣X−μ∣≤kσ} |
1 |
0.6826 |
2 |
0.9544 |
3 |
0.9974 |
随机变量的函数的分布
这里要解决的问题是: 已知随机变量X的分布,Y=g(X),g是连续函数,求随机变量Y的分布.
离散型随机变量函数的分布
设随机变量 X 的 分布律为P{X=xk}=pk,k=1,2,⋯, 则当Y=g(X)的所有取值为:yj(j=1,2,⋯)时, 随机变量Y有分布律
P{Y=yj}=g(xi)=yj∑P{X=xi}.
连续型随机变量函数的分布
分布函数法
设随机X的慨率密度函数为fX(x)(−∞<x<+∞),那么Y=g(X)的分布函数为
FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(x)≤yfX(x)dx,
其概率密度为fY(y)=FY′(y).
公式法
设随机变量X具有概率密度函数fX(x)(−∞<x<+∞),g(x)为(−∞<x<+∞)内的严格单调的可导函数,则随机变量Y=g(X)的概率密度为
fY(y)={fX[h(y)]∣h′(y)∣,α<y<β0,其他.
其中h(y)是g(x)的反函数,
α=min{g(−∞),g(+∞)},β=max{g(−∞),g(+∞)}
其分布函数为FY(y)=∫−∞yfY(t)dt.
典型例题
一维随机变量的分布函数


一维离散型随机变量的计算
二项分布与超几何分布
袋中装有6个大小相同的球,4个红色,2个白色.现从中连取5次,每次取一球,求取得红球的个数X的分布律:
(1)每次取出球观察颜色后,即放回袋中,拌匀后再取下一个球;
(2)每次取出球观察颜色后,不放回袋中,再取下一个球.
解:
(1) 随机变量X服从二项分布,则X∼(5,32)故
P{X=k}=C5k(32)k(31)5−k,k=0,1,2,3,4,5,
因此X的分布律为
X |
0 |
1 |
2 |
3 |
4 |
5 |
pk |
2431 |
24310 |
24340 |
24380 |
24380 |
24332 |
(2)随机变量X服从超几何分布,故
P{X=k}=C65C4k⋅C6−45−k,k=3,4
因此X的分布律为
X |
3 |
4 |
pk |
32 |
31 |
几何分布
一房间有3扇同样大小的窗子,其中只有一扇是打开的,有一只鸟自开着的窗子飞入房间,它只能从开着的窗子飞出去。鸟在房子里飞来飞去,试图飞出房间。鸟飞向各扇窗子都是随机的。
(1)假定鸟是没有记忆的,以X表示鸟为了飞出房间试飞的次数,求X的分布律;
(2)户主称,他养的鸟是有记忆的,它飞向任一窗子的尝试不多于一次,以Y表示这只聪明的鸟为了飞出房间试飞的次数,如户主所说是确实的,试求Y的分布律.
解:
(1) X服从几何分布,每次只能从开着的窗子飞出去,飞出去的概率为31,因此X的分布律为
P{X=k}=(32)k−131(k=1,2,⋯).
(2)当鸟是有记忆的时,由题意,Y的可能取值为1,2.3.
Y=1,表明鸟从3扇窗子中选对了1扇,因对鸟面言.3扇窗是等可能的,P{Y=1}=31
Y=2,表明鸟第1次试飞失败概率为32,第二次,鸟舍弃已飞过的那扇窗,而从余下的一开一关两扇窗中选一,成功机会为21,故P{Y=2}=32×21=31
Y=3,表明鸟第1次试飞失败概率为32,第二次,鸟舍弃已飞过的那扇窗,而从余下的一开一关两扇窗中选一,失败机会为21,第三次从剩下的唯开着的窗子飞出,成功的概率为1.故P{Y=3}=32×21×1=31
因此Y的分布律为
Y |
1 |
2 |
3 |
pk |
31 |
31 |
31 |
泊松分布
由商店过去的销售记录知道,某商品每月的销售数可以用参数λ=10的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在上一个月底至少应进某种商品多少件?
解:
设该商店每月销售某种商品X件,X服从参数λ= 10的泊松分布,故
P{X=k}=k!10kek,k=0,1,2,⋯,
设月底的进货为a件,则当X≤a时就不会脱销,因而按题意要求为P{X≤a}≥0.95,
即
k=0∑ak!10ke−10>0.95,
由泊松分布表可得
k=0∑14k!10ke−10≈0.9166<0.95,k=0∑15k!10ke−10≈0.9513>0.95.
于是,这家商店只要在月底进货某种商品15件(假定上个月没存货),就可以95%以上的把握保证这种商品在下个月内不脱销.
一维连续型随机变量的计算
均匀分布
设X在[2,5]上服从均匀分布,求X的取值小于3的概率。
总长度:3
小于3的长度:1
P(X的取值小于3)=31
指数分布
某种电子元件的使用寿命X (单位:小时)服从λ=1/2000的指数分布。
求:(1)一个元件能正常使用1000小时以上的概率;
(2)一个元件能正常使用1000小时到2000小时之间的概率。

正态分布

一维随机变量函数的分布
公式法

分布函数法


本章小结
随机变量的分布函数、概率分布的概念、性质及其关系。
利用概率分布及分布函数计算有关事件的概率。
六种常用分布:即0-1分布、二项分布、泊松分布、均匀分布、指数分布、正态分布。
随机变量函数的分布。
重点与难点
重点
- 随机变量的分布函数概念及性质。
- 概率分布(离散型随机变量的分布律,连续型随机变量的概率密度)的概念及性质。
- 概率分布与分布函数的关系及正态分布的有关计算。
- 简单随机变量函数的分布。
难点
- 随机变量的分布函数、概率分布及其关系。
- 随机变量函数的分布。