概率论 基本概率模型、分布、期望和方差
基本概念
等可能概型(古典概型)
特点
- 试验的样本空间只包含有限个元素;
- 试验中每个基本事件发生的可能性相同。
公式
设试验的样本空间为S={e1,e2,e3,…,en}{e1,e2,e3,…,en},若事件A包含k个基本事件,即A={ei1}⋃{ei1}⋃…{eik}{ei1}⋃{ei1}⋃…{eik},这里i1,i2,…,iki1,i2,…,ik是1,2,…,n1,2,…,n中k个不同的数。则有:
P(A)=∑j=1kP({eij})=kn=A包含的基本事件数S中基本事件的总数P(A)=∑j=1kP({eij})=kn=A包含的基本事件数S中基本事件的总数
例题
- 将一枚硬币抛掷三次,恰有一次出现正面的概率;
- 袋子里装小球,放回抽样和不放回抽样;
-
n个人中至少有两人生日相同的概率。
假设每人的生日在一年365天中任一天是等可能的,即13651365,则随机选取n个人,生日各不相同的概率是:
365∙365∙⋯∙(365−n+1)365n365∙365∙⋯∙(365−n+1)365n
所以n个人至少两人生日相同的概率是:p=1−365∙365∙⋯∙(365−n+1)365np=1−365∙365∙⋯∙(365−n+1)365n
n | 20 | 23 | 30 | 40 | 50 | 60 | 100 |
---|---|---|---|---|---|---|---|
p | 0.411 | 0.507 | 0.706 | 0.891 | 0.970 | 0.997 | 0.999 999 7 |
条件概率
条件概率定义
设A,B是两个事件,且P(A)>0,称
P(B|A)=P(AB)P(A)P(B|A)=P(AB)P(A)
为在事件A发生的条件下,事件B发生的条件概率。
乘法定理
设P(A)>0,则有
P(AB)=P(B|A)P(A)P(AB)=P(B|A)P(A)
全概率公式
设试验E的样本空间为S,A为E的事件,B1,B2,…,BnB1,B2,…,Bn的一个划分,且P(Bi)>0(i−1,2,…,n)P(Bi)>0(i−1,2,…,n),则
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+⋯+P(A|Bn)P(Bn)P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+⋯+P(A|Bn)P(Bn)
贝叶斯公式
设试验E的样本空间为S,A为E的事件,B1,B2,…,BnB1,B2,…,Bn为S的一个划分,且P(A)>0,P(Bi)>0(i=1,2,…,n)P(A)>0,P(Bi)>0(i=1,2,…,n),则
P(Bi|A)=P(A|Bi)P(Bi)∑kj=1P(A|Bj)P(Bj)P(Bi|A)=P(A|Bi)P(Bi)∑j=1kP(A|Bj)P(Bj)
离散型随机变量
0-1分布
设随机变量X只可能取0与1两个值,它的分布律是
P{X=k}=pk(1−p)1−k,k=0,1(0<p<1)P{X=k}=pk(1−p)1−k,k=0,1(0<p<1)
X | 0 | 1 |
---|---|---|
pkpk | 1−p1−p | pp |
伯努利试验
设试验E只有两个可能结果:AA和A¯A¯,则称E谓伯努利试验。设P(A)=p (0<p<1)P(A)=p (0<p<1),此时P(A¯)=1−pP(A¯)=1−p。将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
二项分布
n重伯努利试验,事件A在n次试验中发生k次的概率:
P{X=k}=Cknpkqn−k,k=0,1,…,nP{X=k}=Cnkpkqn−k,k=0,1,…,n
我们称随机变量X服从参数为n,p的二项分布,记为X−b(n,p)X−b(n,p)。
泊松分布
设随机变量X所有可能取的值为0,1,2,…,而取各个值的概率为
P{X=k}=λke−λk !,k=1,2,…P{X=k}=λke−λk !,k=1,2,…
其中λ>0是常数,称X服从参数为λ的泊松分布,记为X−π(λ)X−π(λ)。
泊松定理
设λ>0是一个常数,n是任意正整数,设npn=λnpn=λ,则对于任一固定的非负整数k,有
limn→∞Cknpkn(1−pn)n−k=λke−λk !limn→∞Cnkpnk(1−pn)n−k=λke−λk !
当n很大,p很小(np=λ)时有以下近似公式
Cknpk(1−p)n−k≈λke−λk !Cnkpk(1−p)n−k≈λke−λk !
也就是说以n,p为参数的二项分布的概率值可以由参数为λ=npλ=np的泊松分布的概率值近似。
连续型随机变量
均匀分布
若连续型随机变量X具有概率密度
f(x)={1b−a,0,a<x<b其他f(x)={1b−a,a<x<b0,其他
则称X在区间(a,b)(a,b)上服从均匀分布,记为X−U(a,b)X−U(a,b)。概率密度f(x)和分布函数F(x)如图所示:
指数分布
若连续型随机变量X的概率密度为
f(x)={1θe−x/θ,0,x>0其他f(x)={1θe−x/θ,x>00,其他
其中θ>0θ>0为常数,则称X服从参数为θθ的指数分布。密度函数如下图:
正态分布
若连续型随机变量X的概率密度为
f(x)=12π−−√e−(x−μ)22σ2,−∞<x<+∞f(x)=12πe−(x−μ)22σ2,−∞<x<+∞
其中μ,σ(σ>0)μ,σ(σ>0)为常数,则称X服从参数为μ,σμ,σ的正态分布或高斯分布,记为X−N(μ,σ2)X−N(μ,σ2)。
几种常见的概率分布表