概率论基础
基础分布
分布 |
说明 |
表达式 |
期望 |
方差 |
二项分布 |
n次伯努利试验 |
P(X=k)=Cnkpk(1−p)(n−k) |
np |
np(1−p) |
泊松分布 |
X∼π(λ),多用于描述事件的发生次数的概率 |
P(X=k)=k!λke−λ |
λ |
λ |
指数分布 |
具有无记忆性,常用于可靠性理论和排队论中 |
P(x)=θ1e−θx,x>0 |
|
|
正态分布 |
X∼N(μ,σ2) |
P(x)=2πσ1e−2σ2(x−μ)2 |
μ |
σ2 |
-
指数分布的无记忆性
- P(X>s+t∣X>s)=P(X>T)
- 举个例子,一个零件用了s小时后,它还能再用t小时的概率与这个零件没用过时能用t小时的概率相同。很显然这个性质是指数函数带来的。
-
泊松定律:
- 固定k,对于任意正整数n, 令npn=λ,则limn→∞Cnkpnk(1−pn)n−k=k!λke−k
- 这个式子必须选定k,令n趋于无穷大才成立,对应的pn会趋近于无穷小
- 泊松定理是二项分布的一种极限情况:试验次数非常大,而每次试验的成功概率p非常小,这也符合生活中的很多例子,例如每天的顾客数量、每天的事故发生数量等等。当然,当k的大小开始接近n的时候,泊松分布就会失效,应该改用二项分布。这个理解也可以在两个分布的期望与方差上得到印证
-
函数的概率分布:
- 已知X的概率分布函数fX,如果有Y=g(X),要求Y的概率分布函数fY,可以通过边缘分布函数FX求得FY, 然后对FY求导得到Fy
88页
样本与抽样分布
-
箱线图,对于一组抽样,分别求出中位数M、第一四分位点Q1、第三四分位点Q3,画出下面这张图(图片来源《概率论与数理统计》第四版 133页)。![概率论与数理统计复习笔记(待续) 概率论与数理统计复习笔记(待续)](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzg2OC84ZmU3MmE5NzIxM2NkYWZjYzQ2ZWNhZjFhNzg2M2E2NC5wbmc=)
-
概率分布的分位点:给定α,概率分布函数f(x),如果∫β+∞f(x)dx=α, 则β则为该分布的α分位点。
-
样本分布:主要是注意样本方差S2=n−11∑i=1n(Xi−X)中的系数是n−11。实际上如果公式中不用样本均值X来近似μ而是直接用μ的话,系数还是直观的n1。然而可以证明, E[(X−μ)2]=n1σ2,所以系数要予以修正。
-
χ2分布:χ2=X12+X22+…+Xn2,其中Xi为标准正态分布的样本,则χ2∼χ2(n),即*度为n的卡方分布
-
Γ函数:Γ(x)=∫0+∞tx−1e−tdt,x>0,其历史可以参考这里
- 这个函数是阶乘函数在实数乃至复数域上的扩展,对于正整数n, Γ(n+1)=n!, 如果修改伽马函数让Γ(n)=n!,只需要将tx−1改为tx即可;
- 其满足阶乘的性质: Γ(x+1)=xΓ(x)(分部积分证明)。
-
t 分布:t=Y/nX,记为t∼t(n), 其中X∼N(0,1),Y∼χ2(n), X,Y相互独立;
- 概率密度函数为h(t)=πnΓ[n/2]Γ[(n+1)/2](1+nt2)−(n+1)/2,其关于y轴对称;
-
limn→+∞h(t)=2π1e2−t2,也就是说,n变大时,t分布将逐渐趋向于标准正态分布,n>45时就几乎一样了
-
F分布:F=V/n2U/n1,记为F(n1,n2),*度为(n1,n2), 其中U∼χ2(n1),V∼χ2(n2), U,V相互独立。
- 概率分布函数只在正半轴非0,太复杂了,好像也没必要记住?
-
正态分布样本的若干性质,假设正态分布N(μ,σ2)有n个采样的均值,样本均值为X,样本方差为S2:
-
X与S2相互独立
- X∼N(μ,σ2/n)
-
σ2(n−1)S2∼χ2(n−1) , (很有意思,(n−1)S2其实和卡方分布的定义很像,但是里面用的是样本均值,可能也就是如此使得得到的*度为n−1)
-
S/nX−μ∼t(n−1),可以由前两条推出
- 如果有两个正态分布的样本X,Y,则σ12/σ22S12/S22∼F(n1−1,n2−2)
参数估计
- 点估计分为矩估计和最大似然估计,后者见得很多了,前者是指,如果分布具有n个参数,则分别求出1至n阶矩关于参数的表达式,然后计算样本中1至n阶矩的具体值,最后联立方程得到结果。当参数只有两个时,用的就是均值和方差。在一些简单的分布中,矩估计和最大似然估计的结果似乎是一样的。
假设检验
确定原假设H0和备择假设H1,使用一个检验统计量来表示H0,利用这个统计量的分布和显著性水平来判断假设是否成立。根据检验统计量的不同,可以分为Z检验(正态分布),t检验, χ2检验,F检验。
![概率论与数理统计复习笔记(待续) 概率论与数理统计复习笔记(待续)](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzQ3NS85ZGQ4YmJhY2Y3MmJhMDdkZTBkNjBjMGQ0MTAxMTM3My5wbmc=)
![概率论与数理统计复习笔记(待续) 概率论与数理统计复习笔记(待续)](/default/index/img?u=aHR0cHM6Ly9waWFuc2hlbi5jb20vaW1hZ2VzLzkwMS84ZWYzZjY5NjYyM2UzNzYyMTYzOWU0NWYxYjQxM2Q0ZC5wbmc=)
分布拟合检验、秩和检验:待读
其他
-
切比雪夫不等式: P(∣x−μ∣≥ϵ)≤ϵ2δ2
- 证明方法是写出P(∣x−μ∣≥ϵ)的定义,然后在定义中用f(x)≤ϵ2(x−μ)2f(x)进行放缩即可。
-
协方差: Cov(X,Y)=E[(X−E[X])(Y−E[Y])]
- 相关系数: ρXY=D(x)D(Y)Cov(X,Y)
- ρXY≤1
-
ρXY=1 当且仅当存在常数a,b使得P(X=a+bY)=1
- 多维随机变量中,两两的协方差构成协方差矩阵