【统计学 第四周】概率分布

梳理大纲: 概率分布
【1】基本概念:随机变量、古典概率、条件概率、离散变量、连续变量
【2】离散变量概率分布:二项分布、伯努利分布、泊松分布、期望值
【3】连续变量概率分布:均匀分布、正态分布、指数分布、大数定律

参考资料:
统计学(贾俊平第七版)第五章
统计学(可汗学院)第17-34、41、42集

From 统计学Statistics 学习小组:由【木东居士】公众号 定期发起
对数据感兴趣的伙伴们 可一同在此交流学习

概率的基本概念

简单的描述方法只能实现对统计数据粗浅的利用,它与从统计数据中挖掘出规律性的东西还有很大差距

在介绍概率前,补上一些基本的术语解释:

试验: 在同一组条件下,对某事物或现象所进行的观察或者实验
事件: 观察或试验得到的结果
随机事件/偶然事件: 在同一组条件下,可能出现也可能不出现的事件
必然事件: 在同一组条件下,每次实验一定出现的事件
不可能事件: 在同一组条件下,每次实验一定不会出现的事件
基本事件: 事件本身无法再进行拆解
所有基本事件的全体: 样本空间/基础空间
P(A)概率: 事件在试验中出现的可能性大小的量度

概率(统计学中的定义):
【统计学 第四周】概率分布
古典概率:
【1】结果有限;【2】每种结果出现的可能性是相同的
主观概率:
【1】决策者根绝本人掌握的信息对某个事件发生的可能性做出判断和估计

P(X):表示事件X在试验中出现可能性的大小
X称为P(X)的随机变量,P(X)称为X的概率函数

其中,随机变量 还可分为 :
【1】离散型随机变量(所有值都可以逐一列出)
【2】 连续性随机变量(所有值无法逐一列出)

离散型随机变量

仅在0和1离散点上的分布,一般称为0-1分布
【统计学 第四周】概率分布

数字特征(期望值,方差,标准差)
期望值:表示随机变量本身的平均水平或则集中程度
E(X) = x1p1+x2p2+x3*p3…
方差/标准差:测量随机变量的变异程度或离散程度
方差:实际上是随机变量X的函数【X-E(X)】^2的期望
【统计学 第四周】概率分布
标准差:方差开根号
离散系数 V = σ / E(X)
【统计学 第四周】概率分布

离散分布中常用的概率分布:
【1】二项分布
【2】泊松分布

二项分布 X~B(n,p) 的条件如下:
【1】包含n次相同的实验,实验之间相互独立
【2】每次实验只有两个可能的结果
【3】出现“成功”的概率P对每一次实验都是相同的
【4】“成功”和“失败”是可以计数的(试验结果对应一个离散型随机变量)

以上,相当于进行了n次重复伯努利试验模型 ( 伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生)

二项分布的期望值和方差分别为:
E(X)=np
D(X)=npq
n=1时,二项分布就变成了0-1分布
【统计学 第四周】概率分布

泊松分布:
用来描述在一指定时间范围内或者在指定的面积或体积之内 某一事件出现的次数的分布

【统计学 第四周】概率分布在实际应用中,当p<=0.25,n>20,np<=5时:
用泊松分布近似二项分布的效果良好 λ=np
【统计学 第四周】概率分布

连续性随机变量

当用f(x)表示连续型随机变量时,将f(x)称为概率密度函数:
(注意纵坐标不是概率)
需要满足以下两条件:
【统计学 第四周】概率分布
【统计学 第四周】概率分布
注:连续型随机变量的概率密度是其分布函数的导数
(可类比路程与速度的关系)

正态分布 X~N(μ,σ^2)
在连续型随机变量中,最重要的一种随机变量是具有钟形概率分布的随机变量,其概率分布称为正态分布
μ决定了图形的中心位置,σ决定了陡峭程度
【统计学 第四周】概率分布
分布曲线特点:
【1】f(x)>=0,整个概率密度曲线在X轴的上方
【2】曲线f(x)相对于x=μ对称,并且在x=μ处达到最大值,f(μ)=1/sqrt(2Π)σ
【3】σ越大,曲线越平缓,σ越小,曲线越陡峭
【4】当x趋于无穷时,曲线以x轴为其渐近线

标准正态分布
当μ=0,σ=1的时候,N(0,1)我们称为标准正态分布
【统计学 第四周】概率分布
注:任何一个正态分布都可以通过线性变化 转为标准正态分布
转化之后,可以通过查表解决正态分布的概率计算问题
【统计学 第四周】概率分布
风靡全球的6σ管理质量标准,也是在正态分布原理基础上建立的
P( μ-6σ < X < μ+6σ ) = 0.999 999 998
次品率仅为十亿分之二
注:传统的3σ原则,质量合格率为99.73%

大数定理:
在随机事件的大量重复出现中,往往呈现几乎必然的规律
通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。