算法基础:泊松分布推导
推导泊松分布公式,先理解一些概念
目录
先说说什么是二点分布
抛一枚硬币,会出现两种情况:
出现花的一面设定为1或者出现字的一面设定为0,假设出现花的一面概率为p, 则出现字的一面为1-p
则有以下的分布列表
|
1 |
0 |
概率 |
p |
1-p |
写成概率函数为:
即表示, 当出现花面时,则k=1,P=p; 同理k=0, P=1-p
两点分布的期望和方差:
期望公式:
方差公式:
再说说二项分布
具体概念不说, 请自行百度, 或通过与二点分布的不同自行领悟
二项分布与二点分布有什么区别呢?
性质不同
1、两点分布:在一次试验中,事件A出现的概率为P,事件A不出现的概率为q=l -p,若以X记一次试验中A出现的次数,则X仅取0、I两个值。
2、二项分布:是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变。
特点不同
1、两点分布:是试验次数为1的伯努利试验。
2、二项分布:是试验次数为n次的伯努利试验。
二项分布的期望与方差:
假设次数X为n次的集合体, 即X = {x1,x2,x3,x4......xn}
则
由二点分布的期望方差可知相关公式
则二项分布的期望为:
则二项分布的方差为:
下面进入主题说说泊松分布
泊松分布是最重要的离散分布之一,它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。在一定时间内某交通路口所发生的事故个数,是一个典型的例子。泊松分布的产生机制可以通过如下例子来解释。
为方便记,设所观察的这段时间为[0,1),取一个很大的自然数n,把时间段[0,1)分为等长的n段:
我们做如下两个假定:
1. 在每段内,恰发生一个事故的概率,近似的与这段时间的长
成正比,可设为
。当n很大时,
很小时,在
这么短暂的一段时间内,要发生两次或者更多次事故是不可能的。因此在
这段时间内不发生事故的概率为
。
2. 各段是否发生事故是独立的把在[0,1)时段内发生的事故数X视作在n个划分之后的小时段
内有事故的时段数,则按照上述两个假定,X应服从二项分布。于是,我们有泊松分布的概率函数
怎么对概率函数进行简化呢?设期望为
则有,则
, 则公式为:
其中表示组合数
具体推导请百度,再自行领悟,或者查看最下方获得答案
则P的最新公式为:
继续推导工作:
则P的最新公式为:
由于n无穷大则,
则
最后P的公式:
正规的泊松分布
是不是很相似?
只需要换个符号,这就是教科书中的泊松分布的概率密度函数。
如有相关推导公式不清楚,可以添加微信公众号,进行留言即可