算法基础:泊松分布推导

推导泊松分布公式,先理解一些概念

 

目录

先说说什么是二点分布

再说说二项分布

下面进入主题说说泊松分布


先说说什么是二点分布

抛一枚硬币,会出现两种情况:

算法基础:泊松分布推导

出现花的一面设定为1或者出现字的一面设定为0,假设出现花的一面概率为p, 则出现字的一面为1-p

则有以下的分布列表

 

1

0

概率

p

1-p

 

写成概率函数为: 算法基础:泊松分布推导

即表示, 当出现花面时,则k=1,P=p; 同理k=0, P=1-p

两点分布的期望和方差

期望公式:算法基础:泊松分布推导

方差公式: 算法基础:泊松分布推导

 

再说说二项分布

具体概念不说, 请自行百度, 或通过与二点分布的不同自行领悟

二项分布与二点分布有什么区别呢?

性质不同

1、两点分布:在一次试验中,事件A出现的概率为P,事件A不出现的概率为q=l -p,若以X记一次试验中A出现的次数,则X仅取0、I两个值。

2、二项分布:是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变。

特点不同

1、两点分布:是试验次数为1的伯努利试验。

2、二项分布:是试验次数为n次的伯努利试验。

二项分布的期望与方差:

假设次数X为n次的集合体, 即X = {x1,x2,x3,x4......xn}

算法基础:泊松分布推导

由二点分布的期望方差可知相关公式

则二项分布的期望为:

算法基础:泊松分布推导

则二项分布的方差为:

算法基础:泊松分布推导

 

下面进入主题说说泊松分布

泊松分布是最重要的离散分布之一,它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。在一定时间内某交通路口所发生的事故个数,是一个典型的例子。泊松分布的产生机制可以通过如下例子来解释。

为方便记,设所观察的这段时间为[0,1),取一个很大的自然数n,把时间段[0,1)分为等长的n段:

算法基础:泊松分布推导

我们做如下两个假定:

1. 在每段算法基础:泊松分布推导内,恰发生一个事故的概率,近似的与这段时间的长算法基础:泊松分布推导成正比,可设为算法基础:泊松分布推导。当n很大时,算法基础:泊松分布推导很小时,在算法基础:泊松分布推导这么短暂的一段时间内,要发生两次或者更多次事故是不可能的。因此在算法基础:泊松分布推导这段时间内不发生事故的概率为算法基础:泊松分布推导

2. 算法基础:泊松分布推导各段是否发生事故是独立的把在[0,1)时段内发生的事故数X视作在n个划分之后的小时段算法基础:泊松分布推导内有事故的时段数,则按照上述两个假定,X应服从二项分布。于是,我们有泊松分布的概率函数

算法基础:泊松分布推导

怎么对概率函数进行简化呢?设期望为算法基础:泊松分布推导

则有算法基础:泊松分布推导,则算法基础:泊松分布推导, 则公式为:算法基础:泊松分布推导

其中算法基础:泊松分布推导表示组合数算法基础:泊松分布推导

算法基础:泊松分布推导 具体推导请百度,再自行领悟,或者查看最下方获得答案

则P的最新公式为:算法基础:泊松分布推导

继续推导工作:算法基础:泊松分布推导

算法基础:泊松分布推导

 

则P的最新公式为:

算法基础:泊松分布推导

 

由于n无穷大则算法基础:泊松分布推导算法基础:泊松分布推导

 

算法基础:泊松分布推导

 

最后P的公式:

       算法基础:泊松分布推导

正规的泊松分布算法基础:泊松分布推导

算法基础:泊松分布推导

是不是很相似?

只需要换个符号,这就是教科书中的泊松分布的概率密度函数。

如有相关推导公式不清楚,可以添加微信公众号,进行留言即可

算法基础:泊松分布推导