probability 与 Likelihood

概率和似然 ,两者非常相似,都表示概率。下面以正太分布分布为例,说明两者之间的差别(事实上,这样的差别对任何一种分布都成立)。

先说一下概率。

probability 与 Likelihood

 

probability 与 Likelihood

 

假设老鼠的体重为均值为32 g 标准差为2.5 g 的正太分布。

probability 与 Likelihood

 

probability 与 Likelihood

 

现在,我们随机为一只老鼠称体重,该老鼠的体重位于32-34g之间的概率为上图红色部分的面积。数学上,我们使用下面的符号表示这样的概念:

在给定均值为32g 方差为2.5 g 的正太分布的条件下,变量位于32-34g之间的概率为0.29。

probability 与 Likelihood

 

当我们关注的是变量的不同取值时,左边会改,比如体重大于34g的概率。但是右边不会变,因为它定义了分布的形状和位置。

probability 与 Likelihood

 

所以,当我们在说一个概率时,我们其实是指在某种分布下(右边定义),变量的特定取值范围(左边定义)的概率。使用相同的分布,改变左边定义的范围,就获得一个不同的概率。

现在说一下 likelihood。

probability 与 Likelihood

现在假设我们已经测量了一堆老鼠的体重。

probability 与 Likelihood

假设某只老鼠的体重为34g。

probability 与 Likelihood

那么,这只老鼠的likelihood就是上图的红叉。

probability 与 Likelihood

likelihood的值为0.12。

probability 与 Likelihood

数学上的表示为:在给定一只体重为34g的老鼠的条件下,均值32,方差为2.5的正太分布的似然为0.12。

如果改变分布的位置,比如将它移到均值为32g的位置,得到的似然值为0.21。

probability 与 Likelihood

所以,对于likelihood来说,测量值(右侧)是不变的,我们不断的改变分布的位置和形状就得到不同的似然值。

probability 与 Likelihood

总的来说,概率是在固定的分布下,曲线下方的面积。

probability 与 Likelihood

似然是固定的观测值下,不同的分布的函数值。

probability 与 Likelihood