您的位置: 首页 > 文章 > 概率/离散型分布/连续型分布/概率密度函数

概率/离散型分布/连续型分布/概率密度函数

分类: 文章 • 2024-05-20 18:27:16

算概率首先要明确数据类型，因为数据类型会影响求概率的方式。

数据类型分为：1.离散型随机变量 2.连续型随机变量

离散型随机变量的取值为有限个或者无限可列个（整数集是典型的无限可列），这个算概率的时候很简单，即随机变量取某个值的时候，概率对应多少。
连续型随机变量的取值为无限不可列个（实数集是典型的无限不可列）
这个时候我们讨论概率就需要用到面积，因为取值既然是无限个，那么讨论某个点的概率是没有意义的（就像对某个时间点讨论位移是没有意义的，只有时间段的位移才有意义），这个时候我们就需要一个反应概率变化趋势的函数，然后用它来算积分值（面积），也就是概率，而这个函数就是概率密度函数，也是概率的导函数。
附上一个大神链接：https://zhuanlan.zhihu.com/p/48140593

分布函数有几种反复出现，于是统计学家开始研究常见的那几种，这样下次就可以直接套用。

离散概率分布：
二项分布几何分布泊松分布
连续型概率分布：
指数分布正态分布

二项分布

二项分布有啥用呢？
当你遇到一个事情，如果该事情发生次数固定，而你感兴趣的是成功的次数，那么就可以用二项分布的公式快速计算出概率来。
如何判断是不是二项分布？
1)做某件事的次数（也叫试验次数）是固定的，用n表示（抛硬币）
2）每一次事件都有两个可能的结果（成功，或者失败）
3）每一次成功的概率都是相等的，成功的概率用p表示
4）你成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。
如何计算？

几何分布

几何分布有啥用？
如果你需要知道尝试多次能取得第一次成功的概率（也就是说前面都是失败的），则需要几何分布。
如何判断是不是几何分布？
1）做某事件次数（也叫试验次数）是固定的，用n表示
2）每一次事件都有两个可能的结果（成功，或者失败）
3）每一次“成功”的概率都是相等的，成功的概率用p表示
4）你感兴趣的是，进行x次尝试这个事情，取得第1次成功的概率是多大（例如你在玩抛硬币的游戏，想知道抛5次硬币，只有第5次（就是滴1次成功）正面朝上的概率是多大。
如何计算？
先要失败x-1次：

泊松分布

泊松分布有啥用？
如果你想知道某个时间范围内，发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数，一个月内某机器损坏的次数等。
泊松分布的形状会随着平均值的不同而有所变化，无论是一周内多少人能赢得**，还是每分钟有多少人会打电话到呼叫中心，泊松分布都可以告诉我们它们的概率。（泊松分布的分布函数有个参数就是均值，影响分布函数）
什么是泊松分布？
1）事件是独立事件
2）在任意相同的时间范围内，事件发的概率相同
（例如1天内中奖概率，与第2天内中间概率相同）
3）你想知道某个时间范围内，发生某件事情x次的概率是多大
（例如你搞了个促销抽奖活动，想知道一天内10人中奖的概率，但是要知道平均一天有多少人中奖）
如何计算？