概率/离散型分布/连续型分布/概率密度函数

算概率首先要明确数据类型,因为数据类型会影响求概率的方式。

数据类型分为:1.离散型随机变量 2.连续型随机变量

  • 离散型随机变量的取值为有限个或者无限可列个(整数集是典型的无限可列),这个算概率的时候很简单,即随机变量取某个值的时候,概率对应多少。

  • 连续型随机变量的取值为无限不可列个(实数集是典型的无限不可列)
    这个时候我们讨论概率就需要用到面积,因为取值既然是无限个,那么讨论某个点的概率是没有意义的(就像对某个时间点讨论位移是没有意义的,只有时间段的位移才有意义),这个时候我们就需要一个反应概率变化趋势的函数,然后用它来算积分值(面积),也就是概率,而这个函数就是概率密度函数,也是概率的导函数。

  • 附上一个大神链接:https://zhuanlan.zhihu.com/p/48140593

分布函数有几种反复出现,于是统计学家开始研究常见的那几种,这样下次就可以直接套用。

  • 离散概率分布:
    二项分布 几何分布 泊松分布

  • 连续型概率分布:
    指数分布 正态分布

二项分布

  • 二项分布有啥用呢?
    当你遇到一个事情,如果该事情发生次数固定,而你感兴趣的是成功的次数,那么就可以用二项分布的公式快速计算出概率来。

  • 如何判断是不是二项分布?
    1)做某件事的次数(也叫试验次数)是固定的,用n表示(抛硬币)
    2)每一次事件都有两个可能的结果(成功,或者失败)
    3)每一次成功的概率都是相等的,成功的概率用p表示
    4)你成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

  • 如何计算?
    概率/离散型分布/连续型分布/概率密度函数

几何分布

  • 几何分布有啥用?
    如果你需要知道尝试多次能取得第一次成功的概率(也就是说前面都是失败的),则需要几何分布。

  • 如何判断是不是几何分布?
    1)做某事件次数(也叫试验次数)是固定的,用n表示
    2)每一次事件都有两个可能的结果(成功,或者失败)
    3)每一次“成功”的概率都是相等的,成功的概率用p表示
    4)你感兴趣的是,进行x次尝试这个事情,取得第1次成功的概率是多大(例如你在玩抛硬币的游戏,想知道抛5次硬币,只有第5次(就是滴1次成功)正面朝上的概率是多大。

  • 如何计算?
    先要失败x-1次:概率/离散型分布/连续型分布/概率密度函数

泊松分布

  • 泊松分布有啥用?
    如果你想知道某个时间范围内,发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数,一个月内某机器损坏的次数等。
    泊松分布的形状会随着平均值的不同而有所变化,无论是一周内多少人能赢得**,还是每分钟有多少人会打电话到呼叫中心,泊松分布都可以告诉我们它们的概率。(泊松分布的分布函数有个参数就是均值,影响分布函数)

  • 什么是泊松分布?
    1)事件是独立事件
    2)在任意相同的时间范围内,事件发的概率相同
    (例如1天内中奖概率,与第2天内中间概率相同)
    3)你想知道某个时间范围内,发生某件事情x次的概率是多大
    (例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率,但是要知道平均一天有多少人中奖

  • 如何计算?
    概率/离散型分布/连续型分布/概率密度函数