[概率统计]商务与经济统计知识点总结 Part3
碎碎念写在前面
4月半啦!感觉一步一步的学习比较的踏实,希望好事儿会一件一件来的。别灰心!!还有就是晚上早点睡。
第六章 连续型概率分布
这一章节呢,对应第五章的离散型概率分布,并且其中包含最最重要的概率分布正态分布,很多问题都是建立在这个正态性假设上的。
对于连续型变量来说,最重要的概念是概率密度函数。下面就列除几个最重要的分布。
均匀概率分布
处理连续型随机变量和离散型随机变量时,主要存在以下两方面的区别:
- 我们不再讨论随机变量取某一特定值的概率,我们讨论随机变量在某一给定区间上取值的概率。
- 连续型随机变量在某个给定区间上取值的概率,被定义为在区间上概率密度函数曲线下的面积。这意味着连续型随机变量取某个特定值的概率为零。
数学期望和方差的公式如下:
正态概率分布
正态分布有广泛的实际应用,比如人的身高和体重、考试成绩、科学测量、降雨量以及其他类似的数值,都近似服从正态概率分布。
我们观察到,正态分布有以下特征:
- 正态分布族中的每个分布因均值miu和标准差sigma这两个参数的不同而不同
- 正态曲线的最高点在均值处达到,均值还是分布的中位数和众数
- 分布的均值可以是任意数值:负数、零或正数
- 正态分布是对称的
- 标准差决定曲线的宽度和平坦程度。标准差越大则曲线越宽、越平坦,表明数据有更大的变异性
- 正态随机变量的概率由正态曲线下的面积给出
- 下面是随机变量在一些常用区间内取值的百分比
与之相关的有一个标准正态概率分布,不同之处就在于参数的取值上面。
所有的正态分布的概率计算都可以转化成标准正态随机变量,如:
二项概率的正态近似
一般计算二项分布是比较麻烦的,所以我们给定一些条件,在这些条件下可以将二项分布近似为正态分布。
近似条件:
对于二项分布的正态近似要注意,离散型变量近似为连续型,要注意校正。
指数概率分布
可用于描述诸如到达某洗车处的两辆车的时间间隔,装载一辆卡车所需时间,高速公路上两起重大事故发生地之间的距离等随机变量。
泊松分布与指数分布的关系
泊松分布描述了每一区间中事件发生的次数,指数分布描述了事件发生的时间间隔长度。
今天时间关系就只写一章啦!