概率论总结(一):基本概念以及一维随机变量的分布
一、基本概念
1. 样本空间和样本点
我们将随机实验E的所有可能结果组成的集合称为E的样本空间,记为S。样本空间的元素,即E的每个结果,称为样本点。
2. 频率和概率的关系
概率是一种现象的固有属性,比如百一枚均匀的硬币,随意抛掷的话正面出现的概率就是1/2。这跟你的实验是没有关系度的。
频率,就是一组实验中关心的某个结果出现的次数比上所有实验次数的比值,它和实验密切相问关。一般来说,随着实验次数的增多,频率会接近于概率。比如你抛掷均答匀的硬币10000次,出现正面的频率内就会非常接近于概率0.5.
概率论中的大数定理(第五章会讲到)表明,容当实验次数趋向于无穷时,频率的极限就是概率。
二、随机变量及其分布
1.随机变量的定义
设随机实验的样本空间为S={e}。 X=X{e}是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量。
所以随机变量实际上是关于样本空间的函数。在很多情况下,该函数直接定义为X=X(e)=e, 可以理解成斜率为1,偏移为0的函数。当然也有一些不是这种情况,比如,当我们做下面这样一个实验。在一袋中装有编号分别为1,2,3的3只球,在袋中任取俩只球,记录它们的号码。这是随机变量可以定义为X=X(e)=X((i,j))=i+j,即两次编号之和,而不是(i,j)。这个是根据实际问题需要而去定义的。
2.离散型随机变量及其分布律
X的取值是有限个的。一般情况下也意味着样本空间中的样本点的取值也是有限个的。
(1)分布的定义
上式就是离散型随机变量X的分布律。所谓分布,就是描述X的取值的分布情况,以及X在各个取值下的概率的分布情况。
离散型随机变量只要有以下几种分布。
(2)伯努利分布(或称为二项分布)跟0-1分布的区别
两者相同的地方是试验的结果都只有两种结果,两种最主要的区别就是0-1分布只进行一次试验(伯努利试验),伯努利分布进行n次试验(伯努利试验)。
i. 关于随机变量X的定义略有不同
0-1分布: , k这里指的是只进行1次试验,A发生的次数(只有0,1选择)。
伯努利分布: X = k,k值指的是进行了n次试验,A发生的次数(0,...,n)。
ii. X的概率分布也略有不同
0-1分布的分布律:
伯努利分布的分布律:
当n重伯努利试验退化为1重时,伯努利分布跟0-1分布相同。
(3)泊松分布和伯努利分布的关系
i.设随机变量X的所有可能取值为0,1,2,...,而各个值得概率为
其中 >0是常数,则称X服从参数为的泊松分布,记为
3.连续型随机变量和分布函数
分布函数就是描述随机变量X的分布的函数。
(1)分布律和分布函数的区别
在离散型随机变量中我们用分布律来描述随机变量X的分布,比如
但是在连续型随机变量中,由于其可能取的值不能一一列举出来,因而就不能像离散型随机变量那样可以用分布律来描述它。此外,在连续型随机变量中,我们对某一个取值的概率(如P(k=1.1))也不太感兴趣,而是对一个范围内的取值的概率和比较感兴趣。所以就催生了分布函数。
(2)分布函数的定义
所以说到这里我们就知道分布函数是描述随机变量在某个范围内的概率,它更大程度上是用来对付连续型随机变量的,但是为了理论的统一性,我们也用分布函数描述离散型随机变量的分布(事实上也有一些帮助)。
(3)概率密度函数
f(t)即为概率密度函数,概率密度函数可以看作是分布函数的导数,分布函数是概率密度函数的积分。只有连续型随机变量才有概率密度函数。
(4)概率密度函数和概率的关系
i. 随机变量在给定取值的概率
离散型:
连续型:
ii. 随机变量在给定区间内取值的概率
离散型: 在x1和x2之间的离散值的概率之和。
连续型:
所以,离散型的随机变量在一定区间内的概率就是该区间内各取值的概率和,而连续型的随机变量在一定区间内的概率是概率密度函数在该区间的积分。虽然概率密度函数f(x)不能直接表示X=x的概率,但是,它能够直观的显示事件发生在X=x周围的小区间内的可能性高低。如果小区间长度为1,那么该区间内概率密度函数的中点可以近似地看作是事件发生在该区间的概率。
(5)连续型随机变量的三种分布
在这里这三种分布表示的是三种不同的分布函数,而分布函数又直接由概率密度函数决定,所以这里的三种分布就是由三种不同的概率密度决定。
i. 均匀分布
ii. 指数分布
iii. 正态分布或者高斯分布
三、参考资料
【1】《概率论及数理统计》