统计、概率和噪声MATLAB图解
均值和方差
均值
方差
MATLAB自带的var和std也是如此定义方差和标准差的,注意是除以N-1而不是N!
如下图生成一个1000点的rand数:
其均值和方差分别为0.4954和0.2843。
在信号处理中,均值也叫DC值,标准差叫做AC值。而RMS即均方根既测量了DC分量也测量了AC分量。
均方根RMS
上图中的RMS=0.5711。
一般随机数的峰峰值等于其标准差的6~8倍,从上图中可以验证此种关系。
柱状图,概率质量函数和概率密度函数
下图是8bit ADC结果,共取得了256000个点的信号。第一个图是其中128个sample的图示,其直方图在第二个图中显示。
直方图显示了每个值出现的次数。直方图中所有值的和等于输入数据sample的点数。上图不够平滑,当所有256000个点都用于计算直方图时如下所示:
直方图根据获取的信号得到的,而概率质量函数pmf是直方图潜在蕴含的过程表示。直方图一般都由有限数据获取,而pmf可能有无限信号得到,pmf可以由直方图来估计或者数学技巧推导而来。
pmf的纵轴与直方图不同的是其为分数表示。即出现次数除以总次数。因此代表某个值出现的概率。直方图和pmf都是用于离散信号的表示,作为对应的是,pdf即概率密度函数用来对模拟信号进行表示。
需要注意的是概率密度,其概率的计算是某一范围的,例如120~121之间概率密度为0.03,则其概率为(121-120)*0.03=0.03。如果在某范围内不是恒定值,那这个过程就是积分。从-∞到+∞概率密度的积分为1。
下图给出了几个常见的波形的概率密度函数曲线:
当信号可能取的值远大于信号点数时计算直方图会有问题,这种情况很容易在浮点表示时发生。例如,整数表示可能取值3或4,而浮点表示在3和4之间可能有数以百万计的数存在。
解决这一问题的方法是binning。即随机选取直方图的长度。例如选为1000点,这些选取的点叫做bins。这些bin代表的是某个范围内的数据。选择bins个数是在横轴和纵轴分辨率之间做折中。