数理统计与描述性统计
三、数理统计概念
3.1 基本概念
研究对象的全体为总体,组成总体的每个基本单元叫个体。
统计量:不包含任何关于总体的未知参数。
x1,x2,……,xn相互独立,且每个xi与X同分布,则称x1,x2,……,xn为简单随机样本。
3.3常用的统计量:
样本均值:
样本方差:
k阶样本原点矩:
k阶样本中心矩:
顺序统计量:
四、描述性统计
4.1 数据集中趋势的度量
平均数:
中位数:
频数:
众数:
百分位数:
4.2 python实现
4.3数据离散趋势的度量
表示数据分散(离散、差异)程度的特征量有方差,标准差,极差以及变异系数。
方差:
标准差:
极差:
变异系数:
四分位差:
4.4 python实现
4.5 分布特征
离散变量与连续变量
概率函数:用函数的形式来表达概率。连续型随机变量的概率函数就叫做概率密度函数
分布函数:
正态分布:
4.6 偏度与峰度:
偏度(skewness):刻画分布函数的对称性。关于均值对称的数据其偏度系数为0,右侧更分散的数据偏度系数为正,左侧更分散的数据偏度系数为负。
若以bs表示偏度。bs <0 称分布具有负偏离,也称左偏态;此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于右边的尾部要唱。
4.7 公式与python实现
样本偏度系数:
样本峰度系数: