python统计分析

1.假设检验:本质上针对连续型变量

基本步骤:(1)提出原假设和备择假设 (2)确定适当的检验统计量  (3)规定显著性水平python统计分析 

(4)计算检验统计量的值   (5)做出决策

单样本t 检验:(1)假设样本服从t分布,原假设为总体均值等于u0  (2)备注假设为总体均值不等于u0  

(3) 先计算样本均值python统计分析 ,样本标准差为python统计分析  (4)检验统计量如下:python统计分析

(5) 根据计算出来的P值来判断是否拒绝原假设,例如:P值大于显著性水平,则无法拒绝原假设,P值小于显著性水平,则拒绝原假设,接受备择假设,显著性水平可以理解为拒绝原假设的概率。

双样本t 检验:(1)单样本t检验是比较假设的总体平均数与样本平均数的差异是否显著

(2)双样本t检验是比较两个样本的均值的差异是否显著

(3)在数据分析中,双样本t检验往往用于检验某二分类变量区分下的连续型变量是否有显著差异

(4)例如:研究信用卡消费男女消费水平是否有显著差异,男女收入水平是否有显著差异

(5)例如:北京和上海的人均收入是否有显著差异

python统计分析

2.卡方分析和方差分析

(1)卡方检验:主要检验两个分类变量是否相关,不能表示强弱,两个分类变量,其中有一个必须是二分类,不能都是多分类

列联表是一种常见的分类汇总表,将两个变量的每个取值分别列举出来,一个变量是列变量,另一个是行变量,中间对应着不同变量不同类别下的频数。

(2)方差分析:用于检验多个样本的均值是否有显著性差异,所以用于分析多于两个分类的离散型变量与 连续变量的关系,例如:不同教育程度的人收入水平是否有显著影响

单因素方差分析:衡量不同因素对观测变量的影响程度,在数据分析中,不同因素可以理解为一个变量取不同值时对观测变量的影响,例如:收入水平是否受教育程度的影响,不同行业的股票收益率是否有显著差异。

多因素方差分析:考虑多个分类变量对连续变量的影响,以及分类变量之间的交互效应,例如在考虑股票收益率与行业和地区的关系时,还要考虑行业和地区的交互效应。