总体率估计抽样与显著性检验
抽样
抽样方法:概率抽样和非概率抽样
样本量估计
-
样本量:取样时选出的样本量,能代表整体的最小样本量
-
有效样本量:有效响应的样本量
总体概率公式
- 总体率:又称为总体比例,指总体中具有某一相同特征表现的单位数量的比重,一般用π表示。
- 常见的总体率:点击率、展示率、响应率等。
计算出的样本量,不一定全部有效,在试验时,需初步确定有效样本比例。用计算出的样本量/有效样本比例得到最终样本量。
样本量公式汇总
样本量估计—z检验,适用于正态总体或大样本(n>30)
均值差异显著性检验
- 正态分布下均值差异显著性检验
- 非正态分布下均值差异显著性检验
均值差异是否显著的主要决定因素
- 均值差异是否显著主要受均值之差和标准差的影响
- 均值差异的衡量指标统计量,在正态分布的假设检验中最终转化为均值之差/标准差这一比值的形式;在非正态分布的假设检验中最终转化为取值的排序差异
组间数据产生数据差异的原因
- 差异完全由抽样误差导致
- 存在抽样误差之外的因素导致的差异
样本观测值:试验中样本所有个体的取值。在广告展示率的案例中,广告展示只有两个值,要么展示要么不展示,即要么取1要么取0;样本观测值就是由样本个体取值组成的一个数组(向量)
单样本总体比例的检验
检验统计量:当n很大(>30),且np和n(1-p)两者均>=5时,样本比率的抽样分布近似服从于正态分布,因此,我们可用z统计量作为检验统计量。
其中,π0为假设的总体比例。