总体率估计抽样与显著性检验

抽样

抽样方法:概率抽样和非概率抽样

总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验

样本量估计

总体率估计抽样与显著性检验

  • 样本量:取样时选出的样本量,能代表整体的最小样本量

  • 有效样本量:有效响应的样本量

总体概率公式

  • 总体率:又称为总体比例,指总体中具有某一相同特征表现的单位数量的比重,一般用π表示。
  • 常见的总体率:点击率、展示率、响应率等。
    总体率估计抽样与显著性检验
    总体率估计抽样与显著性检验
    计算出的样本量,不一定全部有效,在试验时,需初步确定有效样本比例。用计算出的样本量/有效样本比例得到最终样本量。

总体率估计抽样与显著性检验
总体率估计抽样与显著性检验

样本量公式汇总

样本量估计—z检验,适用于正态总体或大样本(n>30)
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验

均值差异显著性检验

  • 正态分布下均值差异显著性检验
  • 非正态分布下均值差异显著性检验

均值差异是否显著的主要决定因素

  • 均值差异是否显著主要受均值之差和标准差的影响
  • 均值差异的衡量指标统计量,在正态分布的假设检验中最终转化为均值之差/标准差这一比值的形式;在非正态分布的假设检验中最终转化为取值的排序差异

组间数据产生数据差异的原因

  • 差异完全由抽样误差导致
  • 存在抽样误差之外的因素导致的差异

样本观测值:试验中样本所有个体的取值。在广告展示率的案例中,广告展示只有两个值,要么展示要么不展示,即要么取1要么取0;样本观测值就是由样本个体取值组成的一个数组(向量)

总体率估计抽样与显著性检验

单样本总体比例的检验

检验统计量:当n很大(>30),且np和n(1-p)两者均>=5时,样本比率的抽样分布近似服从于正态分布,因此,我们可用z统计量作为检验统计量。
总体率估计抽样与显著性检验
其中,π0为假设的总体比例。
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验

两总体比例之差的显著性检验

总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验
总体率估计抽样与显著性检验