《商务与经济统计》(二)
第七章:抽样和抽样分布
1、如何从有限总体中抽取一个随机样本——方法:概率抽样。包括:简单随机抽样、分层随机抽样、整群抽样和系统抽样;从无限总体中抽样——要保证1)、每个个体来自同一总体2)、每个个体彼此独立。
2、利用收集的样本数据可以对总体参数进行点估计(样本统计量是总体相应量对应的一个点估计)。由于不同样本会给出不同点估计值,所以点估计量,比如“x拔(样本均值)”/“p拔(样本比率)”都是随机变量。他们的概率分布即为抽样分布。
3、样本均值的抽样分布:数学期望=总体均值,标准差与总体是否有限有关(有限总体修正系数)。
但,样本均值的概率分布形式或者形态(确定其抽样分布特征的最后一步)取决于:
1)、总体服从正态分布——样本均值也是正态分布
2)、总体不服从正态分布——中心极限定理(样本容量n很大时,近似正态分布)帮助确定样本均值抽样分布的形状。
4、样本比率的抽样分布:数学期望=总体比率,标准差与总体是否有限有关(有限总体修正系数)。
5、点估计的性质:①、无偏性:样本统计量的期望=总体参数值②、有效性:标准误差更小的点估计量更有效;③、一致性。
第八章:区间估计
1、点估计量可能是也可能不是总体参数的好的估计,利用区间估计(点估计±边际误差)可以对估计的精确程度予以度量。
2、总体均值的区间估计:
①、总体标准差σ已知(利用历史数据or其他信息可以得到总体标准差σ的一个好的估计。极差除以4可作为标准差的估计。),给出置信水平,利用正态分布求边际误差。
②、总体标准差σ未知,边际误差和总体均值的区间估计以t分布的概率分布为依据进行。
注意:如果总体服从正态分布,则以上置信区间是准确的,适用于任何样本容量;如果总体不服从正态分布,则该区间为近似(近似程度取决于总体的分布和样本容量)。一般的,样本容量≥30即可,若总体分布非正态但大致对称,n为15时即可得到较好的置信区间,若总体分布严重偏斜or包含异常点,需要n≥50。
3、t分布:随着自由度的增大,t分布与标准正态分布之间的差别变小;
4、样本容量的确定:在给定置信水平下,利用求边际误差的公式可以求出所需的样本容量。
5、总体比率的区间估计与总体均值的区间估计方法类似。
第九章:假设检验(对总体均值和总体比率进行假设检验)
第一类错误:原假设H0为真却拒绝了H0;第二类错误:原假设H0为假时却接受了H0.
显著性水平α:是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险(犯第一类错误的概率)。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取α=0.05或α=0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。
单侧检验:
检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。检验统计量是用于假设检验计算的统计量,实际上是对总体参数的点估计量,但点估计量不能直接作为检验的统计量,只有将其标准化后,才能用于度量它与原假设的参数值之间的差异程度。
2、总体标准差σ已知,对总体均值进行假设检验(注:总体服从正态分布,方法精确成立,反之,只有n足够大时以下方法才有效):
此时的检验统计量z为:
下侧检验的关键:检验统计量Z的值必须达到多小时,才能拒绝原假设 ?
方法①:p-值法。p-值是一个概率值,度量样本所提供的证据对原假设的支持程度。p-值用于确定是否拒绝原假设。p-值越小,反对原假设的证据越多。
例1:检验某咖啡是否每罐都有3磅。
a)、建立原假设和备择假设:
b)、选36罐咖啡组成一个样本,统计得到样本均值,计算检验统计量z,
由此可得出:p-值为检验统计量z小于或等于-2.67的概率(标准正态曲线下在检验统计量的值(此例中为-2.67)下侧部分的面积)
c)、利用标准正态概率表,我们查得z=-2.67下侧的面积为0.0038.
d)、本例选择α=0.01作为显著性水平。(意味着:在原假设以等式形式(即)成立时,允许以0.01的概率拒绝原假设)
本例p-值=0.0038,意味着:当原假设作为一个等式为真时,得到或者更小值的概率为0.0038≤α,故拒绝H0。
本例中p-值=0.0038也被称为实际显著性水平。
方法②:临界值法。临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准(对于下侧检验而言)。在检验统计量的抽样分布中,与下侧面积α(显著性水平)相对应的值是检验统计量的临界值。即是说,临界值是使得我们拒绝原假设的检验统计量的最大值。
例2:问题同例1.
临界值是标准正态概率分布中与下侧面积α=0.01相对应的检验统计量的值。,这种通过在显著性水平下查表得到的临界值,记为Zα(下侧检验)。
在咖啡例中,与相对应的检验统计量z=-2.67≤Zα=-2.33,所以我们拒绝H0,并得出结论:该咖啡分量不足。
3、P-值和临界值的比较?
a)、p-值和临界值总得出相同的拒绝结论,即每当p-值≤α时,检验统计量的值将≤临界值。
b)、p-值法可以告诉我们结果有多么显著(实际显著性水平),临界值只能得到它是否显著。
4、区间估计与假设检验的关系
5、总体标准差σ未知,对总体均值进行假设检验(注:利用样本均值估计总体均值µ,利用样本标准差s估计σ):
6、总体比例的假设检验:
(注:只有np≥5,且n(1-p)≥45,则样本比率的抽样分布近似服从正态分布。
的精确分布样式是离散型分布,
取每个值的概率由二项分布给出。)
7、在显著性检验中,我们控制了第一类错误发生的概率,但没有控制第二类错误的概率。因此我们给出的结论是“不能拒绝原假设”(非结论性的论断),而不是“接受原假设”。
但是检验假设的目的是:原假设为真,做第一种决策;备选假设为真,做另外一种决策。
因此,需要计算发生第二类错误的概率。
8、计算第二类错误的概率
例3:电池使用寿命(单位:h)均值的原假设和备择假设:,确定显著性水平α=0.05.
选取36节电池组成一个样本,根据已有的检验假定总体标准差σ已知,为σ=12h,
拒绝规则表明,当时,拒绝H0。反解出:当
,拒绝H0。
利用以上信息,可以计算发生第二类错误的概率(即总体均值<120时,我们却做出接受H0:μ ≥ 120的决定)。
首先,假定电池的使用寿命均值μ=112,此时发生第二类错误的概率应该是:当μ=112时,样本均值的概率。
(随着μ的增加,发生第二类错误的概率上升;功效曲线为递减形式)
9、对总体均值假设检验时样本容量的确定
对于给定的样本容量,选择较小的显著性水平意味着将使发生第二类错误的风险增大。
第十章:两总体均值和比例的推断
1、两总体均值之差的推断:σ1和σ2已知
独立简单随机样本:从总体1中随机抽取容量为n1的简单随机样本,从总体2中随机抽取容量为n2的另一个简单随机样本。
a)、μ1-μ2的区间估计:【
的抽样分布要服从(均值为μ1-μ2的)正态分布,即两个总体都服从正态分布或样本容量足够大(由中心极限定理可推得)】
b)、μ1-μ2的假设检验:
(Z服从标准正态分布)
也采用P-值法和临界值法。操作类似第9章。
2、两总体均值之差的推断:σ1和σ2未知
a)、μ1-μ2的区间估计:在该式中,所用的t分布是近似分布,但统计结果很好且应用相对简单。
的自由度计算公式如下:
b)、μ1-μ2的假设检验:
t统计量的自由度由上式给出。
3、匹配样本设计:比如统计两个工艺生产效率的时候,设计一个工人先用a工艺生产一定时间,再用b工艺生产相同时间(该方式优于部分工人用a工艺,部分工人用b工艺)
匹配样本假设检验的检验统计量:(需要d的总体服从正态分布,这对于应用t分布进行假设检验和区间估计是必要的)。自由度:n-1
4、两总体比例之差的推断
a)、的区间估计:如果样本容量足够大,使得n1p1,n1(1-p1),n2p2,n2(1-p2)都≥5,则
的抽样分布近似服从正太分布。
因此可以得到:
b)、的假设检验:
第十一章:总体方差的统计推断(1个/2个总体方差的统计推断)
应用的场景?
像前面几章通过样本均值、样本比例推断总体均值、总体比率一样,本章的内容是通过样本方差推断总体方差。
案例:同样的均值,可能存在差距较大的方差,在生产过程中,有时既要求保证均值,同时也要求方差适度,这样才能保证生产的持续进行。
1、样本方差s2是总体方差σ2的点估计,在用样本方差作为推断总体方差的基础时,的抽样分布描述如下:
2、利用 分布建立总体方差σ2的置信区间估计:
(由于样本容量提供的样本方差无法提供精确值,因此考虑对总体方差进行区间估计。)
一个总体方差的区间估计:
3、一个总体方差的假设检验:
表示总体方差的假设值。
4、在一些统计应用中,我们可能想比较两个不同生产工序生产出来的产品质量方差/两种不同装配方法所需装配时间的方差……。在比较两个总体方差时,我们将使用两个独立随机样本收集的数据,分别来自总体1/总体2。两个样本方差和
是推断总体方差
和
的基础。
当两个正态总体的方差相等()时,样本方差之比
有如下抽样分布:
5、F分布
F分布特性:①、F变量的范围:0~+∞(非负),②、F分布为非对称分布,一般为右偏,任何F分布的形状依赖于分子和分母的自由度。③、用表示F分布的上侧面积或概率为α时的值。
(F分布表:由分子自由度、分母自由度、上侧面积α三者确定的数值)
6、利用F分布进行两个总体方差的假设检验。
第十二章:多个比率的比较、独立性及拟合优度检验
1、三个或多个总体比率的相等性的检验
总体比率相等性的永远是一个上侧检验。当检验统计量位于
分布的上侧时,得到H0的拒绝域。
2、
3、独立性检验:的一个重要应用是利用样本数据检验两个分类变量(一个总体中)的独立性。
4、拟合优度检验
①、多项概率分布:把二项分布扩展为多项就得到了多项分布。
例:C公司新开发一类产品,调查是否使市场上三家公司A/B/B的市场份额发生改变(原Pa=0.3/Pb=0.5/Pc=0.2)。
建立假设:
调查顾客的购买偏好,并汇总。随后进行拟合优度检验。
与其它检验一样,拟合优度检验基于样本的观察频数与原假设为真时的期望频数的相比较。
计算得到=7.34,由于自由度:3-1=2,查阅
分布表,p-值介于0.025-0.05之间≤α=0.05,因此,拒绝H0,新产品将改变市场份额。
②、正态分布的拟合优度检验: