《商务与经济统计》要点回顾笔记
1.计算第p百分位数
2.标准差系数
以百分数形式反映变异程度
3.z-分数
4.切比雪夫定理
适用于任何数据集,不论数据分布的形态
5.经验法则
当数据集呈正态分布时使用
6.异常值
对于钟形分布数据,根据经验法则,利用z-分数检查异常值时,而已吧z-分数小于-3或者大于+3的数值视为异常值。
7.箱形图
8.两变量间关系度量
(1)协方差
协方差表示两者相关关系:正的协方差表示变量间正相关关系,负的协方差表示变量间负相关关系。为了度量相关的程度,用相关系数。
(2)相关系数
相关系数取值范围为[-1,1],越接近1越呈现强线性正相关,越接近-1越呈现强线性负相关(线性关系不意味着因果关系)
9.加权平均数
10.分组数据
11.公式总结1
12.计数法则
13.贝叶斯定理
14.离散型概率分布
令f(x)为x的概率函数,表示x每一个取值的概率
15.二项分布
如果具有性质(2)(3)(4),即二项试验的一次试验成为贝努利试验。
16.泊松分布
17.超几何分布
当n足够大时,超几何分布近似为成功率为p=r/N的二项分布
18.连续型随机变量
与离散型最大的不同时,连续型没有随机变量x取某个特定值的概率f(x),有概率密度函数,也记为f(x)。但是概率密度函数并没有直接给出概率,f(x)曲线下的面积为连续型随机变量在该区间内取值的概率。因此连续型随机变量只能给出某个区间内的概率,某点的概率为0(某点时f(x)曲线下面积为0)。
19.均匀分布
20.正态分布
(1)标准正态分布
计算任一正态分布的概率。首先将正态分布随机变量x转化为标准正态分布随机变量z:
然后查表。
(2)二项分布的正态近似
举例:
21.指数分布
排队论中,指数分布常用于描述服务等候时间。
泊松分布与指数分布的关系
如果某段时间内汽车到达数服从泊松分布,那么两辆汽车达到时间间隔必定服从指数分布:
22.抽样分布
采集样本的目的是收集数据从而对关于总体的某个研究问题作出推断。抽样结果仅仅提供的是对总体特征值的估计。
参数的概念:
23.有限总体抽样
(1)有限总体抽样
- 简单随机抽样
一般简单随机抽样总是默认为无放回抽样。
(2)无限总体抽样
24.点估计
点估计量和点估计值:
25.抽样分布
26.
(1)
(2)
(3)
27.
(1)
(2)
(3)
28.点估计的性质
(1)无偏性
(2)有效性
(3)一致性
29.区间估计
对于总体均值
(1)总体方差
95%置信区间是最常见的选择,此时
(2)总体方差
注意:
对于总体比率p
对于总体方差
30.假设检验
如何选择原假设和备择假设?
(1)备择假设作为研究的假设
(2)原假设作为被怀疑的假设
例1:企业的目标是某饮料灌装至少为67.6盎司。
例2:企业的目标是某饮料灌装正好是67.6盎司。
(3)原假设和备择假设形式:
(4)两类错误
(5)显著性水平
(6)单侧检验
31.简单线性回归
只包括一个自变量和一个因变量,二者关系可以用一条近似直线表示
(1)回归模型
(2)回归方程
(3)估计的回归方程
(4)最小二乘法
(5)残差
(6)离差
(7)对残差和离差的理解
(8)回归平方和
(9)SSE、SST、SSR关系
重要公式
(10)判定系数
(11)样本相关系数
(12)显著性检验
32.多元回归