概论 之 极大似然估计,矩估计

在分布函数已知,参数未知的情况下,猜测参数称为点估计。
最大似然估计的思想:参数是多少的时候,最有可能得到我们收集到的这个结果?
矩估计:当样本数足够大时,样本均值会收敛于总体期望。随机变量的一阶原点矩是期望(若 E ( X k ) E(X^k) E(Xk) X X X k k k阶原点矩,简称 k k k阶矩),二阶中心矩是方差。样本与总体的原点矩是近似的。可以通过让它们相等来计算。
我们称 A k = 1 n ∑ i = 1 n X i k A_k=\frac{1}{n}\sum^n_{i=1}X^k_i Ak=n1i=1nXik称为 k k k阶矩 A k A_k Ak k k k阶总体矩 μ k = E ( X k ) \mu_k=E(X^k) μk=E(Xk)的无偏估计量,这也正是矩估计法的原理。
有几个带估参数,就是几阶矩,例如一阶矩和二阶矩为:
E ( X ) = ∫ μ ∞ x ⋅ f ( x ) d x E ( X 2 ) = ∫ μ ∞ x 2 ⋅ f ( x ) d x E(X)=\int^\infty_\mu x·f(x)dx\\ E(X^2)=\int^\infty_\mu x^2·f(x)dx E(X)=μxf(x)dxE(X2)=μx2f(x)dx
然后样本的一阶矩和二阶矩为 X ‾ \overline{X} X 1 n ∑ i = 1 X i 2 \frac{1}{n}\sum_{i=1}X^2_i n1i=1Xi2,然后直接相等得解。

区间估计

在科学实验中总是会在测量结果上加一个误差范围。比如经过测量马云的智商是100,测量误差是±5。真实的智商值当然只有一个,但是这个数是多少,我们不知道,它可以是这个误差范围内的任何一个数字。真实的智商值当然只有一个,但是这个数是多少,我们不知道,它可以是这个误差范围内的任何一个数字。在统计概率中有个专门的名称来表示误差范围,叫置信区间。
同时,我们选择这个置信区间,目的是为了为了让“a和b之间包含总体平均值”这一结果具有特定的概率,这个概率就是置信水平。

标准差(标准差和数据的单位一致,使用起来方便)不是置信区间。
概论 之 极大似然估计,矩估计
每一个红点都是一次采样的均值,取95%的置信区间,我们发现基本上所有的区间估计都包含的真实的μ,除了红色的那一根。 去掉真实分布曲线后,我们虽然依然不知道哪个区间估计更好,但是我们知道,绝大部分的区间中都包含了真实的平均值。95%置信水平的意思现在我们就可以理解了,采用相同的步骤去选取样本,计算置信区间,在100次这样的独立过程中,会有95%的概率计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。

常用的置信水平有90%,95%,99%,其中又以95%置信水平最为常用。因为99%置信水平的准确度高,但是精度太差。90%置信水平的精度不错,但准确度又不足,而95%置信水平很好的平衡了准确度和精度。

但并不代表在置信区间内,有95%的概率包括真实参数,原因就在于,对于单次采样计算出来的一个置信区间,其中包含真值的概率我们是无从得知的。

那么置信区间实际上是样本的置信区间。置信水平是两臂的延展程度。大致概念就是这样的。

参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某些推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

1.估计量
参数的点估计就是根据样本构造一个统计量,作为总体未知参数的估计。设总体的X未知参数为seta,样本根据样本构造一个统计量(只依赖于样本,不含总体分布的任何参数。常用的统计量有样本矩,次序统计量:将样本按从小到大或者从大到小顺序排列,)作为未知参数的估计,则称这个统计量为未知参数的估计量。

2.无偏性
估计量抽样分布的数学期望等于总体参数的真值。如果总体参数为seta,seta1为估计量,如果E(seta1)=seta,那么seta1为seta的无偏估计量。seta1也是一个随机变量,它取决于样本,根据所选样本的不同而变化。

3.有效性
指估计量与总体参数的离散程度,如果两个估计量都是无偏的,那么离散程度较小的估计量相对来说是有效的,离散程度用方差来衡量。

4.一致性(相合性)
样本数目越大,估计量就越来越接近总体参数的真实值。如果seta1在seta周围震荡,那么满足无偏性却不满足一致性。