大数定律与中心极限定理
学习目标: Be able to use the central limit theorem to approximate probabilities of averages and sums of independent identically-distributed random variables.
Sample Mean
Suppose
为了更好地理解 sample mean,下面我来举例说明一下。现在让我们进行投硬币实验,如果我们投的次数越多,出现正反面的次数会接近相同,这不难理解。在这个实验中,每个随机变量
Randomness being what it is, this is not guaranteed; for example we could get 100 heads in 100 flips, though the probability of this occurring is very small. So our intuition translates to: with high probability the sample mean
由于
The law of large numbers
大数定律告诉我们:The average of many independent samples is (with high probability) close to the mean of the underlying distribution. 举个例子说明一下大数定律所表达的含义。如下图所示,当我们投掷一个骰子的次数超过400次时,我们观察到的 sample mean 会非常接近于理论上的期望值(期望不是随机变量,而是一个确定的值)。因此,大数定律告诉我们:当实验的数目足够大时,sample mean 会等于真正的 mean.
接下来,我给出大数定律准确的数学定义:
Suppose
X1,X2,⋯,Xn,⋯ are i.i.d. random variables with meanμ and varianceσ2 . For each n, letX¯n be the average of the first n variables. Then for anyϵ > 0, we havelimn→∞P(|X¯n−μ|<ϵ)=1
Think ofϵ as a small tolerance of error from the true meanμ .
在证明大数定律之前,我们需要先了解一下 Markov inequalities, Chebyshev inequalities, and convergence in probability.
Markov inequalities
Markov 不等式把概率与期望关联起来,定义如下:
If X is a nonnegative random variable and
a>0 , then the probability that X is no less than a is no greater than the expectation of X divided by a:P(X≥a)≤E[X]a
关于这个不等式的证明参考 Lecture 19 中的 5:40 处开始。
Chebyshev inequalities
切比雪夫不等式定义:Let X (integrable) be a random variable with finite expected value
令
关于它的证明如下图所示:
Convergence in probability
如果你学过微积分,你一定知道什么是序列(sequence)收敛吧。关于序列收敛的数学定义为:对于任何的
Convergence in probability 与上面的收敛类似。假设
那么如何来理解上面的定义呢?其实也与序列的收敛类似,序列中是一系列的实数,而这是一系列的随机变量,每个随机变量都有相应的分布。假设
为了验证大家的理解,让我们用 Convergence in probability 来解释一下大数定律。上面我已经说过了,sample mean
1、当n=10时,即抛了10次硬币,我们会得到1个 sample mean
2、当n=1000时,我们同样也会得到1个 sample mean
3、当
大数定律的证明
假设
The Central Limit Theorem
中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经标准化后依分布收敛于正态分布。关于详细的一些公式参考下面2幅图。这里我解释一下下图红框中的公式:当
为了让大家更好地理解中心极限定理,这里我给大家举一个投票的例子。美国在确定下一界总统是谁之前,社会上通常做一些民意调查,然后来预测哪个候选人会更有可能当选。假设有2个候选人 A 和 B,进一步假设在整个美国的人口中,支持 A 的比例为
假设我们在这次民调中,一共随机选择了 n 个人,因此我们可以把这次调查看作是连续 n 次的 Bernoulli (
已知上面这些条件,结合中心极限定理可得:
如果解读上面的分布呢?在正态分布中,95% 的概率都落入了 mean 的2个标准差之内。这意味着,95% 的 sample mean
Since the probabilities in the above examples can be computed exactly using the binomial distribution, you may be wondering what is the point of finding an approximate answer using the CLT. In fact, we were only able to compute these probabilities exactly because the
参考资料
https://engineering.purdue.edu/~ipollak/ece302/SPRING12/notes/26_Limit_Theorems_1_WLLN_packed.pdf