这节课基于上节课台大机器学习基石 Lecture 6 - Theory of Generalization 与break point的关联，研究了的上界是否为多项式的问题，得到结论为多项式上界，并将其代入Hoeffding不等式，得到VC Bound，证明只要break point存在，机器学习就是可行的。

台大机器学习基石 Lecture 6 - Theory of Generalization

Restriction of Break Point

我们先看一下四个成长函数与break point的关系：

台大机器学习基石 Lecture 6 - Theory of Generalization

成长函数台大机器学习基石 Lecture 6 - Theory of Generalization 是一个hypothesis在N个数据点上可以产生的dichotomy数量的最大值。k为最小的break point，那么k + 1, k + 2...都是break point。

那么我们看一下当最小的break point限定为k = 2时能产生多少dichotomies？（也就是任意两个点都不能shatter，shatter的意思是对N个点，能够分解为台大机器学习基石 Lecture 6 - Theory of Generalization 种dichotomies）

N = 1，从定义上显然；
N = 2，从定义上也有；
N = 3，我们可以从1开始尝试dicotomy的个数：1（ooo）、2（ooo、oox）、3（ooo、oox、oxo）、4（ooo、oox、oxo、xoo），若增加到5时必定会有两个点shatter，所以最大的。

我们发现存在break point时会对台大机器学习基石 Lecture 6 - Theory of Generalization 最大值的大小产生限制，所以我们要尝试通过N与k来证明是多项式级的，才能代入Hoeffding不等式，证明机器学习的可行性。

Bounding Function: Basic Cases

引入一个定义：上界函数（Bounding Function）台大机器学习基石 Lecture 6 - Theory of Generalization ，表示了当break point = k时可能的最大值。

从而我们只要对上界函数进行描述，就可以不考虑Hyphesis set的情况，不用因为问题的变化而有改变，这样就能简化我们的研究复杂程度。

我们可以通过下面这张表来尝试得到台大机器学习基石 Lecture 6 - Theory of Generalization 的分布情况——

台大机器学习基石 Lecture 6 - Theory of Generalization

其中，根据之前的计算就能知道台大机器学习基石 Lecture 6 - Theory of Generalization 和；当k = 1时，任意的N取值都只会有一种“划线”方式，（画画图就能看出来）；当时，则所有的dichotomy都能满足条件，此时；当N == k时，k = N是第一个不能shatter的值，所以去掉一个dichotomy就可以了，此时台大机器学习基石 Lecture 6 - Theory of Generalization 。

其它更加常见的台大机器学习基石 Lecture 6 - Theory of Generalization 的求值比较复杂一些，相关的证明也留到下一小节。

Bounding Function: Inductive Cases

先以台大机器学习基石 Lecture 6 - Theory of Generalization 为例，寻找是否有递推关系。先把可行的11条Dichotomies写下来并分组，如下——

台大机器学习基石 Lecture 6 - Theory of Generalization

我们发现右图前8条是两两配对的，后3条是独立的，于是就有台大机器学习基石 Lecture 6 - Theory of Generalization （）。

根据定义，中是不存在3个点shatter的，那么中也是不存在3个点shatter的，于是；
由于在中是成对出现，且两两不同，于是必然有中是成对交错的，就可以将划去，原先任三个点不会shatter，在中就有任意两个点不会shatter的结论，于是有。

根据以上两点结论，我们可以将不等式左右相加，得到——

台大机器学习基石 Lecture 6 - Theory of Generalization

根据数学归纳法，就能够得到递推式结论：台大机器学习基石 Lecture 6 - Theory of Generalization ，得到通项式结论为。

最大项也就是台大机器学习基石 Lecture 6 - Theory of Generalization ，证明了如果存在break point，的上界就为多项式级的。

上式中 “ 台大机器学习基石 Lecture 6 - Theory of Generalization ” 可以通过数学严格证明为 “” ，课程中不做要求。

A Pictorial Proof

现在我们知道了，台大机器学习基石 Lecture 6 - Theory of Generalization 有多项式级上界，如果能替代M代入Hoeffding不等式，就能得到的结论。然而并不是直接代入就可以的，需要做一点变化，这样的原因是是有限的，而是无限的，实际的式子如下——

台大机器学习基石 Lecture 6 - Theory of Generalization

这个式子的证明比较复杂，数学推导不在课程中要求，主要分成以下三步——

台大机器学习基石 Lecture 6 - Theory of Generalization

我们要将无限的台大机器学习基石 Lecture 6 - Theory of Generalization 用有限的替换，也就是另外找一个大小为N的verification set来计算。这里要将变为，满足数学上条件更严格的需要。

台大机器学习基石 Lecture 6 - Theory of Generalization

现在的Hypothesis set变为了台大机器学习基石 Lecture 6 - Theory of Generalization ，与之前同理，总共最多有种hypothesis，然后再用union bound就能精确计算有多少BAD是重叠发生的。

台大机器学习基石 Lecture 6 - Theory of Generalization

到现在我们有了一个固定的hypothesis set，可以想象有2N个点的罐子，从中抽取N个点作为台大机器学习基石 Lecture 6 - Theory of Generalization ，剩余N个点作为，也就是用更小的罐子中采用更小的做无放回抽样。这样就可以直接将式子代入Hoeffding's equality，得到结果。

台大机器学习基石 Lecture 6 - Theory of Generalization

现在我们就得到了著名的VC Bound。

2D Perception的情况下，就有break point = 4，台大机器学习基石 Lecture 6 - Theory of Generalization 是多项式上界的，从而证明2D Perception的学习是可行的。

台大机器学习基石 Lecture 6 - Theory of Generalization

这个题目说明了，VC Bound并不是一个很小的很准确的上界，那么为什么它这么有用？

下节课继续讲解。

台大机器学习基石 Lecture 6 - Theory of Generalization

Restriction of Break Point

Bounding Function: Basic Cases

Bounding Function: Inductive Cases

A Pictorial Proof

相关推荐