机器学习基石-07-1-Definition of VC Dimension

VC维-how to use break point？

上一节课的结论：

More on growth function

可以明显地看到右边的数值比左边大，所以可以适当地再放宽不等式一点。

More on vc Bound

在假定集H中有任何一个假设发生“坏事情”的几率很小很小。既然已经保证了大部分的时间假设都不会发生“坏事情”，所以不论选择哪种算法，通过算法找到的g都会使得Ein(g)很接近Eout(g)。再结合上面的公式可以得到：

好的H就是他的成长函数要在k的地方露出一线曙光，也就是必须存在break point。

好的算法就是尽可能地使得Ein(g)越小越好！

第1,2步是testing，第3步是training。

VC维-最大的non-break point，也就是k-1，其中k是最小的break point。

四种VC维

在positive intervals上VC维=3-1=2，也就是在2个点时可以shatter，2个点以上一定不能shatter！

在convex sets上VC维是无穷大，不是好的VC维。

VC维 and learning

也就是在最坏的情况下，还是保证Ein(g)和Eout(g)很接近！

fun time

不能根据N个inputs是否能shatter来判断N和VC维的大小关系。在这N笔中不能被shatter，但如果在另外一笔N个inputs时可以被shatter，那么就是VC维>N；但是如果另外的任意一笔N个inputs都不能被shatter，则满足VC维<N。所以并不能得到确切的大小关系。选4

机器学习基石-07-1-Definition of VC Dimension

相关推荐