核函数

一、核函数的思想

这里我们讨论决策边界是复杂的非线性方程时的情况：

首先我们引入特征值f的概念：

核函数

我们介绍相似性函数和核函数的定义：

核函数

举例：我们选择3个标记点，你会发现当我们的数据x与给出的3个标记中的任意一个接近时，我们得到的相似度为1，否则为0。

核函数

当我们给出的x接近其中一个标记点时，相对应的f值为1，其他的f值为0，假设函数的结果也为1；

当我们给出的x不接近任何一个标记点时，f都为0，假设函数的结果为0.

从而我们可以画出值为1或0的决策边界，如红色的线。

核函数

二、核函数2

之前我们使用的标记点是我们自己随意画的，这里我们将所有的训练集或交叉测试集的数据做为标记点。

核函数

由于用训练集做为标记点，所以L1d=x1、L2=x2.....

核函数

所以这里svm的代价函数就发生了一点变化：核函数

核函数

再讨论偏差和方差折中的问题：

当c很大即核函数很小时，会导致低偏差、高方差；

当c很小即核函数很大时，会导致高偏差、低方差；

当核函数很大时，f曲线平缓，会导致高偏差、低方差；

当核函数很小时，f曲线陡峭，会导致低偏差、高方差；

核函数