核函数

一、核函数的思想

这里我们讨论决策边界是复杂的非线性方程时的情况:

首先我们引入特征值f的概念:

核函数

我们介绍相似性函数和核函数的定义:

核函数

核函数

举例:我们选择3个标记点,你会发现当我们的数据x与给出的3个标记中的任意一个接近时,我们得到的相似度为1,否则为0。

核函数

当我们给出的x接近其中一个标记点时,相对应的f值为1,其他的f值为0,假设函数的结果也为1;

当我们给出的x不接近任何一个标记点时,f都为0,假设函数的结果为0.

从而我们可以画出值为1或0的决策边界,如红色的线。

核函数

 

二、核函数2

之前我们使用的标记点是我们自己随意画的,这里我们将所有的训练集或交叉测试集的数据做为标记点。

核函数

由于用训练集做为标记点,所以L1d=x1、L2=x2.....

核函数

所以这里svm的代价函数就发生了一点变化:核函数

核函数

再讨论偏差和方差折中的问题:

当c很大即核函数很小时,会导致低偏差、高方差;

当c很小即核函数很大时,会导致高偏差、低方差;

核函数很大时,f曲线平缓,会导致高偏差、低方差;

核函数很小时,f曲线陡峭,会导致低偏差、高方差;

核函数