机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

当有一个蓝色点位于如下位置时,变成了一个线性不可分的问题。

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

 

Soft Margin SVM

1. 目的

        让分类错误的点越少越好,而不是必须将所有点分类正确,也就是允许有noise存在。这种做法很大程度上不会使模型过于复杂,不会造成过拟合,而且分类效果是令人满意的。

2. 宽松约束条件:

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化),其中机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)。对每个数据点都有对应的容错空间 机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化) 。

即允许一些数据点在如下直线与虚线之间(可以犯一定错误):

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

则最优化问题变成:机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化) 

由于前后重要性不是1:1的关系,则可在后式加上系数C平衡两部分所占比例:机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)(C为新的超参数)。

 

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

s.t.  机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

 

3. 上式的L1正则和L2正则:

(1)L1正则:

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

s.t.  机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

(2)L2正则:

机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)

s.t.  机器学习 -- 支持向量机SVM(Ⅲ Soft Margin和SVM的正则化)