您的位置: 首页 > 文章 > SVM

SVM

分类: 文章 • 2023-11-27 11:00:04

间隔与支持向量机
目的：在样本空间中找到一个划分超平面，将不同类别的样本分开。
在样本空间中，超平面的方程可以通过线性方程来表示
SVM 1
w=(w1,w2…wd)为法向量，决定超平面的方向，b为位移项，决定了超平面与远点之间的距离。
样本空间中任意一点到该平面的距离为：
SVM 2
设超平面（w,b）能将训练样本正确分类，即对于（wi,yi）属于D,若取值为+/-1

SVM 3
使得3式成立的训练样本点被称为支持向量，两个异类支持向量到超平面的距离为：

SVM 4
4式被称为间隔，
要找到最大间隔，就是要找到能满足1式中约束参数的w和b，使得r最大

SVM 5
为最大间隔化，需将||w||-1，等价于最小化||w||2,于是得

SVM 6
这就是支持向量机SVM的基本型。
对偶问题：
求解6式得到最大间隔划分超平面所对应的模型
SVM 7
利用拉格朗日乘子法，对6式加入拉格朗日乘子，其拉格朗日函数为：
SVM 8
对w和b求偏导，带入8式，可以消去w和b，
SVM 9
得到6.6式的对偶问题

SVM 10
当约束条件为不等式时，需要满足KKT条件

SVM

支持向量机的一个重要性质为：训练完成后，大部分的训练样本都不需要保留，最终的模型与支持向量有关。

SMO算法的基本思想：先固定ai之外的所有参数，然后求解ai上的极值，存在约束条件aiyi=0(i=1,2,3…m),如果固定ai之外的其他变量，则ai可由其他变量导出，所以SMO每次选择两个变量ai和aj，并固定其他参数，正在参数初始化后，SMO不断执行如下两个步骤，直到收敛

1，选取一对需要更新的变量ai和aj
2，固定ai和aj以外的参数，求解最终的对偶问题10。

核函数：将样本从原始空间映射都爱高维空间的得变换。

SVM

核函数广泛应用的原因：

1，核函数引入避免了位数灾难，减少了计算量，输入空间的维数n对核函数矩阵无影响，所以核函数能够有效初六高维输入。
2，无需知道非线性变换函数的形式和参数。
3，核函数方法可以和不同的算法相结合，形成不同的基于核函数技术的大方法，且这两部分可以单独记性，并为不同的应用选择不同的核函数的算法。