不同特点的数据处理(笔记)1

不同特点的数据处理(笔记)1

钟形数据

正态分布,又称高斯分布,钟性分布。其曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。不同特点的数据处理(笔记)1

上述数据是二分类数据,y=1 or 2,有每个样本两个特征x1,x2。把数据画在二维坐标上,一类数据包围另一类,因此想到选择中心,比如(0,0),用高斯核函数,把二维数据处理成三维数据x1,x2,x3,其中x3是Gussian(x1,x2)。则黄色类数据在x3维度上会处于紫色类数据中间,变成线性可分。

更详细可以参照SVM—通俗易懂图解高斯核函数及实现