数据驱动的图像分类方式：K最近邻与线性分类器

最邻近规则分类器KNN

简单描述：首先在n个数据集中指定m个分类，这是学习过程。在使用中，对于新输入的数据，计算其k范围内，或者最邻近的k个点，根据多数表决规则，决定其属于m分类中的哪个分类。

关于距离：

可以使用马哈顿距离、欧式距离等。

关于多数表决原则：

等价于经验风险最小化。

关于具体实现：

kd树。

线性分类器

两张图片，一张猫的，一张狗的如何分类？

数据驱动的图像分类方式：K最近邻与线性分类器

如图所示，为数据驱动的图像分类方式：K最近邻与线性分类器的图片，可以拉伸为的一维数组，构建一个有的神经元的网络，根据如下公式。

数据驱动的图像分类方式：K最近邻与线性分类器，其中xi和b为权值。

得到一个实数输出，根据这个实数输出得到图片的分类。

数据驱动的图像分类方式：K最近邻与线性分类器

可以看到，由于xi值得不同，线性分类器得到不同的输出，这时候根据是否大于零就可进行分类了。

可以看到分类器没有利用像素之间的空间关系，所以实际上分类效果很差。

在实际使用中，需要手动对图片进行标记，是一种最简单的有监督学习，而后根据人工标记的正确分类调整wi，从而让输入的分类和实际分类是一样的。

关于线性分类器的训练。

下一节学习。