机器学习实战——k-近邻算法概述
k近邻算法是最基础的分类算法,它的原理很简单,就是拿当前的测试样本与训练样本集中的所有样本进行比较,采用欧式距离进行比较。
然后按照距离大小进行排序,从小到大排。然后在根据k的数值,选取前k个训练样本的分类结果进行统计,统计结果中出现的类别次数最多的类别,即为测试样本的类别。
下面把书上的代码贴出来,解释每一句:
注意:这里的dataSet类型为array,为什么后面会讲
下面是classify0,屏幕不够大,只能分段截图了
以上就是理论部分的所有代码了,第一章的理论部分没啥好讲的,就这样