《统计学习方法》—— K近邻法

前言

k近邻法是一种特别好理解的算法。但是即便如此,学完这一章也接触到了很多新的东西。

关键知识点

k近邻法的三个基本要素
  • 模型
  • 距离度量
  • k值的选择
Lp距离,又叫Minkowski距离

《统计学习方法》—— K近邻法

  • 有趣的一点是,允许p<1,则有如下图示,在p取各种不同值时,与原点的Lp距离为1的点的图形

《统计学习方法》—— K近邻法

kd树
  • 平衡kd树的构造
    • 书中提到使用中位数来构造平衡kd树。有一点没有说清楚的是:是先算中位数,然后取大于且最靠近中位数的实例点,作为切分点。
  • kd树的搜索
    • 书中提到的搜索算法是从根节点出来,定位到包含目标点的区域对应的叶子节点,然后再从下往上依次判断。实际上有另一种方法,就是直接从根节点开始判断,具体算法参考[#1]

TODO

#1 如何理解?

Lp距离中,p取无穷大时的情况。

#2 如何理解?

平衡的kd树搜索时的效率未必是最优的。

参考材料

#1 K-D TREE算法原理及实现
https://leileiluoluo.com/posts/kdtree-algorithm-and-implementation.html/