图解Mean-Shift聚类算法

前期回顾

与K-Means算法不一样的是，Mean Shift 算法可以自动决定类别的数目。与K-Means算法一样的是，两者都用集合内数据点的均值进行中心点的移动。

声明

以下部分内容来源于：meanshift算法

Mean Shift算法原理

meanshift 算法其实通过名字就可以看到该算法的核心，mean(均值)，shift(偏移)，简单的说，也就是有一个点 $x$ ,它的周围有很多个点 $x_i$ 我们计算点 $x$ 移动到每个点 $x_i$ ，所需要的偏移量之和，求平均，就得到平均偏移量，（该偏移量的方向是周围点分布密集的方向）该偏移量是包含大小和方向的。然后点 $x$ 就往平均偏移量方向移动，再以此为新的起点不断迭代直到满足一定条件结束。

图解如下:
图解Mean-Shift聚类算法
中心点 $x$ 周围的小红点就是 $x_i$ ，黄色的箭头就是我们求解得到的平均偏移向量。那个“圆圈”就是我们的限制条件，或者说在图像处理中，就是我们搜索迭代时的窗口大小。不过在opencv中，我们一般用的是矩形窗口，而且是图像，2维的。这里其实不是圆，而是一个高维的球。

步骤：

首先设定起始点 $x$ ，我们说了，是球，所以有半径 $h$ ，所有在球内的点就是 $x_i$ , 黑色箭头就是我们计算出来的向量 , 将所有的向量进行求和计算平均就得到我们的meanshift 向量，也就是图中黄色的向量。
以meanshift向量的重点为圆心，再做一个高维的球，如下图所示，重复上面的步骤，最终就可以收敛到点的分布中密度最大的地方

最终结果如下：

图解Mean-Shift聚类算法

Mean Shift算法原理

相关推荐