目标检测之Selective Search原理

对于目标检测往往第一步就是生成可能的region proposal,但是region proposal是如何获取的?

下面介绍一下最常见的方法Selective Search方法。

首先通过简单的区域划分算法,将图片划分成很多小区域,再通过相似度和区域大小(小的区域先聚合,这样是防止大的区域不断的聚合小区域,导致层次关系不完全)不断的聚合相邻小区域。

那么如何进行合并聚合呢?

目标检测之Selective Search原理

即是:

step0:生成区域集R。
step1:计算区域集R里每个相邻区域的相似度S={s1,s2,…}。
step2:找出相似度最高的两个区域,将其合并为新集,添加进R。
step3:从S中移除所有与step2中有关的子集。
step4:计算新集与所有子集的相似度。
step5:跳至step2,直至S为空。

其中每次产生的图像块包括合并的图像块我们都保存下来。

如何计算相似性呢?

为了保持合并多样性策略,可以采用多种方法来保证候选区域的多样性:

  • 多种颜色空间,考虑RGB、灰度、HSV及其变种等
  • 多种相似度度量标准,既考虑颜色相似度,又考虑纹理、大小、重叠情况等。
  • 通过改变阈值初始化原始区域,阈值越大,分割的区域越少。

当然,生成了候选区域之后,还可以进一步优化,减少候选区域,具体方法这里就不一一介绍了。