【实例分割】SOLO：Segmenting Objects by Locations

相关工作
模型结构
实验

实例分割主要有两大类别，而这两大类方法都不够直接。

自上而下即detect-then-segment：太依赖于目标检测的准确率
自下而上：为每个像素学习一个嵌入向量（有点像Cornernet），该方法依赖于每个像素的嵌入学习和分组后处理。

出发点：一张图片中的实例基本的不同是什么？要么具有不同的中心点，要么具有不同的大小。所以是否可以直接利用这两个信息去区分实例？
实现：引入”实例类别“，也就是量化的中心点位置和物体大小，根据实例的位置和大小为实例中的每个像素分配类别。

中心点位置
一张图片可以被分为 $S\times S$ 个网格，所以定义 $S^2$ 个中心点位置类别。将这些类别加在通道上，对应的通道负责对应网格的实例掩码。
大小
利用FPN来预测多种尺度大小的实例。

模型结构

【实例分割】SOLO：Segmenting Objects by Locations
如何解决卷积带来的平移不变性？
创建一个与输入相同的空间大小的张量，其中包含像素坐标，这些坐标被标准化至[-1，1]。若原始输入大小为 $H\times W\times D$ ，则新输入张量的大小为 $H\times W\times (D+2)$ ，其中最后两个通道为 $xy$ 像素坐标，从而提供全局位置信息。
【实例分割】SOLO：Segmenting Objects by Locations
对于类别预测分支，当网格 $(i,j)$ 和center region有大于阈值的重叠的则认为是正例。center region定义为 $(c_x,c_y,\epsilon w,\epsilon h)$ 的区域，中心点并不是bbox的中心，而是质心，其中 $\epsilon=0.2$ 。这来源于center sampling，在Foveabox和FCOS中都有所体现。对于每个正例都有一个二值的mask，也就是在上分支中标记出正例所在的grid后，找到其所对应下分支 $S^2$ 的通道中的一个通道进行标注。

【实例分割】SOLO：Segmenting Objects by Locations

实验

【实例分割】SOLO：Segmenting Objects by Locations

【实例分割】SOLO：Segmenting Objects by Locations

【实例分割】SOLO：Segmenting Objects by Locations

相关工作

模型结构

实验

相关推荐