语义分割-PSPNet(Pyramid Scene Parsing Network)

摘要

论文
Pyramid Scene Parsing Network

code
PSPNet.git

成绩
2016年ImageNet场景分类挑战赛第一,PASCAL VOC 2012数据集上语义分割第一 ,城市场景Cityscapes data数据集上第一。

主要贡献

  • 提出金字塔场景解析网络,提取困难场景中的上下文信息,嵌入基于FCN的像素预测的网络框架中。
  • 基于深度监督损失为ResNet网络制定有效的优化策略。
  • 为最优场景分类构建了一个实用的系统,其中包含了所有关键的实现细节。

baseline network
FCN and dilated network

mIoU accuracy

  • PASCAL VOC 2012:85.4%
  • Cityscapes:80.2%

数据集

ADE20K dataset
新的ADE20K 数据集包含150种对象类别标签和1038种图像级别场景描述。挑战数据被分成20k/2k/3k张图像进行训练、验证和测试。

Cityscapes
Cityscapes是最近发布的用于城市场景语义理解的数据集。包含50个不同城市不同季节的5000个像素级精细注释的高质量图像。2975500张图像用于训练,1525张图像用于测试。定义了19个对象类别。为了比较使用精细数据训练和使用精细和粗略数据训练的差异,提供了20000个粗略注释的图像。

网络架构

语义分割-PSPNet(Pyramid Scene Parsing Network)

结果

语义分割-PSPNet(Pyramid Scene Parsing Network)

语义分割-PSPNet(Pyramid Scene Parsing Network)

参考文献

https://blog.****.net/u011961856/article/details/77165427