语义分割-PSPNet(Pyramid Scene Parsing Network)
摘要
论文
Pyramid Scene Parsing Network
code
PSPNet.git
成绩
2016年ImageNet场景分类挑战赛第一,PASCAL VOC 2012数据集上语义分割第一 ,城市场景Cityscapes data数据集上第一。
主要贡献
- 提出金字塔场景解析网络,提取困难场景中的上下文信息,嵌入基于FCN的像素预测的网络框架中。
- 基于深度监督损失为ResNet网络制定有效的优化策略。
- 为最优场景分类构建了一个实用的系统,其中包含了所有关键的实现细节。
baseline network
FCN and dilated network
mIoU accuracy
- PASCAL VOC 2012:85.4%
- Cityscapes:80.2%
数据集
ADE20K dataset
新的ADE20K 数据集包含150种对象类别标签和1038种图像级别场景描述。挑战数据被分成20k/2k/3k张图像进行训练、验证和测试。
Cityscapes
Cityscapes是最近发布的用于城市场景语义理解的数据集。包含50个不同城市不同季节的5000个像素级精细注释的高质量图像。2975500张图像用于训练,1525张图像用于测试。定义了19个对象类别。为了比较使用精细数据训练和使用精细和粗略数据训练的差异,提供了20000个粗略注释的图像。