卷积神经网络-Deformable Convolutional可变形卷积详解[下]

AI研习图书馆，发现不一样的世界

Deformable Convolutional——可变形卷积

在深度学习的计算机视觉任务中，如果使用可变形卷积，则可以显著提升Faster R-CNN和R-FCN等算法在物体检测和分割上的性能。只需要增加很少的计算量，就可以得到性能的提升，Deformable Convolutional，非常好的文章，值得一看~

5. 消融研究和实验结果

5.1 使用可变形卷积在不同数量的最后几层上

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

3和6个可变形卷积也很好。最后，作者选择3，因为可以很好地权衡用于不同的任务。
我们还可以看到DCN改进了DeepLab，class-aware RPN(或认为是简化的SSD），fast - R-CNN和R-FCN

5.2. 可变形卷积偏移距离分析

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

上述分析亦说明了DCN的有效性。首先，根据ground truth bound
box标注和滤波器中心的位置，将可变形卷积滤波器分为四类：small、medium、large和background。
然后测量膨胀值(偏移距离)的均值和标准差。发现可变形滤波器的感受野大小与目标大小相关，说明可以有效地从图像内容中学习变形。
背景区域的滤波器大小介于中、大物体之间，说明识别背景区域需要较大的感受野。

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

与可变形RoI pooling类似，现在部分被偏移以覆盖非刚性物体。

5.3 在PASCAL VOC上和Atrous卷积对比

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

只使用可变形卷积：DeepLab，class-aware RPN， R-FCN使用可变形卷积都得到了改进，已经优于使用atrous
convolution实现的DeepLab，RPN和R-FCN。与atrous convolution相比，Faster
R-CNN使用可变形卷积更具有竞争优势。
只使用Deformable RoI Pooling：在Faster R-CNN和R-FCN中只使用Deformable RoI
Pooling。对于Faster-RCNN，两者差不多，对于R-FCN，Deformable RoI Pooling更好。
使用可变形卷积和Deformable RoI Pooling：对于Faster
R-CNN和R-FCN，使用可变卷积核可变ROI池化效果是最好的。

5.4 PASCAL VOC上的模型复杂度和运行时间

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

可变形卷积只在模型参数和计算上增加很小的开销
除了增加模型参数之外，显著的性能改进来自于模型几何变换的能力。

英文原文：英文文献

卷积神经网络基础知识系列笔记不断更新中，学习笔记，在此记录~

推荐阅读文章
[1] AI入门-人工智能的前世今生
[2] AI入门-深度学习综述
[3] AI入门-计算机视觉学习指南[附资源]
[4] 深度学习框架总结—国际篇
[5] 深度学习-CNN结构设计技巧
[6] 资源分享-深度学习及数据分析等资源合集
[7] 今日分享—统计学习方法
[8] 算法总结—人脸检测算法
[9] 目标检测算法-YOLOv4
[10] 项目总结—人脸检测
[11] 项目实战-人脸口罩检测
[12] 深度学习基础-二十种损失函数
[13] 深度学习-目标检测的十九个研究方向
[14] 项目实战-车辆检测案例实现
[15] Python学习-实战小案例
[16] 数据结构与算法-Python语言案例实现
…

AI研习图书馆

转载是一种动力分享是一种美德

关注AI研习图书馆，发现不一样的精彩世界
卷积神经网络-Deformable Convolutional可变形卷积详解[下]

卷积神经网络-Deformable Convolutional可变形卷积详解[下]

Deformable Convolutional——可变形卷积

5. 消融研究和实验结果

5.1 使用可变形卷积在不同数量的最后几层上

5.2. 可变形卷积偏移距离分析

5.3 在PASCAL VOC上和Atrous卷积对比

5.4 PASCAL VOC上的模型复杂度和运行时间

相关推荐