卷积神经网络-Deformable Convolutional可变形卷积详解[下]
AI研习图书馆,发现不一样的世界
Deformable Convolutional——可变形卷积
在深度学习的计算机视觉任务中,如果使用可变形卷积,则可以显著提升Faster R-CNN和R-FCN等算法在物体检测和分割上的性能。只需要增加很少的计算量,就可以得到性能的提升,Deformable Convolutional,非常好的文章,值得一看~
5. 消融研究和实验结果
5.1 使用可变形卷积在不同数量的最后几层上
- 3和6个可变形卷积也很好。最后,作者选择3,因为可以很好地权衡用于不同的任务。
- 我们还可以看到DCN改进了DeepLab,class-aware RPN(或认为是简化的SSD),fast - R-CNN和R-FCN
5.2. 可变形卷积偏移距离分析
-
上述分析亦说明了DCN的有效性。首先,根据ground truth bound
-
box标注和滤波器中心的位置,将可变形卷积滤波器分为四类:small、medium、large和background。
-
然后测量膨胀值(偏移距离)的均值和标准差。 发现可变形滤波器的感受野大小与目标大小相关,说明可以有效地从图像内容中学习变形。
-
背景区域的滤波器大小介于中、大物体之间,说明识别背景区域需要较大的感受野。
- 与可变形RoI pooling类似,现在部分被偏移以覆盖非刚性物体。
5.3 在PASCAL VOC上和Atrous卷积对比
-
只使用可变形卷积:DeepLab,class-aware RPN, R-FCN使用可变形卷积都得到了改进,已经优于使用atrous
convolution实现的DeepLab,RPN和R-FCN。与atrous convolution相比,Faster
R-CNN使用可变形卷积更具有竞争优势。 -
只使用Deformable RoI Pooling:在Faster R-CNN和R-FCN中只使用Deformable RoI
Pooling。对于Faster-RCNN,两者差不多,对于R-FCN,Deformable RoI Pooling更好。 -
使用可变形卷积和Deformable RoI Pooling:对于Faster
R-CNN和R-FCN,使用可变卷积核可变ROI池化效果是最好的。
5.4 PASCAL VOC上的模型复杂度和运行时间
-
可变形卷积只在模型参数和计算上增加很小的开销
-
除了增加模型参数之外,显著的性能改进来自于模型几何变换的能力。
英文原文:英文文献
卷积神经网络基础知识系列笔记不断更新中,学习笔记,在此记录~
推荐阅读文章
[1] AI入门-人工智能的前世今生
[2] AI入门-深度学习综述
[3] AI入门-计算机视觉学习指南[附资源]
[4] 深度学习框架总结—国际篇
[5] 深度学习-CNN结构设计技巧
[6] 资源分享-深度学习及数据分析等资源合集
[7] 今日分享—统计学习方法
[8] 算法总结—人脸检测算法
[9] 目标检测算法-YOLOv4
[10] 项目总结—人脸检测
[11] 项目实战-人脸口罩检测
[12] 深度学习基础-二十种损失函数
[13] 深度学习-目标检测的十九个研究方向
[14] 项目实战-车辆检测案例实现
[15] Python学习-实战小案例
[16] 数据结构与算法-Python语言案例实现
…
AI研习图书馆
转载是一种动力 分享是一种美德
关注AI研习图书馆,发现不一样的精彩世界