[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

论文地址:Visualizing and Understanding Convolutional Networks

概述

1.提出通过可视化feature map的方法来“诊断”网络,并提出比Alexnet更好的网络结构。

2.具体的可视化方法是用不参与训练的反卷积来将feature map还原到原图大小,如果是maxpooling操作,还需要在前馈时记录最大值的位置,unpooling的时候还原到最大值上。

3.通过比较特征图在不同的垂直平移,尺度和旋转下,比较和原图的差异,说明,输出结果对垂直平移和尺度的敏感性较小,对旋转较敏感(除了对一些具有旋转不变性的物体不敏感以外)

4.通过比较Alexnet和ZFNet的第一次和第二层特征,可以发现多个问题,然而我并没有看懂,下面贴原文,希望有人可以给出自己的理解。

[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

5.通过遮挡实验证明,网络是可以定位到场景中某个具体的目标的(当目标被遮挡时,输出概率下降明显)

[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

6.网络feature map的一致性分析,我又没看懂,求大神指教。

[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

为什么说,从layer5能看出,网络隐式地建立了一定的对应关系;从layder7的相近得分,能猜测网络是为了区分狗的类别?

网络结构

[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks

实验结果

比较了一下各种

总结

注:个人总结,如有错误,欢迎指正。