[ZFNet论文阅读] Visualizing and Understanding Convolutional Networks
论文地址:Visualizing and Understanding Convolutional Networks
概述
1.提出通过可视化feature map的方法来“诊断”网络,并提出比Alexnet更好的网络结构。
2.具体的可视化方法是用不参与训练的反卷积来将feature map还原到原图大小,如果是maxpooling操作,还需要在前馈时记录最大值的位置,unpooling的时候还原到最大值上。
3.通过比较特征图在不同的垂直平移,尺度和旋转下,比较和原图的差异,说明,输出结果对垂直平移和尺度的敏感性较小,对旋转较敏感(除了对一些具有旋转不变性的物体不敏感以外)
4.通过比较Alexnet和ZFNet的第一次和第二层特征,可以发现多个问题,然而我并没有看懂,下面贴原文,希望有人可以给出自己的理解。
5.通过遮挡实验证明,网络是可以定位到场景中某个具体的目标的(当目标被遮挡时,输出概率下降明显)
6.网络feature map的一致性分析,我又没看懂,求大神指教。
为什么说,从layer5能看出,网络隐式地建立了一定的对应关系;从layder7的相近得分,能猜测网络是为了区分狗的类别?
网络结构
实验结果
比较了一下各种