神经网络的一些碎片知识

Hourglass网络(堆叠沙漏网络),首先进行卷积池化处理,并进行多次下采样操作,获得一些分辨率较低的特征,从而降低计算的复杂度,为了使图像特征的分辨率上升,紧接着多次上采样。上采样使得图像的分辨率增高,同时更有能力预测物体的准确位置
神经网络的一些碎片知识
使用residual模块提取较高层次的特征,同时保持原有层次的信息,
神经网络的一些碎片知识
那么为什么上采样和下采样到同一种大小的特征图进行组合的时候,可以得到理想的效果呢?
首先要清楚上采样与下采样的关系
下采样,就是缩小图片。
上采样,就是放大原始图像。
对于图片的缩放并不能带来关于更多的图片的信息,图片的质量不可避免的受到影响,有些缩放方法可以增强图片的信息,缩放后的图像的质量超过原始的图像
关于采样与池化的关系:其实下采样就是池化
采样层是使用 pooling的相关技术来实现的,目的就是用来降低特征的维度并保留有效信息,一定程度上避免过拟合。**但是pooling的目的不仅仅是这些,他的目的是保持旋转、平移、伸缩不变形等。采样有最大值采样,平均值采样,求和区域采样和随机区域采样等。**池化也是这样的,比如最大值池化,平均值池化,随机池化,求和区域池化等

下采样原理:对于一幅图像I尺寸为MN,对其进行s倍下采样,即得到(M/s)(N/s)尺寸的得分辨率图像,当然s应该是M和N的公约数才行,如果考虑的是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值:
上采样原理:图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。