因果卷积,膨胀卷积,混合膨胀卷积
因果卷积:
常常用于CNN网络来处理序列问题,针对序列问题x1,...xt,和y1,...,yt-1来预测yt。
时间t的状态预测依赖于前t-1个状态,具有因果关系。
如果考虑很久之前的变量x,就会导致卷积层数的增加。网络过于深会带来梯度下降,训练复杂,拟合效果不好的问题,因此提出了空洞卷积。
膨胀卷积(空洞卷积)
个人理解觉得膨胀卷积是因果卷积的变种。 在卷积核中增加空洞来增加感受野,不增加过多计算。
普通卷积有着3*3的卷积核 空洞卷积有着3*3的卷积核,空洞rate为2
可以使得神经网络在同样的层数下,拥有更大的感受野。。
空洞卷积存在的问题:
空洞卷积的卷积核不连续,不是所有的信息参与了计算,导致信息连续性的损失,引起栅格效应。
对于识别大物体有利,如何也适用于小物体有待于改进。
Hybrid dilated conv 混合膨胀卷积
混合膨胀卷积是针对膨胀卷积存在的问题所提出的,对比膨胀卷积,主要包含以下三方面的特征:
- 叠加的膨胀卷积的膨胀率dilated rate不能有大于1的公约数(比如[2, 4, 6]),不然会产生栅格效应
- 膨胀率dilated rate设计成了锯齿状结构,例如[1, 2, 5, 1, 2, 5]这样的循环结构
- 膨胀率dilated rate需要满足:
. 其中
是第i层的膨胀率dilated rate,
是指在i层的最大dilation rate,假设总共有n层,那么
.一个简单的例子是:
dilated rate[1, 2, 5] with 3*3 kernel
Dilated Convolution和HDC的对比试验: