Atrous convolutions spatial pyramid network for crowd counting

Atrous convolutions spatial pyramid network for crowd counting

论文链接:https://www.sciencedirect.com/science/article/pii/S0925231219304059

简介:作者设计了一个更深的网络,称为ACSPNet,该网络具有权重和特征共享,以统计人数并估算全分辨率密度图。在空间金字塔层使用具有3×3核的无规卷积进行尺度感知特征提取,以在保持分辨率的同时扩大接收尺度。跳过连接用于集成多尺度语义并以比多列体系结构更少的参数扩展尺度感知能力。ASPP连同1×1卷积和全局平均池化层将不同规模的高级信息连接起来,并考虑了全局功能。

作者的ASPP包括:一个1×1卷积,三个3×3卷积层,其速率设置为(4、8、12),以及全局上下文信息。通过连接所有分支并经过另一个1×1卷积来生成结果特征。

网络结构(如c所示):

Atrous convolutions spatial pyramid network for crowd countingACSPNet使用(a)空间金字塔池(SPP)模块,(b)具有atrous卷积的SPP。(c)通过跳过连接包含低级和中级语义信息,并应用atrous卷积提取多级特征。

池化层被广泛用于维持平移和缩放不变属性(最大池化),拓宽接收域并加速计算。但是,它们降低了特征图的空间分辨率,并丢失了空间信息。尽管可以使用更多的卷积层来构建更深的模型,但感知区域会线性扩展。
Atrous卷积,也称为膨胀卷积,可以在不增加参数数量的情况下按指数方式扩展接收场并保持尺寸大小。他们在细分[16-20]任务上获得了良好的结果。

与多列比较
Atrous convolutions spatial pyramid network for crowd counting
为了利用模块的多尺度上下文特征,作者提出了具有跳过连接的级联模型(图3(b))。其具有与MCNN相同的结构。为了解决各个列之间的权重和特征共享问题,使用了相似数量的参数来生成更深层次和规模变化的模型。由于跳过连接,因此也考虑了多尺度信息。这些低级和中级功能通过流式传输到融合CNN中直接连接起来以生成输出密度图。

损失函数

Atrous convolutions spatial pyramid network for crowd counting
LA是平均绝对计数损失,LP是地面真实度和生成的密度图之间的逐像素L1损失。

实验结果

三个数据集上和其它方法的对比:
Atrous convolutions spatial pyramid network for crowd counting

mall数据集上:Atrous convolutions spatial pyramid network for crowd counting
ucsd数据集上:
Atrous convolutions spatial pyramid network for crowd counting