基于微调的SqueezeNet用于车辆分类

对于数据集的预处理可以说是很优秀了。可惜的是那部分介绍太少,没有给出更多实例。

 

题目:Fine Tuning Based SqueezeNet for Vehicle Classification

摘要:车辆分类在道路管理许多重要方面都有所贡献。在本文中,我们传达了我们基于深网预测的车辆分类的结果。我们基于Miovision Traffic相机数据集(MIO-TCD)1对最近发布的SqueezeNet进行了微调。MIO-TCD分类训练部分的不平衡实例分布描绘了交通场景的性质。

为了更好地概括,我们重新设计了训练数据集的实例分布依靠实施增强和减少。我们发现平衡实例分布比不平衡实例训练数据集提供了显着的少数类预测准确性改进。此外,我们展示了对预先训练过的微调SqueezeNet有效地提高了基线模型的净性能。

1.引言

车辆分类在许多与道路管理相关的应用中起着重要作用。车辆分类应用的一些示例是自动收费站,交通流量调节和车辆容量估计。为了解决分类问题,许多研究人员提出了解决方案。虽然这些方法因传感器部署而不同[9],但它们通常包含三个主要部分。这些构建模块是传感器,信号转换器和数据处理设备。其中一种吸引研究人员注意力的非侵入式传感器方法是基于图像,其中一些是[1,7,12]。尽管存在实际的实施挑战,但基于图像的车辆分类提供了益处。

基于图像的车辆分类,我们提出了一种基于深网的车辆类预测。最近,来自舍布鲁克大学和Miovision的团队提出了MIOTCD以适应算法基准和比较。他们提供的数据集包括在加拿大和美国的不同季节和地点获得的786,676张图像。我们的目标是预测测试图像的标签,给出11种典型的日常城市和乡村交通情景的训练图像。 我们通过仔细重新设计分发实例来解决问题。 接下来,我们微调了预训练的内存高效深度网络,即SqueezeNet [5]。

在第2节中,我们回顾了实例分布修改的相关工作,以及基于深度网络解决车辆分类的最新方法。此外,在第3节中,我们解释了分类训练数据集实例分布以及我们如何处理不平衡问题。接下来,我们描述了SqueezeNet的采用来预测车辆的等级。 最后,我们将平衡和不平衡训练实例分布的微调SqueezeNet的实验结果传达给我们。 此外,我们展示了从训练深度网从头开始微调预训练网的有效性。

2.相关工作

3.数据集

对分布不均的数据集的扩增和删减操作通过三个图表展示的淋漓尽致,重要的是采取的方法。一定要学习到其中特别关键的数据集预处理的操作。

未操作之前是这样的

基于微调的SqueezeNet用于车辆分类

操作后的

 

基于微调的SqueezeNet用于车辆分类

操作是这样的

基于微调的SqueezeNet用于车辆分类

3.1 数据扩增

       假设对象位于图像的中心。我们采用基本的几何操作,饱和度和强度变化。几何操作包括垂直翻转,随机旋转和中心缩放。对于中心缩放操作,我们基于第一,第二和第三级裁剪将图像的中心裁剪为3个比例。然后,我们将裁剪后的图像区域调整为初始大小。我们使用HSV色彩空间来相应地调整饱和度和强度通道。图3显示了准备进入训练课程的修改后的图像。

3.2  数据减少

       需要减少训练数据集中的主要类,以便不会过度复制次要类实例的数量。 我们从汽车和背景类中随机选择图像。我们通过随机排列选择前51,347个图像(平均实例数+总实例中的10%)。 因此,除了需要进入训练集的图像总数之外,不需要人为干预。

4. 卷积网络结构

        我们使用预先训练的SqueezeNet作为基本模型,将其输入我们的重新设计实例分发MIO-TCD训练集。有关更详细的SqueezeNet架构,请参阅[5]。预训练的网络充当我们的基础网络,我们更改最终的层输出数量以预测类别。 SqueezeNet通过实施3个主要策略实现了低参数计数。 首先,他们使用1 x 1滤波器而不是3 x 3.其次,他们使用Squeeze层将输入通道的数量减少到3 x 3.这两种策略的组合组成了fire模块,如图4所示 第三种策略是设置大型**图。 在本文中,我们使用了SqueezeNet v1.1。 网络架构包括64个3 x 3分辨率的滤波器,以及第1,3和5层的汇聚层。为了能够适应11个预测类,我们改变了最后的卷积层输出数。该层的适当输出是11对应于类预测编号。

5. 实验结果

基于微调的SqueezeNet用于车辆分类

 

 

 

 

 

 

 

 

 

 

6. 结论

我们展示了用于车辆分类的微调SqueezeNet的结果。 我们在MIO-TCD训练分类部分进行训练。 我们在分类训练集的原始和精心重新设计的实例分布上提出了这种策略。 我们已经证明,对不平衡训练数据集上的SqueezeNet进行微调优于基线模型性能。 此外,我们表明实例分布修改有助于提高预测类准确性,而数据减少比例应该保持观察,因此它不会降低深网性能。