行人检测几篇论文相关笔记

这部分内容会持续更新,比较难的论文会单独开篇博文讲解,相对比较简单的就只写概要记录在此篇博文中。

PedHunter: Occlusion Robust Pedestrian Detector in Crowded Scenes

  • 链接:https://arxiv.org/abs/1909.06826
  • 代码:https://github.com/ChiCheng123/PedHunter(目前还未放)
  • 网络架构
    行人检测几篇论文相关笔记
  • 创新
    其实就是mask-rcnn模型,与mask-rcnn不同的点为:
    1)人体mask预测分支改为预测head的mask,并且在推断过程中,去掉mask预测分支;作用:对行人检测添加额外的监督信息,且不增加推断的计算量;
    2)rpn选择proposal更加严格:iou阈值从0.5调整为0.7;作用:用来训练的正例质量更高,预测效果更好;
    3)数据增强:为了对遮挡情况鲁棒性更好,将行人检测框分为五部分:头部,左上身、右上身、坐下身、右下身,训练时,每个图像groud truth内以0.5的概率随机遮挡后四部分的其中一部分,将值替换成imageNet中的均值。
    4)提供一个新的行人检测数据集:SUR-PED