ReID论文笔记1-Deeply-Learned Part-Aligned Representations for Person Re-Identification
论文地址:
https://arxiv.org/abs/1707.07256
源码地址:
https://github.com/zlmzju/part_reid
总述
- part-aligned human representation 解决图片对应位置人体不对准问题
- 对姿势改变更鲁棒,不需要人体部分的标记,不需要训练人体检测器或者分割器
- 使用相似度信息,学习人体匹配,未使用LSTM
- 模型将人体分解为几个易于辨识的部分,计算各部分表征,并将一对图像的相应区域间的相似性汇总成总体得分,亮点是借鉴了attention,在这里未使用LSTM
结构与方法
- Input : 160*80 的图片 ( I )
- 通过全连接卷积层提取特征,输出为 10*5*512 ( T )
- 有k个part net,这里k通过交叉验证来获取, part net是一层1*1卷积层+sigmoid函数
- K个分支,不同的分支对人体不同位置响应不同
- 图片特征通过人体部分检测器后,估计得到map Mk,即各部分权重
- 将权重和图片特征结合,得到每一部分的特征 ( Tk )
- 通过全局池化和线性降维后,将k个部分连接在一起,并使用L2归一化,最终得到human representation : h(I)
- 将特征通过triplet loss进行学习,距离度量为欧氏距离
按照自己理解大致画了一下
结论
- 可以不使用检测器来检测人体,仅使用相似性,对姿势比较鲁棒
- 得到的人体特征主要是身体部分,没有人脸部分
- 较简单,适用于工业界