人脸识别（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition

本篇是人脸识别的第四篇文章：
人脸识别第一篇：Center Loss
人脸识别第二篇：SphereFace
人脸识别第三篇：CosFace
人脸识别第四篇：ArcFace
人脸识别第五篇：CCL
人脸特征点检测第一篇：[综述]
(https://blog.csdn.net/u014230646/article/details/79445384)
人脸特征点检测第二篇：[Cvpr 2012 树模型实现]
https://blog.csdn.net/u014230646/article/details/79445524
人脸特征点检测第三篇：[基于CNN的方法-VGG, Mobilenetv2尝试]
https://blog.csdn.net/u014230646/article/details/79445676
人脸特征点检测第四篇：[基于FCN的方法]
https://blog.csdn.net/u014230646/article/details/79445867

方法

ArcFace [1] 也是对Sphereface的改进工作，主要的改进也是loss函数中角度裕量的添加方式。其中目标函数定义为：
人脸识别（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition
而我们之前看的cos face的目标函数是：

再来看看相应的函数曲线：

相当于原始的余弦函数在x轴上向左偏移。这样做了之后，在角度值为180°的时候分类难度基本不变，而角度值较小的时候分类更加困难。相当于在角度值较小的时候加了裕量。

论文[1]还清洗了数据、分析了网络结构的变化对准确率的影响等。

大数据集的考量

我们知道，基于分类的人脸识别网络，在训练的时候需要的显存随着类别数增加线性增长。假如我们有很多类别怎么办？当然我们可以用Triplet loss或者contrastive loss等来作为目标函数。这篇论文用实验说明了先用分类的方法训练再用Triplet loss微调是有效的，能进一步提高性能。
人脸识别（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition
可以看到训练集的影响：MS1M比VGG2高一个百分点
以及Triplet微调的效果

网络结构

下图是在VGG2用softmax训练的，各个网络的性能对比。
人脸识别（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition
单纯用softmax性能就很高了。最好的是Inception-ResNet

性能

我认为这篇论文的主要贡献是性能做得非常高，我认为成功的点主要在以下几方面：

数据做了清洗，用了更多的数据训练。VggFace2+Ms-Celeb-1M
对齐的方式，图片的大小
网络结构的改进
目标函数

引用

[1] Deng J, Guo J, Zafeiriou S. ArcFace: Additive Angular Margin Loss for Deep Face Recognition[J]. arXiv preprint arXiv:1801.07698, 2018.

人脸识别（四）：2018 ArcFace: Additive Angular Margin Loss for Deep Face Recognition

方法

大数据集的考量

网络结构

性能

引用

相关推荐