人脸识别

 人脸识别

 

人脸识别

人脸识别

 

人脸识别

图像金字塔 https://blog.****.net/touch_dream/article/details/62419496

 

人脸识别

人脸识别

正如上图所示,该MTCNN由3个网络结构组成(P-Net,R-Net,O-Net)。

Proposal Network (P-Net):该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归,对候选窗口进行校准,然后通过非极大值抑制(NMS)来合并高度重叠的候选框。

Refine Network (R-Net):该网络结构还是通过边界框回归和NMS来去掉那些false-positive区域。

只是由于该网络结构和P-Net网络结构有差异,多了一个全连接层,所以会取得更好的抑制false-positive的作用。

Output Network (O-Net):该层比R-Net层又多了一层卷基层,所以处理的结果会更加精细。作用和R-Net层作用一样。但是该层对人脸区域进行了更多的监督,同时还会输出5个地标(landmark)。

 

 

- 人脸检测[数据下载](http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/)

- 人脸关键点[数据下载](http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm)

 

IOU:

人脸识别

人脸识别

 

人脸识别

 

人脸识别

 

人脸识别

 

 

人脸识别

(1) end 2 end : 128
(2) k-node 
(3) triplet loss 三元损失函数 距离是 什么 ?
(4) hard Triplet
(5) minibatch 选 negtive 样本 

人脸识别

人脸识别