人脸识别“我相信技术,但不相信人性”

从一脸懵懂,到窃窃私语,再到公开讨伐,人脸识别技术引发的数据隐私问题,本应该值得惬意的人脸识别技术,最终却到达了一个需要法律深度介入的十字路口。
近日多次上热搜的人脸识别关于公民隐私安全问题引发热议,近日再次登上微博热搜的“人脸识别”,有人真的付诸了法律行动。一位大学教授,以“保护隐私”为由把一家使用了人脸识别认证系统的公园告上了法庭。
人脸识别“我相信技术,但不相信人性”
被誉为“中国人脸识别第一案”的起因很简单:
一家杭州的动物园要把之前的指纹入园认证改为人脸识别认证, 但这一改动惹怒了已经办理年卡的浙江理工大学特聘副教授郭兵。他给出的理由很充分——
凭什么你没征求我的意见,就默认我们都同意把面部信息提供给你?
人脸识别“我相信技术,但不相信人性”
“动物园强制要求游客必须进行人脸识别,从法律角度出发,这显然违法了《消费者权益保护法》,也不符合《网络安全法》,更不符合目前正在制定的《个人信息保护法》。”人脸识别引发的案件逐日增多,本应该值得惬意是人脸识别技术,但对于公民来讲是否值得的信任!

人脸识别技术原理究竟是什么?吃瓜群众一起来了解一下~
人脸识别现在越来越流行了,广泛应用与各行各业。那对于软件的这项高大上的功能该如何进行测试呢?接下来我们讲究一起看看这个神秘的过程。
首先,在测试之前需要先了解人脸识别的整个流程:

人脸识别“我相信技术,但不相信人性”
首先是人脸采集。
安装拍照摄像设备之后,需要在动态的场景与复杂的背景中判断是否存在人脸,并分离出这种面像。然后采集到人脸的照片。
人脸识别“我相信技术,但不相信人性”
因此采集过程是非常重要的,一需要能够采集到内容,二采集的内容能够分离出来是人脸。
而特征提取的原理是,将获取的人脸照片进行色彩矫正、光线调整,五官定位和脸部分割,将人脸的鼻子、眼睛、嘴巴等视为一个个特征点,计算每个特征点所在的位置、距离、角度。

正常场景下,在合适的光源下,采集人脸的正面,包含正常完整的人脸轮廓,毫无遮挡的五官,清晰的被拍照设备拍到,这样才能够准确的捕捉到特征,并判断出来。
但对于测试同学来讲,还要考虑异常场景的表现,即任何可能造成拍不到,拍不清晰,判断不出是人脸,或者不完整的表现。详细场景比如:

  1. 人脸没有正对摄像头,角度有倾斜。
  2. 拍照环境过暗或者过黑。
  3. 有佩戴黑框眼镜或墨镜拍照。
  4. 头发有明显遮住眼睛或脸部轮廓。
  5. 摄像头内包含多张人脸。

另外判断拍摄的样品是否包含人脸时,原理上一般会通过样品学习、或者是参考模版来,比如先设计一个标准人脸的模版,包含标准的特征、有一定的结构分布、相对规律的肤色分布。

那么针对这个原理,在测试时需要考虑不同肤色,或者是面部特征过于复杂的案例,比如黑人、比如脸上有皱纹的老人。

再看人脸比对。

实际应用场景中,人脸比对的本质是照片的比对。比对两张脸中,其中一张脸一般来自于当前场景拍摄的照片,另一张照片一般来自于*部或者数据库中的照片。
*部或数据库的照片是用来作为比对标准的,也是固定且一般不可随意篡改的。但采集照片的环节容易出现各种各样的漏洞,容易被一些不法分子利用虚假照片、他人照片、网络照片等进行攻击。

因此,从测试角度来看,需要覆盖到这些非法采集照片的行为,比如:

  1. 翻拍后的照片。
  2. 长相相似度很高的非本人的照片
  3. 软件合成的虚拟人脸
  4. 基于证件照PS的照片
    等等。

目前市面上主流的几种抗攻击的照片采集方式主要有三种:活体检测、连续检测、3D检测。

  1. 活体检测:判断用户是否为正常操作,通过指定用户做随机动作,一般有张嘴、摇头、点头、凝视、眨眼等等,防止照片攻击。判断用户是否真实在操作,指定用户上下移动手机,防止视频攻击和非正常动作的攻击。
  2. 3D检测:验证采集到的是否为立体人像,能够防止平面照片、不同弯曲程度的照片等。
  3. 连续检测:通过连续的检测,验证人脸运动轨迹是否正常,防止防止跳过活体检测直接
    替换采集的照片,也能够防止中途切换人。

其中活体检测是现在应用最广的一种抗攻击人脸数据采集方式。
因为不管是直接对照片检测,还是对活体进行检测,最终的目的都是采集人脸不同角度的照片。因此如果活体检测没有与连续性检测和3D 检测结合使用,也会存在一些漏洞。
这些漏洞即是测试的重点:

  1. 拍摄人脸正面、侧面、张嘴、闭眼等照片,用不同角度的静态照片绕过本人现场检测。
  2. 录制各种动作视频,按照一定的标准拼接起来,绕过本人现场检测。
    计算机只会告诉我们比对的两张脸的相似程度,是80%或者是20%,但不会告诉我们这两张脸是否为同一个人。

因此人脸比对有一个阈值的概念。设置相似度大于x%的时候,视为人脸比对通过,小于x%的时候,视为人脸比对不通过。设定阈值的过程就是模型评估。
阈值设定过低,则人脸比对通过率高,误报率可能也会升高。
阈值设定过高,则人脸比对通过率低,误报率可能也会降低也可能会增高。
因此在人脸识别的测试中,除了要关注通过率,还要关注误报率。这两项也可以统称为是查准率。

举个例子:

有8个样本,分别拿十张照片与数据库证件照进行人脸比对,其中3个确实是人证统一,另外四个人证不同。比对的结果相似度如下:
人脸识别“我相信技术,但不相信人性”
假设阈值设定60%,则人脸比对通过率=4/8=50%,误报率=1/8=12.5%。
假设阈值设定70%,则人脸比对通过率=2/8=25%,误报率=1/8=12.5%。
假设阈值设定50%,则人脸比对通过率=5/8=62.5%,误报率=2/8=25%。

目前人脸识别在金融、教育、景区、出入境、机场等领域已经大量应用,方便的同时也带来了一些问题,怎么做好人脸识别的测试,还是一个需要思考和深挖的课题。