《Eye Gaze Estimation from a Single Image of One Eye》论文阅读

题目:Eye Gaze Estimation from a Single Image of One Eye
作者:Wang ; Sung ; Ronda Venkateswarlu
来源:Proceedings Ninth IEEE International Conference on Computer Vision

从一只眼睛的单个图像进行眼睛注视估计

摘要

我们提出了一种新颖的方法,称为“单圈”算法,该方法用于使用仅放大一个人的一只眼睛的单眼图像来测量视线。观察到虹膜轮廓是一个圆,我们从其椭圆形图像估算出该虹膜圆的法线方向,即视线注视。从基本的射影几何体,可以将椭圆反投影到空间中两个不同方向的圆上。但是,通过使用眼球的人体测量特性,可以消除正确的解决方案。这使我们可以使用放大相机获得虹膜的高分辨率图像,从而在估计中获得更高的精度。我们凝视确定方法的鲁棒性已通过对合成和真实图像数据进行的广泛实验进行了统计验证。

1.介绍

我们发现可以使用虹膜轮廓的法线来估计视线,该法线与真实视线具有近似固定的角度。因此,我们开发了一种称为“单圈”算法的新颖方法,该方法使用单眼图像放大人的一只眼睛来测量视线。另外,我们观察到视线(分别连接两个远眼角和两个相邻的眼角)与口线(连接两个口角)平行。这一领域的知识使我们开发了一种新方法,该方法可使用由视线和口线的交点形成的图像中的消失点来快速而稳健地确定头部姿势。可以在以下位置找到此姿势确定范例的详细信息以及此方法的两个替代证明。

在本文中,我们利用了这样的观察:虹膜轮廓(不是虹膜)在3D中为圆形时,在透视图中是椭圆形。视线定义为虹膜圆平面的法线,可以从椭圆/圆的对应关系中估计。但是,这将导致法线的两种可能的解决方案。我们提出一种“单圈”算法来消除解决方案的歧义。基于几何约束条件获得唯一的支撑平面,即眼球中心与两个眼角之间的距离应彼此相等。我们将其称为“距离约束”。

在本文中,发现一个人的虹膜半径与他/她的眼球半径在3D空间中的比率具有非常低的整体方差,因此我们可以将该比率固定为通用平均值。因此,人与人之间这个比例的微小变化对结果没有显着影响。因此,一旦虹膜的半径已经被校准,就可以定位眼球中心。

我们的方法在以下方面与其他方法有所不同。我们将虹膜轮廓的图像不是圆,而是正确地视为图像中的椭圆。因此,我们的方法比现有方法更现实。另一个区别是我们的方法更准确,因为我们的方法只需要一只眼睛的图像,我们就可以放大它,从而获得更高的分辨率。但是,这样做时,我们需要解决一个出现的问题。缩放和跟踪单只眼睛会带来问题。可以通过引导“凝视”摄像机根据头部姿势估计结果来定位眼睛来解决可能出现的视野外的问题。考虑到这一点,我们开发了一种将头部姿势确定与眼睛注视估计相结合的通用方法。人头的姿势,包括眼角的3D位置,可以从头部姿势估计子系统获得嘴角和脸部方向。可以在以下位置找到此集成方法的详细信息。

2.注视定位

我们的注视确定方法论依赖于估计虹膜轮廓的椭圆并通过射影几何,这导致了两个法线解。为了丢弃假法线,我们利用了眼球半径与虹膜圆半径的拟人比例。

《Eye Gaze Estimation from a Single Image of One Eye》论文阅读
图1.眼模型

结论

在本文中,我们提出了一种非侵入式方法,可以通过放大虹膜成像来稳健地估计视线。我们的方法的动机是从单个图像帧实时,令人满意地准确估计眼睛凝视。人脸领域知识的使用至关重要,这使我们的范例新颖而新颖。实际上,可以将椭圆反投影到该空间中到两个可能的圆上。通过观察虹膜的(3D)轮廓是圆形,从而将其应用于眼睛注视,因此它就是我们要寻找的圆。通过使用描述的“距离约束”,我们能够丢弃模棱两可的解决方案并保留正确的视线。该约束基于眼睛的人体测量特性,这是一个新颖的想法。通过实现更高的分辨率,我们改进了当前的视线确定方法。这主要是因为我们的算法设计为仅使用眼睛的单个图像,这随后意味着我们可以放大它。

使用虹膜