《Investigation of the Cross-Ratios Method for Point-of-Gaze Estimation》论文阅读

题目:Investigation of the Cross-Ratios Method for Point-of-Gaze Estimation
作者:Jeffrey J. Kang, Moshe Eizenman∗, Elias D. Guestrin
来源: IEEE Transactions on Biomedical Engineering

摘要

视点交叉比率(PoG)估计的交叉比率方法在投影变换中使用了交叉比率的不变性。这种方法所表现出的与受试者相关的PoG估计偏差的内在原因尚未在文献中得到很好的描述。使用眼睛模型和估计PoG的系统组件(相机,光源),开发了跨比例方法的理论框架。在此框架内对交叉比率法的分析表明,与受试者相关的估计偏差主要是由于:1)视轴与光轴的角度偏差和2)瞳孔中心虚像的事实与照明眼睛的光源的虚像(角膜反射)不共面。该理论框架提供了一种封闭形式的分析表达式,该表达式可预测估计偏差作为特定于受试者的眼睛参数的函数。该理论框架还为现有的经验得出的两步过程提供了清晰的物理解释,该过程可补偿估计偏差,并表明该过程的第一步等同于将角膜反射移至新平面,从而将与该角的反射距离最小化。平面到瞳孔中心的虚拟图像。

1.介绍

凝视点(PoG)是视野内在视网膜最高视敏度区域(称为*凹)上成像的点。估计PoG的系统可用于多种应用,包括研究情绪,知觉和注意力障碍[1],研究驾驶员行为[2],人体工程学[3],多模式人机界面[4],机动残疾人士及其辅助装置[5]。远程,非接触式凝视估计的大多数现代方法都是基于对从视频图像中提取的眼睛特征的分析。最常用的功能是瞳孔中心和一个或多个角膜反射。角膜反射(第一个Purkinje图像,闪烁)是照亮眼睛的光源(通常是红外)的虚像,并由角膜的前表面(用作凸面镜)创建。

相对最近,提出了一种利用Pog估计的新方法,该方法利用射影几何中交叉比例的不变性,它具有几个所需的属性:易于实现,模型简单,使用单个未经校准的摄像机,可以容忍自然头动作,并且不需要特定于受试者的校准程序。然而,后来观察到,原始的交叉比率方法对某些主题会导致非常大的PoG估计偏差。为了减少估计偏差,已经提出了使用特定对象校准程序的误差补偿技术。但是,尽管成功地减小了估计偏差,但是对估计偏差的基本原因却知之甚少。在本文中,我们在跨比率的PoG估计方法中识别并分析了估计偏差的主要原因。

在以下部分中,将描述原始的交叉比率方法,并确定主要的错误来源。在第三部分中,对估计偏差的主要原因进行了详细分析,并提供了量化表达式,该表达式可量化与主体相关的估计偏差。在第四节中,分析并解释了基于校准的技术来补偿估计偏差。最后,在第五节中,对工作进行了总结并提出了结论。

2.交叉比率法和估计偏差的主要原因

A.原始方法

POG估计的交叉比法最早是由Yo等人提出的,他描述了将眼睛图像中的瞳孔中心映射到平面上相应的POG估计的新映射。为了使用文中描述的方法估计平面上的POG,将四个光源放置在同一平面上,并使用摄像机对受试者的眼睛进行成像。图1(A)示出了典型的系统设置,其中四个光源(I1、I2、I3、I4)被放置在其上估计POG(ˆg)的计算机屏幕(场景平面)周围,并且照相机被放置在屏幕下方。图1(B)显示了摄像机捕捉到的眼睛图像,其中识别了四种角膜反射(u1、u2、u3、u4)和瞳孔中心UP。Yoo等提出,场景平面上的要素形成的交叉比例(I1、I2、I3、I4,ˆg)等于相机成像平面(u1、u2、u3、u4,up)上相应特征形成的交比。根据这一假设,他们推导出公式,根据光源的坐标以及眼睛图像中瞳孔和角膜反射中心的坐标来计算POG估计值ˆg。然而,如后面所示,交叉比率方法可能导致非常大的POG估计偏差。

《Investigation of the Cross-Ratios Method for Point-of-Gaze Estimation》论文阅读
图1。(a)系统设置,其中四个光源位于计算机屏幕周围,屏幕下方有一个摄像头。(b)相机捕获的眼睛图像,显示了四个角膜反射和瞳孔中心。


B.确定估计偏差的主要原因

对估计偏差的主要原因的分析基于图2(A)中的光学模型,其中角膜的表面被建模为半径为R、中心为c(角膜曲率中心)的凸球面镜,系统的相机被建模为其节点为o的针孔相机,并且光源li被建模为点光源。在图2(A)的光学模型中,将角膜表面建模为半径为R、中心为c(角膜曲率中心)的凸球面镜,将系统的相机建模为节点为o的针孔相机,并且将光源li建模为点光源。来自图2(B)的图表用于识别估计偏差的主要原因,并导出作为系统配置和一组特定于对象的眼睛参数的函数来预测POG估计偏差的近似闭合表达式。

首先,考虑来自光源li的光线,该光线在角膜表面反射,使得反射的光线穿过相机的节点o,并在ui处与相机的成像平面相交。此反射会导致光源的虚像(角膜反射)在反射光线的延伸上形成在角膜表面后面。设vi被定义为反射光线的延伸与连接角膜曲率中心c和相应光源li的线的交集。虽然一般情况下,角膜反射并不完全在角膜曲率中心和相应光源的连接线上,但由于Vi图像和角膜反射图像是相同的(即ui),在本文的分析中,可以用Vi能代替角膜反射而不引入任何误差。出于这个原因和简明起见,该点Vi以下将被称为“角膜反射”。

接下来,考虑来自瞳孔中心的假想射线, p,它穿过房水和角膜(有效折射率≈1.3375[10]),并在角膜表面移动到空中时折射(折射率≈1),以便折射光线穿过摄影机的节点o,并在上方与摄影机的成像平面相交(瞳孔中心图像)。该折射导致在折射光线的延伸上形成瞳孔中心(以下简称为虚拟瞳孔中心)的虚像。该虚拟图像位于瞳孔中心p和角膜表面之间。假设Pv被定义为折射光线的延伸与眼睛的光轴的交集。尽管通常虚拟瞳孔中心不完全在眼睛的光轴上,但是由于PV的图像和虚拟瞳孔中心的图像是相同的(即,向上),对于本文执行的分析,可以使用PV来代替虚拟瞳孔中心而不引入任何误差。出于这个原因并且为了简明起见,点PV在下文中将被称为“虚拟瞳孔中心”。

3.估计偏差的解析表达式

4.估算偏差补偿

5.结论