图像金字塔LK光流法原理分析

1.LK光流法原理分析

  光流法是一种根据时域上连续图像间的相关性来描述像素在前后两帧中的瞬时速度的方法,可用来完成特征点的追踪。稀疏(Lucas–Kanade,LK)光流算法是计算机视觉中常用的一种两帧间差分的光流估计算法。
  LK光流法不是没有条件限制的,它的应用必须基于以下三个假设:
  1.灰度不变假设:在不同图像的重叠区域中,重叠像素点的灰度值是恒定不变的。这是光流法进行数学原理推导的基本。
  2.小运动:运动比较轻微时,像素位置随时间的变化不会过于剧烈。此时,前后两帧间位置的变化导致的灰度值变化可以近似为灰度对位置的偏导数。
  3.空间一致性:真实场景中相邻的区域即使投影到二维图像中,仍然是相邻的图像区域。此区域中,邻近点的速度是相同的。这个假设是很有必要的,因为LK光流法要求取x,y(x和y都是未知数)方向上的速度。一个方程无法求解两个未知数,所以可以根据空间一致性假设,利用n个临近像素点联立n方程,通过最小二乘法给出最终结果。
  假设获取上一帧和下一帧图像的时间分别为 ttt+dtt+dt,某像素点在上一帧和下一帧的位置分别为I(x,y,z,t)I(x,y,z,t)I(x+dx,y+dy,z+dz,t+dt)I(x+dx,y+dy,z+dz,t+dt)
  根据灰度不变假设得,

          I(x,y,z,t)=I(x+dx,y+dy,z+dz,t+dt)I(x,y,z,t)=I(x+dx,y+dy,z+dz,t+dt)

  根据小运动假设,对上式进右侧行泰勒级数展开,

    I(x+dx,y+dy,z+dz,t+dt)=I(x,y,z,t)+Ixdx+Iydy+Izdz+ItdtI(x+dx,y+dy,z+dz,t+dt)=I(x,y,z,t)+\frac{\partial I}{\partial x}dx+\frac{\partial I}{\partial y}dy+\frac{\partial I}{\partial z}dz+\frac{\partial I}{\partial t}dt

  根据以上两式可得,

             Ixdx+Iydy+Izdz+Itdt=0\frac{\partial I}{\partial x}dx+\frac{\partial I}{\partial y}dy+\frac{\partial I}{\partial z}dz+\frac{\partial I}{\partial t}dt=0

  上式两边同时除以dtdt,且令dxdt=Vx\frac {dx}{dt}=V_xdydt=Vy\frac {dy}{dt}=V_ydzdt=Vz\frac {dz}{dt}=V_z得,

             IxVx+IyVy+IzVz+It=0\frac{\partial I}{\partial x}V_x+\frac{\partial I}{\partial y}V_y+\frac{\partial I}{\partial z}V_z+\frac{\partial I}{\partial t}=0

  在二维图像中,可以忽略zz,只需保留x,y,tx, y, t 即可,其中 Ix\frac{\partial I}{\partial x}Iy\frac{\partial I}{\partial y}It\frac{\partial I}{\partial t} 可表示为图像在(x,y,t)(x, y, t)方向的差分,令Ix=Ix\frac{\partial I}{\partial x}=I_xIy=Iy\frac{\partial I}{\partial y}=I_yIt=It\frac{\partial I}{\partial t}=I_t,上式可写为如下形式:

               IxVx+IyVy=ItI_xV_x+I_yV_y=-I_t

  现在有两个未知数,却只有一个方程,所以根据空间一致性假设,选取3×33\times3窗口内的9个像素点联立,建立方程式,如下,

            [Ix1Iy1Ix2Iy2Ix9Iy9][VxVy]=[It1It2It9]\left[\begin{matrix}I_{x1} & I_{y1}\\I_{x2} & I_{y2}\\\vdots & \vdots\\I_{x9} & I_{y9}\end{matrix}\right]\left[\begin{matrix}V_x\\V_y\end{matrix}\right]=\left[\begin{matrix}-I_{t1}\\-I_{t2}\\\vdots\\-I_{t9}\end{matrix}\right]

A=[Ix1Iy1Ix2Iy2Ix9Iy9]A=\left[\begin{matrix}I_{x1} & I_{y1}\\I_{x2} & I_{y2}\\\vdots & \vdots\\I_{x9} & I_{y9}\end{matrix}\right]V=[VxVy]V=\left[\begin{matrix}V_x\\V_y\end{matrix}\right]b=[It1It2It9]b=\left[\begin{matrix}-I_{t1}\\-I_{t2}\\\vdots\\-I_{t9}\end{matrix}\right],所以,这是超定方程,采用最小二乘法得,

               ATAV=ATbA^TAV=A^Tb

              V=(ATA)1ATbV=(A^TA)^{-1}A^Tb

        [VxVy]=[Ixi2IxiIyiIxiIyiIyi2]1[IxiItiIyiIti]\left[\begin{matrix}V_x\\V_y\end{matrix}\right]=\left[\begin{matrix}\sum I^2_{xi} & \sum I_{xi}I_{yi}\\ \\\sum I_{xi}I_{yi} & \sum I^2_{yi}\end{matrix}\right]^{-1}\left[\begin{matrix}\sum I_{xi}I_{ti}\\ \\\sum I_{yi}I_{ti}\end{matrix}\right]

至此,该点的光流解算完毕。

2.基于图像金字塔的LK光流法原理分析

  LK光流法第二条假设针对的是小运动,如果运动速度较快时,该算法误差较大,而基于金字塔分层的LK光流法很好的解决了这一问题。
  有两帧灰度图像IIJJI(x,y)I(x,y)J(x,y)J(x,y)分别为图像IIJJ[x,y][x,y]位置处的灰度值。设图像II的像素点u=[ux,uy]Tu=[u_x,u_y]^T匹配到图像JJ上的像素点v=u+d=[ux+dx,uy+dy]Tv=u+d=[u_x+d_x,u_y+d_y]^T,可使得I(ux,uy)I(u_x,u_y)J(ux+dx,uy+dy)J(u_x+d_x,u_y+d_y)误差最小。位移d=[dx,dy]Td=[d_x,d_y]^T被称为uuvv的光流。通常在以点uu为中心的图像区域[2wx+1,2wx+1][2w_x+1,2w_x+1]内,通过最小化灰度匹配误差的平方和来求解dd。此损失函数为,

e(d)=e(dx,dy)=x=uxwxux+wxy=uywyuy+wy(I(x,y)J(x+dx,y+dy))2e(d)=e(d_x,d_y)=\sum_{x=u_x-w_x}^{u_x+w_x}\sum_{y=u_y-w_y}^{u_y+w_y}(I(x,y)-J(x+d_x,y+d_y))^2

  具体操作流程是先对图像进行金字塔分层,下层每次缩放为上层的一半,将分辨率低的图像分配在最顶层,原始图像分配在最底层。从顶层也就是分辨率最低的图片开始,递归求解到原始图片为止。设第L层的损失函数为,

eL(dL)=eL(dxL,dyL)=x=uxLwxuxL+wxy=uyLwyuyL+wy(IL(x,y)JL(x+gxL+dxL,y+gyL+dyL))2e^L(d^L)=e^L(d^L_x,d^L_y)=\sum_{x=u^L_x-w_x}^{u^L_x+w_x}\sum_{y=u^L_y-w_y}^{u^L_y+w_y}(I^L(x,y)-J^L(x+g^L_x+d^L_x,y+g^L_y+d^L_y))^2

  其中,gLg^L代表的是像素点在第L层迭代运算中的光流初值,dLd^L代表的是像素点在第L层迭代运算中的光流误差。dL=[dxL,dyL]d^L=[d^L_x,d^L_y]通过标准的LK算法得到,gL=[gxL,gyL]g^L=[g^L_x,g^L_y]通过下式求得,该公式是递归推导。另外,设顶层的光流初值g=[0,0]Tg=[0,0]^T

              gL1=2(gL+dL)g^{L-1}=2(g^L+d^L)

重新定义A(x,y)=IL(x,y)A(x,y)=I^L(x,y)B(x,y)=JL(x+gxL,y+gyL)B(x,y)=J^L(x+g^L_x,y+g^L_y)[px,py]T=[uxL,uyL]T[p_x,p_y]^T=[u^L_x,u^L_y]^Tv=[vx,vy]T=dL\overline v=[v_x,v_y]^T=d^L

e(v)=e(vx,vy)=x=pxwxpx+wxy=pywypy+wy(A(x,y)B(x+vx,y+vy))2e(\overline v)=e(v_x,v_y)=\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}(A(x,y)-B(x+v_x,y+v_y))^2

e(v)v=2x=pxwxpx+wxy=pywypy+wy(A(x,y)B(x+vx,y+vy))[BxBy]\frac{\partial e(\overline v)}{\partial \overline v}=-2\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}(A(x,y)-B(x+v_x,y+v_y))\bullet \left[\begin{matrix}\frac{\partial B}{\partial x} &\frac{\partial B}{\partial y}\end{matrix}\right]

B(x+vx,y+vy)B(x+v_x,y+v_y)进行泰勒展开,

          B(x+vx,y+vy)=B(x,y)+[BxBy]vB(x+v_x,y+v_y)=B(x,y)+\left[\begin{matrix}\frac{\partial B}{\partial x} &\frac{\partial B}{\partial y}\end{matrix}\right]\overline v

e(v)v2x=pxwxpx+wxy=pywypy+wy(A(x,y)B(x,y)[BxBy]v)[BxBy]\frac{\partial e(\overline v)}{\partial \overline v}\approx-2\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}(A(x,y)-B(x,y)-\left[\begin{matrix}\frac{\partial B}{\partial x} &\frac{\partial B}{\partial y}\end{matrix}\right]\overline v)\bullet \left[\begin{matrix}\frac{\partial B}{\partial x} &\frac{\partial B}{\partial y}\end{matrix}\right]

同时令,

           δI=A(x,y)B(x,y)\delta I=A(x,y)-B(x,y)

          I=[IxIy]=[BxBy]T\nabla I=\left[\begin{matrix}I_x\\I_y\end{matrix}\right]=\left[\begin{matrix}\frac{\partial B}{\partial x} &\frac{\partial B}{\partial y}\end{matrix}\right]^T

        Ix(x,y)=A(x,y)x=A(x+1,y)A(x1,y)2I_x(x,y)=\frac{\partial A(x,y)}{\partial x}=\frac{A(x+1,y)-A(x-1,y)}2

        Iy(x,y)=A(x,y)y=A(x,y+1)A(x,y1)2I_y(x,y)=\frac{\partial A(x,y)}{\partial y}=\frac{A(x,y+1)-A(x,y-1)}2

得,

12e(v)vx=pxwxpx+wxy=pywypy+wy(ITvδI)IT\frac12\frac{\partial e(\overline v)}{\partial \overline v}\approx\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}(\nabla I^T\overline v-\delta I)\nabla I^T

12[e(v)v]Tx=pxwxpx+wxy=pywypy+wy([Ix2IxIyIxIyIy2]v[δIIxδIIy])\frac12[\frac{\partial e(\overline v)}{\partial \overline v}]^T\approx\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}\left(\left[\begin{matrix}I^2_x &I_xI_y\\ \\ I_xI_y& I^2_y\end{matrix}\right]\overline v-\left[\begin{matrix}\delta II_x\\\\\delta II_y\end{matrix}\right]\right)

G=x=pxwxpx+wxy=pywypy+wy[Ix2IxIyIxIyIy2]G=\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}\left[\begin{matrix}I^2_x &I_xI_y\\ \\ I_xI_y& I^2_y\end{matrix}\right]

b=x=pxwxpx+wxy=pywypy+wy[δIIxδIIy]\overline b=\sum_{x=p_x-w_x}^{p_x+w_x}\sum_{y=p_y-w_y}^{p_y+w_y}\left[\begin{matrix}\delta II_x\\\\\delta II_y\end{matrix}\right]

12[e(v)v]TGvb\frac12[\frac{\partial e(\overline v)}{\partial \overline v}]^T\approx G\overline v-\overline b

附上一张论文中的流程,
图像金字塔LK光流法原理分析
图像金字塔LK光流法原理分析
参考:
1.总结:光流–LK光流–基于金字塔分层的LK光流–中值流
2.《PyramidalImplementationoftheLucasKanadeFeatureTrackerDescriptionofthealgorithm》