【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

本文是论文《Unsupervised Learning for Fast Probabilistic Diffeomorphic Registration》的阅读笔记。涉及数学的东西太多,没搞懂是怎么做的。

一、微分同胚

现有的基于学习的配准方法通常不能保证配准是微分同胚的,即保留拓扑性的(topology-preserving)。

本文在VoxelMorph模型的基础上加入了微分同胚积分层(diffeomorphic integration layer),以保证无监督的端到端的学习是微分同胚的。微分同胚是可微和可逆的,因此保留了拓扑性。形变场是通过下述常微分方程(OED)来定义的:
ϕ(t)t=v(ϕ(t)) \frac{\partial \phi^{(t)}}{\partial t}=\boldsymbol{v}\left(\phi^{(t)}\right)
其中,ϕ(0)=Id\phi^{(0)}=Id是恒等变换,tt是时间,用静态速度场(stationary velocity field)vvt=[0,1]t=[0,1]积分得到最终的配准场ϕ(1)\phi^{(1)}。使用缩放和展平(squaring)来计算积分,静态ODE的积分可以表示为微分同胚的单参数子群,在群论中,vv是李代数的一员,并且求幂得到ϕ(1)\phi^{(1)}ϕ(1)\phi^{(1)}是李群ϕ(1)=exp(v)\phi^{(1)}=\exp(v)的一员。从单参数子群的属性可知,对于任意常量tttt',有exp((t+t)v)=exp(tv)exp(tv)\exp((t+t')v)=\exp(tv)\circ\exp(t'v),其中\circ是和李群相关的成分图(composition map)。从ϕ(1/2T)=p+v(p)/2T\phi^{\left(1 / 2^{T}\right)}=\boldsymbol{p}+\boldsymbol{v}(\boldsymbol{p}) / 2^{T}开始,使用重现(recurrence)ϕ(1/2t1)=ϕ(1/2t)ϕ(1/2t)\phi^{\left(1 / 2^{t-1}\right)}=\phi^{\left(1 / 2^{t}\right)} \circ \phi^{\left(1 / 2^{t}\right)}来获取ϕ(1)=ϕ(1/2)ϕ(1/2)\phi^{(1)}=\phi^{(1 / 2)} \circ \phi^{(1 / 2)},其中pp是空间位置的映射,选择TT使得v/2T0v/2^T\approx 0

二、Prob-VoxelMorph

xyx,y表示3维MR图像,zz表示转换函数ϕz\phi_z的隐变量,将zz的先验概率表示为:
p(z)=N(z;0,Σz) p(\boldsymbol{z})=\mathcal{N}\left(\boldsymbol{z} ; \mathbf{0}, \boldsymbol{\Sigma}_{z}\right)
其中N(z;0,Σz)\mathcal{N}\left(\boldsymbol{z} ; \mathbf{0}, \boldsymbol{\Sigma}_{z}\right)是多远正态分布,μ\muΣ\Sigma分别是其均值和方差。zz可以是形变场的低维嵌入,也可以是形变场本身。在本文中,让zz表示静态形变场。让L=DAL=D-A表示定义在体素网格上的邻接图的拉普拉斯,其中DD是图的度矩阵,AA是体素邻接矩阵。通过让Σz1=Λz=λL\boldsymbol{\Sigma}_{z}^{-1}=\boldsymbol{\Lambda}_{z}=\lambda \boldsymbol{L}来保证zz的空间平滑,其中Λz\boldsymbol{\Lambda}_{z}是精密矩阵(precision matrix)。我们让xx是扭曲图像yy的噪声观测:
p(xz;y)=N(x;yϕz,σ2I) p(\boldsymbol{x} \mid \boldsymbol{z} ; \boldsymbol{y})=\mathcal{N}\left(\boldsymbol{x} ; \boldsymbol{y} \circ \boldsymbol{\phi}_{z}, \sigma^{2} \mathbb{I}\right)
其中σ2\sigma^2是加性图像的方差。

我们的目标是估计后验配准概率p(zx;y)p(z|x;y),使用变分的方法,引入一个近似后验概率qψ(zx;y)q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}),通过最小化以下KL散度(即变分下界的负)来计算:
minψKL[qψ(zx;y)p(zx;y)]=minψEq[logqψ(zx;y)logp(zx;y)]=minψEq[logqψ(zx;y)logp(z,x,y)]+logp(x;y)=minψKL[qψ(zx;y)p(z)]Eq[logp(xz;y)] \begin{array}{l} \min _{\psi} \mathrm{KL}\left[q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}) \| p(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})\right] \\ =\min _{\psi} \mathbf{E}_{q}\left[\log q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})-\log p(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})\right] \\ =\min _{\psi} \mathbf{E}_{q}\left[\log q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})-\log p(\boldsymbol{z}, \boldsymbol{x}, \boldsymbol{y})\right]+\log p(\boldsymbol{x} ; \boldsymbol{y}) \\ =\min _{\psi} \mathrm{KL}\left[q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}) \| p(\boldsymbol{z})\right]-\mathbf{E}_{q}[\log p(\boldsymbol{x} \mid \boldsymbol{z} ; \boldsymbol{y})] \end{array}
近似后验概率qψ(zx;y)q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})可以表示为:
qψ(zx;y)=N(z;μzx,y,Σzx,y) q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y})=\mathcal{N}\left(\boldsymbol{z} ; \boldsymbol{\mu}_{z \mid x, y}, \boldsymbol{\Sigma}_{z \mid x, y}\right)
其中Σzx;y\Sigma_{z|x;y}是对角矩阵。

使用参数为ψ\psi的卷积神经网络defψ(x,y)def_\psi(x,y)来估计μzx,y\mu_{z|x,y}Σzx,y\Sigma_{z|x,y},可以通过随机梯度下降的方法优化变分下界来学习参数ψ\psi,给定图像对{x,y}\{x,y\}和样例zkqψ(zx;y)\boldsymbol{z}_{k} \sim q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}),通过以下损失来计算yϕzky\circ\phi_{zk}
L(ψ;x,y)=Eq[logp(xz;y)]+KL[qψ(zx;y)p(z)]=12σ2Kkxyϕzk2+12[tr(λDΣzx;ylogΣzx;y)+μzx,yTΛzμzx,y]+const \begin{array}{l} \mathcal{L}(\psi ; \boldsymbol{x}, \boldsymbol{y})=-\mathbf{E}_{q}[\log p(\boldsymbol{x} \mid \boldsymbol{z} ; \boldsymbol{y})]+\mathrm{KL}\left[q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}) \| p(\boldsymbol{z})\right] \\ =\frac{1}{2 \sigma^{2} K} \sum_{k}\left\|\boldsymbol{x}-\boldsymbol{y} \circ \boldsymbol{\phi}_{z_{k}}\right\|^{2}+\frac{1}{2}\left[\operatorname{tr}\left(\lambda \boldsymbol{D} \boldsymbol{\Sigma}_{z \mid x ; y}-\log \left|\boldsymbol{\Sigma}_{z \mid x ; y}\right|\right)+\boldsymbol{\mu}_{z \mid x, y}^{T} \boldsymbol{\Lambda}_{z} \boldsymbol{\mu}_{z \mid x, y}\right]+\mathrm{const} \end{array}
其中KK是样例的个数,在实验中使用K=1K=1。上式中第一项可以让配准后的图像yϕzky\circ\phi_{zk}xx相似,第二项鼓励后现概率接近于先验概率p(z)p(z)。虽然变分协方差Σzx,y\Sigma_{z|x,y}是对角矩阵,但是最后一项在空间上平滑了均值:μzx,yTΛzμzx,y=λ2jN(I)(μ[i]μ[j])2\boldsymbol{\mu}_{z \mid x, y}^{T} \boldsymbol{\Lambda}_{z} \boldsymbol{\mu}_{z \mid x, y}=\frac{\lambda}{2} \sum \sum_{j \in N(I)}(\boldsymbol{\mu}[i]-\boldsymbol{\mu}[j])^{2},其中N(i)N(i)是体素ii的邻居,将σ2\sigma^2λ\lambda看作是固定的超参数。
【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

卷积神经网络defψ(x,y)def_\psi(x,y)的输入是图像xyx,y,输出是μzx,y\mu_{z|x,y}Σzx,y\Sigma_{z|x,y}。神经网络包括一个卷积层(16通道),4个下采样层(32通道,步长为2)和3个上采样卷积层(32通道),每个卷积层后跟着Leaky ReLU**函数,并且卷积核大小为3×33\times3。模型的结构如上图所示。

为了使用公式(6)进行无监督的学习,使用了一个通过重参数化技巧来采样一个新的zkN(μzx,y,Σzx,y)\boldsymbol{z}_{k} \sim \mathcal{N}\left(\boldsymbol{\mu}_{z \mid x, y}, \boldsymbol{\Sigma}_{z \mid x, y}\right)

文章提出了缩放和展平层来计算ϕzk=exp(zk)\phi_{z_k}=\exp(z_k),给定两个3D向量场aabb,对于每个体素pp,使用线性插值计算(ab)(p)=a(b(p))(a\circ b)(p)=a(b(p)),即aa中一个非整数的体素位置b(p)b(p)。开始时有ϕ(1/2T)=p+zk/2T\phi^{\left(1 / 2^{T}\right)}=\boldsymbol{p}+\boldsymbol{z}_{k} / 2^{T},递归的计算ϕ(1/2t+1)=ϕ(1/2t)ϕ(1/2t)\boldsymbol{\phi}^{\left(1 / 2^{t+1}\right)}=\boldsymbol{\phi}^{\left(1 / 2^{t}\right)} \circ \boldsymbol{\phi}^{\left(1 / 2^{t}\right)},使得ϕ(1)ϕzk=exp(zk)\phi^{(1)} \triangleq \phi_{z_{k}}=\exp \left(\boldsymbol{z}_{k}\right),在本文中T=7T=7

三、处理过程

总结一下就是,卷积神经网络defψ(x,y)def_\psi(x,y)xyx,y为输入,计算μzx,y\mu_{z|x,y}Σzx,y\Sigma_{z|x,y},采样一个新的zkN(μzx,y,Σzx,y)\boldsymbol{z}_{k} \sim \mathcal{N}\left(\boldsymbol{\mu}_{z \mid x, y}, \boldsymbol{\Sigma}_{z \mid x, y}\right),计算微分同胚ϕzk\phi_{z_k}并将其作用在yy上。

给定已经学习好的参数,使用ϕz^k\phi_{\hat{z}_{k}}来对图像对(x,y)(x,y)进行近似配准,首先使用以下公式获取zk^\hat{z_k}
z^k=argmaxzkp(zkx;y)=μzx;y \hat{\boldsymbol{z}}_{k}=\arg \max _{z_{k}} p\left(\boldsymbol{z}_{k} \mid \boldsymbol{x} ; \boldsymbol{y}\right)=\boldsymbol{\mu}_{z \mid x ; y}
然后使用缩放和展平层计算ϕzk^\phi_{\hat{z_k}},我们还得到Σzx,y\Sigma_{z|x,y},可以估计每个体素jj处速度场zz的不确定性:
H(z[j])E[logqψ(zx,y)]=12log2πΣzx;y[j,j] H(\boldsymbol{z}[j]) \approx \mathbf{E}\left[-\log q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x}, \boldsymbol{y})\right]=\frac{1}{2} \log 2 \pi \boldsymbol{\Sigma}_{z \mid x ; y}[j, j]
我们也估计形变场ϕz\phi_z的不确定性。采样几个表达zkqψ(zx;y)\boldsymbol{z}_{k^{\prime}} \sim q_{\psi}(\boldsymbol{z} \mid \boldsymbol{x} ; \boldsymbol{y}),通过微分同胚层传播它们来计算ϕzk\phi_{z'_k}和经验对角协方差(empirical diagonal covariance)Σ^ϕz[j,j]\hat{\Sigma}_{\phi_z}[j,j],不确定性为H(ϕ[j])12log2πΣ^ϕz[j,j]H(\phi[j])\approx\frac{1}{2}\log 2\pi\hat{\Sigma}_{\phi_z}[j,j]

四、实验

实验部分进行了基于3D atlas的配准,使用的数据集有ADNI,OASIS,ABIDE,ADHD200,MCIC,PPMI,HABS和Harvard GSP。首先对数据进行标准预处理:将图像重采样成1mm的各向同性体素,并用FreeSurfer进行反射空间正则化和脑部提取(头骨去除),然后将图像裁剪到160×192×224160\times192\times224大小。按照7329,250,250大小分别划分为训练集、验证集和测试集。

将配准得到的形变场作用在分割标签上,并计算其Dice score。为了验证微分同胚性,使用了雅克比矩阵Jϕ(p)=ϕ(p)R3×3J_\phi(p)=\nabla\phi(p)\in R^{3\times3},雅克比矩阵可以捕获形变场ϕ\phi在体素pp处的局部特性。只有在满足Jϕ(p)>0|J_\phi(p)|>0的位置,局部形变才是微分同胚的,即可逆和方位保持(orientation-preserving)的。
【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

baseline选用的是ANTs软件包中的SyN和VoxelMorph,后者不能保证形变场是微分同胚的或者是不确定的估计。上图两行分别是本文的方法和ANTs的配准结果对比,VoxelMorph的和ANTs的类似,没有画出。
【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

由上图可知,本文所提出的模型不仅在Dice值上达到了最好的水平,而且运行时间更快,并且配准形变场是微分同胚的(几乎没有非负的雅克比体素)。

通过是实验发现σ2(0.035)2\sigma^2\sim(0.035)^2并且λ(2w,10w)\lambda\in(2w,10w)时效果最好,本文中使用的是λ=7w\lambda=7w
【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

上图是ANTs、VoxelMorph和本文配准结果在脑部各个结构的Dice值对比。
【论文笔记】Prob-VoxelMorph:保证形变场微分同胚性并防止形变场重叠的医学图像配准模型

上图中的左图的速度场的不确定性H(z)H(z)表明了在结构边缘的低不确定性,如中间的折线图所示,这种相关性在最终的配准场的不确定性H(ϕz)H(\phi_z)中并不明显,如右图所示。