可转换为Ax=b的二次能量优化

最近看到好几篇论文如Colorization，poisson image editing等都使用线性系统求解泊松方程。今天找一篇文章简单推导一下：

参考论文：AppWand: Editing Measured Materials using Appearance-Driven Optimization， SIGGRAPH 07
可转换为Ax=b的二次能量优化
论文是编辑传播领域的经典论文，用于将局部的编辑，传播到图像的所有区域，实现全局合理的颜色编辑。论文的核心能量函数为：

$E =\sum_i{(e_i-g_i})^2w_i +\sum_i\sum_{j\in N_i }(e_i-e_j)^2z_{ij } （1）$

其中， $e_i$ 为待求的编辑参数， $g_i$ 为已知的编辑部分，如果第 $i$ 个像素被着色了，那么 $w_i = 1$ , 否则 $w_i = 0$ 。 $z_{ij}$ 为已知量的表示像素 $i$ 和像素 $j$ 的相似度。

我们对（1）中 $e_i$ 求导有：

$\partial E /\partial e_i= \sum_i{2(e_i-g_i})w_i +\sum_i\sum_{j\in N_i }2(e_i-e_j)z_{ij} + \sum_i\sum_{j\in N_i }2(e_j-e_i)z_{ji}$

注意最后一项，因为 $e_i$ 和 $e_j$ 相邻，所以， $e_i$ 同样会出现在所有邻居的邻居中。
令上式为0：

$\partial E /\partial e_i= \sum_i{2(e_i-g_i})w_i +\sum_i\sum_{j\in N_i }2(e_i-e_j)z_{ij} + \sum_i\sum_{j\in N_i }2(e_j-e_i)z_{ji} = 0$

$\sum_i{(e_i-g_i})w_i +\sum_i\sum_{j\in N_i }2(e_i-e_j)z_{ij} = 0$

$\sum_i{e_iw_i} +\sum_i\sum_{j\in N_i }2(e_i-e_j)z_{ij} =\sum_i{g_iw_i}$

实际上已经构建了一个 $Ae = b$ 的线性系统：

$A_{ij} = \begin{cases} w_i + \sum_{j\in N_i}z_{ij} ,& i = j\\ -2z_{ij} ,& j \in N_i\\ 0, & otherwise\end{cases}.$

上述案例其实完全可以手动推导，只需要给定如下的水平放置的3个像素即可推导。
可转换为Ax=b的二次能量优化
总的能量公式为：

$E = (e_1-g_1)^2w_1 + (e_3-g_3)^2w_3 + (e_1-e_2)^2z_{12} +(e_1-e_3)^2z_{13}+(e_2-e_1)^2z_{21} + (e_2-e_3)^2z_{23}+(e_3-e_1)^2z_{31} + (e_3-e_2)^2z_{32}$

$\partial E /\partial e_1 =2(e_1-g_1)w_1+4(e_1-e_2)z_{12}+4(e_1-e_3)z_{13}$

$\partial E /\partial e_2 =4(e_2-e_1)z_21+4(e_2-e_3)z_{23}$

$\partial E /\partial e_3 =2(e_3-g_3)w_3+4(e_3-e_1)z_{31}+4(e_3-e_2)z_{32}$

令几个偏导数 = 0：

$e_1(w_1+2z_{12}+2z_{13}) -2e_2z_{12}-2e_3z_{13} = g_1w_1$

$e_2(z_{12}+z_{23}) -e_1z_{12}-e_3z_{23} = 0$

$e_3(w_3+2z_{31}+2z_{32}) -2e_1z_{31}-2e_2z_{32} = g_3w_3$

因此，跟上面的公式保持一致。

如果直接从矩阵形式推导应该也可以，可能会用到如下几个简单矩阵求导公式：
可转换为Ax=b的二次能量优化

参考一本矩阵书：https://www.math.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf

可转换为Ax=b的二次能量优化

相关推荐