最近看到好几篇论文如Colorization,poisson image editing等都使用线性系统求解泊松方程。今天找一篇文章简单推导一下:
参考论文:AppWand: Editing Measured Materials using Appearance-Driven Optimization, SIGGRAPH 07
论文是编辑传播领域的经典论文,用于将局部的编辑,传播到图像的所有区域,实现全局合理的颜色编辑。论文的核心能量函数为:
E=i∑(ei−gi)2wi+i∑j∈Ni∑(ei−ej)2zij(1)
其中,ei为待求的编辑参数, gi为已知的编辑部分,如果第 i 个像素被着色了, 那么 wi=1, 否则 wi=0。zij 为已知量的表示像素 i 和像素 j 的相似度。
我们对(1)中 ei 求导有:
∂E/∂ei=∑i2(ei−gi)wi+∑i∑j∈Ni2(ei−ej)zij+∑i∑j∈Ni2(ej−ei)zji
注意最后一项,因为 ei 和 ej 相邻,所以, ei 同样会出现在所有邻居的邻居中。
令上式为0:
∂E/∂ei=∑i2(ei−gi)wi+∑i∑j∈Ni2(ei−ej)zij+∑i∑j∈Ni2(ej−ei)zji=0
∑i(ei−gi)wi+∑i∑j∈Ni2(ei−ej)zij=0
∑ieiwi+∑i∑j∈Ni2(ei−ej)zij=∑igiwi
实际上已经构建了一个Ae=b的线性系统:
Aij=⎩⎪⎨⎪⎧wi+∑j∈Nizij,−2zij,0,i=jj∈Niotherwise.
上述案例其实完全可以手动推导,只需要给定如下的水平放置的3个像素即可推导。
总的能量公式为:
E=(e1−g1)2w1+(e3−g3)2w3+(e1−e2)2z12+(e1−e3)2z13+(e2−e1)2z21+(e2−e3)2z23+(e3−e1)2z31+(e3−e2)2z32
∂E/∂e1=2(e1−g1)w1+4(e1−e2)z12+4(e1−e3)z13
∂E/∂e2=4(e2−e1)z21+4(e2−e3)z23
∂E/∂e3=2(e3−g3)w3+4(e3−e1)z31+4(e3−e2)z32
令几个偏导数 = 0:
e1(w1+2z12+2z13)−2e2z12−2e3z13=g1w1
e2(z12+z23)−e1z12−e3z23=0
e3(w3+2z31+2z32)−2e1z31−2e2z32=g3w3
因此,跟上面的公式保持一致。
如果直接从矩阵形式推导应该也可以,可能会用到如下几个简单矩阵求导公式:
参考一本矩阵书:https://www.math.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf