图因式分解GraphFactorization

Distributed Large-scale Natural Graph Factorization
Graph Embedding Techniques, Applications, and Performance: A Survey

综述里的描述
图因式分解GraphFactorization

博客上LLE、拉普拉斯特征图的资料不少,但是Graph Factorization的很少,也可能是名字太普通了。。。只能自己看论文了。。。

主要是实现了分布式计算,以及较低的时间复杂度,做图的降维

这里不关注分布式实现,只看最基本的思路和解法

符号定义

符号 定义
G
n=|V| 结点数
m=|E| 边数
N(v) 结点邻居
YRn×n 边权重
ZRn×r 因式分解后
λ 正则参数

基本假设,认为通过降维后的结点向量的内积<Zi,Zj>可以表达出边权重Yij,再加上正则项得到如下目标函数

f(Y,Z,λ)=12(i,j)E(Yij<Zi,Zj>)2+λ2iZi2

Zi求偏导得到
fZi=jN(i)(Yij<Zi,Zj>)Zj+λZi

对于每条边有
(Yij<Zi,Zj>)ZjλZi

最后,用SGD更新参数,整体的算法流程为
图因式分解GraphFactorization