网络中,高阶链接模式是控制和调节复杂系统的基本结构,大部分高阶结构是指一个小的子图,这种小的子图是复杂系统的建筑块。例如,正反馈回路是调控网络的关键要素,三元组是社交网络的关键,双向开三角结构是大脑hub节点的关键,开三角结构是航空网络的关键模式。这里介绍高阶结构,并提出一种聚类框架。
给定一个网络模块M,寻找一种聚类S以满足两种目标。首先,节点应参与尽量多的模块M,其次集合S应避免破坏模块M。即,给定模块M,高阶聚类方法的目标是最小
ϕM(S)=cutM(S,S¯¯¯)/min[volM(S),volM(S¯¯¯)](1)
cutM(S,S¯¯¯)是被分割开来的
M的个数,
volM(S)是
S中
M的节点数。算法借鉴谱聚类的方法,算法流程是
1.给定一个网络和一种模块
M,算出矩阵
WM,其中元素
(i,j)表示节点
i,j共现于
M中的次数。
2.计算由
WM产生的拉普拉斯谱排序
σ。
3.找到
σ排序的前
r个组成的集合作为
Sr={σ1,…,σr},依据是
S:=argminrϕM(Sr)。
我们的方法统一了模块分析和网络聚类这两个基础方向,揭示了组织结构和模块。之前的分析没有给出最差情况下的聚类保证,以及随网络规模增加而导致的复杂度,补充材料里的理论结果说明了超图聚类方法对于特殊的有向图是更加通用的。
考虑无向图
G=(V,E),
|V|=n,进一步假设没有独立点,
W记为图的权重,对角矩阵
D记为
Dii=∑nj=1Wij,拉普拉斯矩阵为
L=D−W。对于集合
S,则
ϕ(G)(S)为
ϕ(G)(S)=cut(G)(S,S¯¯¯)/min(vol(G)(S),vol(G)(S¯¯¯))(3)
cut(G)(S,S¯¯¯)=∑i∈S,j∈S¯¯¯¯Wij(4)
vol(G)(S)=∑i∈SDii(5)
cut(G)(S,S¯¯¯)=weighted sum of edges that are cut(6)
vol(G)(S)=weighted number of edge end points in S(7)
x表示集合
S的向量,
xi=1表示节点
i在
S中,
xi=0表示节点
i在
S¯¯¯中,若边
(i,j)被分开,则
(xi−xj)2=1,反之
(xi−xj)2=0,于是
xTLx=cut(G)(S,S¯¯¯)=∑(i,j)∈Ewij(xi−xj)2(9)
在这里定义
(B,A),其中
B是一个
k×k的二值矩阵,
A是一个节点集合,
B编码连边模式,
A表示模块的子集,在很多时候
A表示节点的整个集合。
set(⋅)将有序元组变成无序元组,
set((v1,v2,…,vk))={v1,v2,…,vk},
M(B,A)={(set(v),set(χA(v)))|v∈Vk,v1,…,vk}(10)
若
χA(v)=v,则为simple motifs,否则为anchored motifs。
公式(10)可以重新写为
cut(G)M(S,S¯¯¯)=∑(v,χA(v))∈M1(∃i,j∈χA(v)|i∈S,j∈S¯¯¯)(17)
vol(G)M(S)=∑(v,χA)∈M∑i∈χA(v)1(i∈S)(18)
(WM)ij=∑(v,χA)∈M1({i,j})⊂χA(v))(20)
(DM)ii=∑nj=1(WM)ij,
LM=DM−WM,最后
LM=D−1/2MLMD−1/2M=I−D−1/2MWMD−1/2M,使用特征向量
LM进行分类。


引理1.令
G=(V,E)为一个无权重有向图,
GM是基于模块的有权重图,
|A|≥2则对于任意
S⊂V,有
vol(G)M(S)=1|A|−1vol(GM)(S)
引理2.令
xi,xj,xk∈{−1,1},则
4⋅1(xi,xjxk not all the same)=x2i+x2j+x2k−xixj−xjxk−xkxi
引理3.令
z∈{0,1}n,若
zi=1则
xi=1,若
zi=1则
xi=−1,则对于
L=D−W,有
4zTLz=xTLx。
引理4.令
G=(V,E)有向无权重图,
GM是基于
|A|=3的模块的有权重图,对于
S⊂V,有
cut(G)M(S,S¯¯¯)=12cut(GM)(S,S¯¯¯)
定理5.令
G=(V,E)有向无权重图,
WM有权重邻接矩阵,且模块
|A|=3,则对于
S⊂V,有
ϕ(G)M(S)=ϕ(GM)(S)
定理6.假设使用算法1找到较好的集合
S,令
ϕ∗=minS′ϕ(G)M(S′)为最优集合,则
1.
ϕ(G)M≤4ϕ∗−−√ and
2.
ϕ∗≥λ2/2
引理7.令
xi,xjxk,xl∈{−1,1},则有
8⋅1(xi,xj,xk,xl not all the same)=(7−xixj−xixk−xixl−xjxk−xjxl−xkxl−xixjxkxl)(21)
引理8.令
G=(V,E)有向无权重图,
GM基于
|A|=4模块有权重图,则对于
S⊂V,有
cut(G)M(S,S¯¯¯)=13cut(GM)(S,S¯¯¯)−∑(v,{i,j,k,l}∈M)13⋅1(exactly two of i,j,k,l in S)
定理9.令
G=(V,E)有向无权重图,
WM基于
|A|=4模块邻接矩阵,则对于
S⊂V,有
ϕ(G)M(S)=ϕ(GM)(S)−∑(v,{i,j,k,l})∈M1(exactly two of i,j,k,l in S)vol(GM)(S)