CS224w-class2:

衡量一个图

度分布:P(K)
描述图中节点的度的概率分布
P(K)=Nk/N(Nkk)P(K)=N_k/N (N_k表示度数为k的节点数量)
CS224w-class2:

路径长度:h
路径指的是图中依次连接的节点序列。相邻2个节点构成一条边。
如:ACBDE,描述了从节点A到节点E的路径,其中AC,CB,BD,DE都是存在的边。
距离:表示最短的路径需要的边数目。
直径(diameter):表示图中的存在的最长的最短路径。(相距最远的2个节点的路径长度)
平均路径长度:
计算一般忽略无穷大的路径长度。CS224w-class2:

聚类系数:C(无向图)
聚类系数描述了节点的邻居节点之间的紧密程度。
CS224w-class2:
平均聚类系数:C=(1/N)iNCiC=(1/N) \sum^N_i C_i
连通分量:s
一般都是找最大连通分量。
CS224w-class2:

随机图GMP

用节点数n还有2个节点组成边的概率p来定义一个随机图。
然后分析随机图的四个指标:
CS224w-class2:
随着P的改变,随机图的最大连通分量也发生了变换:
CS224w-class2:
用随机图和真实世界的MSN社交图进行对比:
CS224w-class2:
可以看到随机图在连通分量和平均路径长度上与现实网络是贴合的。但在度分布和聚类系数上是不同的。随机网络的聚类系数现实中大多数网络不是随机的。
随机模型的意义:
它是其他类型图的参考模型
它将帮助我们计算很多量,然后可以与真实数据进行比较
它将帮助我们理解某个特定属性在多大程度上是某个随机过程的结果