【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

图分析的问题:计算量大、空间消耗大。graph embedding 的本质就是在保留图信息的情况下(表示图),把它转换到低维空间。其和图分析、表示学习相关。

图嵌入的输入(graph embedding input)和输出(graph embedding output)介绍图嵌入(Graph Embedding),因为大部分图嵌入研究的是每个节点生成一个embedding,所以下面说明图嵌入的输入假设输出为节点的embedding。

目录

目录

一、embedding input:

1、同构图进一步分为带权\无权图或者有向\无向图:

2、异构图主要存在于下面三个方面:

2.1、基于社区的问答网站:

2.2、多媒体网络:

2.3、知识图谱:

2.4、其他:

3、带有额外信息(auxiliary information)的图

4、从关系型数据建立的图

5、graph embedding 

二、embedding output

1、节点嵌入:

2、边嵌入(使用了三元组):

3、合成嵌入:

4、全图嵌入:

三、Graph Embedding Techniques

四、未来的方向

1、计算性方面

2、问题方面

3、技术方面


 


一、embedding input:

1、同构图进一步分为带权\无权图或者有向\无向图

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

challenge:同质图只有结构信息,所以挑战是用embedding尽可能保留连接模式(connectivity pattern)。

2、异构图主要存在于下面三个方面:

2.1、基于社区的问答网站:

不同类型的节点:问题、答案、用户等,根据利用的边不同区分的表

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

2.2、多媒体网络:

涵盖多种媒体信息的网络,如图像、文本等多种类别信息。

2.3、知识图谱:

例子:从freebase构建的与电影相关的知识图谱,实体类型如**“director”、“actor”、“file”等,关系类型如“produce”,“direct”,“act_in”**等。

2.4、其他:

wikipedia、移动数据图等。

challenge:不同类型的对象都嵌入在同一空间,如何在不同类型的对象上得到全局一致性(global consistency),如果不同类型的对象存在偏置,怎么处理?

3、带有额外信息(auxiliary information)的图

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

challenge:怎么把丰富的非结构信息与需要保留的拓扑信息一同保留进embedding中。

4、从关系型数据建立的图

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

challenge: 怎么对非关系型数据计算关系。

5、graph embedding 

1. 把相似度矩阵当成邻接矩阵。2.从 input中提取node,再根据其中的一些关系当做edge。

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

二、embedding output

图嵌入的输出是有任务驱动的(task driven),因为节点的embedding得到之后常用来做聚类、分类任务,但是并不局限于节点级别,可以对节点对、子图、整个图用来做embedding然后用来做应用需要的任务,所以图嵌入输出的第一个问题便是:为embedding找一个合适的输出类型。

1、节点嵌入:

近邻节点的输出embedding相似,但是怎么衡量节点间的**“closeness”**,除了一阶、二阶近邻、还有高阶邻近,此外,也有定义同一社区内的节点输出的embedding相似。

challenge: 节点嵌入的最大挑战是如何对不同类型的输入图定义节点间的相似性并在训练过程中保留这种相似性到embedding中。

2、边嵌入(使用了三元组):

目的是得到边的embedding。如知识图谱的embedding都是学习实体和关系的embedding,基于hhh 和 ttt 学习得到 rrr的embedding,那么就可以在后面预测缺失的实体\关系,做知识图谱的补全。还有如node2vecnode2vecnode2vec 在节点的embedding上得到边的embedding,让节点对具有可比性,从而用来预测边的存在。

challenge:挑战是怎么定义边的相似性问题、如果边具有非对称性(asymmetric property)如何建立模型保留(即有向边的性质)?

3、合成嵌入:

即节点与边的共同embedding,子图的embedding,路径的embedding

对子图做embedding,从而得到图的分类。
[94]对查询实体到问答实体的路径和子图做embedding
[94] A. Bordes, S. Chopra, and J. Weston, “Question answering with
subgraph embeddings,” in EMNLP, 2014, pp. 615–620.

社区做embedding,一个社区嵌入为一个向量。
注:节点嵌入与社区嵌入的互相加入能提高各自的embedding。
challenge: 怎么得到目标子结构(即所需要的embedding做的正是所需要的子结构的embedding而不是不需要的子结构的embedding),因为子结构的嵌入并没有给出其目的是为什么,以及在**同一空间怎么对不同类型的图做embedding。**对embedding的目标类型具有的异构特性怎么做embedding。

4、全图嵌入:

蛋白质、分子的全图做embedding,有助于图分类、图相似比对等

challenge: 怎么得到全局意义上的图性质,以及对有效性(得到图的全局性质一般耗时)和表达性做平衡(trade-off)(embedding的有效信息多大)。

三、Graph Embedding Techniques

graph embedding算法的不同之处在于:保留什么样的graph property,而这由不同的定义来决定总览方法

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

【图嵌入综述2】A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications

四、未来的方向

1、计算性方面

DL用GPU加速,但是图不具有格结构(grid structure)所以需要新的方法提高效率。

2、问题方面

动态图做embedding:图结构随着时间在改变、节点\边被时间因素影响。

3、技术方面

边重构需要具有结构意识(structure awareness),但是目前的边重构方法主要对1-hop的边做重构,这提供了边的局部信息,但是忽略了边的全局信息(如路径,树,子图模式等),所以有些工作如探索KB的paths信息。但是都是用的DL的方法(缺点:效率),怎么设计非DL的方法是个问题。所以图的子结构embedding,结合子结构采样是目前需要的

 

转载  CherrySSS  https://www.jianshu.com/p/c3cb863651e0

参考

https://blog.csdn.net/NockinOnHeavensDoor/article/details/80661180

https://blog.csdn.net/u010608169/article/details/78899323