1 摘要

HIN中不同的元路径有不同的语义信息，现有的工作都是对于所有节点，为元路径(meta paths)分配相同的权重，忽视了不同类型的节点在不同的元路径上的个性的特征。

而且现有的工作不能充分发掘出，反应节点在语义空间中的偏好信息的路径实例(path instances)之间的不同。

为解决上述问题，本文提出HAHE模型(Hierarchical Attentive Heterogeneous information network Embedding)，分别在meta paths和path instances的语义空间，捕获到节点个性化的偏好信息(personalized preferences)。

因为path instances是基于meta path的，所以可用一个分层注意力机制，来建模meta paths和path instances上的个性化偏好。

2 介绍

2.1 现有方法的不足

首先，现有的方法要不就是不区分meta paths，要不就是对于所有节点，为meta paths赋予相同的权重。这样的话，节点在meta paths中的个性化信息不能被获取到，也不能充分获取到节点间的相似性(proximity)信息。

以HIN中的朋友推荐为例，有的用户可能想关注tag相似的用户，有的用户想关注location相似的用户。若只是对全局偏好信息进行建模，则会损失掉个性偏好信息，不利于embedding。

所以，需要在meta paths上为个性偏好信息建模。

其次，现有的方法捕获不到path instances中的个性偏好信息。

HIN可以看成是在给定meta paths的条件下，节点通过path instances的连接。现有的相似度衡量方法，忽略了path instances之间的不同。

还是以HIN中的朋友推荐为例，给定元路径user-tag-user，一个user可能通过多个path instances和多个user相连。而连接它们的tags也许并不合适，因为一个user可能有多个tags，或者tags的数量很少。就需要对这些path instances进行辨别，突出最相关的path instances，忽略掉噪声，已学习到更好的embedding。

2.2 作者提出

提出HAHE模型，在meta paths和path instances上建模个性偏好信息，以学习到更有效的HIN embedding。

path instances是基于meta paths的，所以使用分两层的注意力机制：元路径注意力层(meta path attention layer)和路径实例注意力层(path instances attention layer)。其中元路径注意力层为每个节点学习到面向meta paths的个性偏好，路径实例注意力层辨别path instances在给定meta paths条件下的重要程度。

在HIN embedding中使用注意力的优点：

（1）提升了HAHE模型在面向HIN的噪声部分建模的鲁棒性，提升了signal-to-noise(SNR)系数。

（2）注意力机制在建模节点时，突出了在所给任务的前提下，和该节点最相关的节点。使得模型更具有可解释性。

注：
（1）本文是自己定义元路径的，因为元路径的自动发现并不是本文的研究内容。
（2）本文设置了Target/Content type nodes，只学习target type nodes的节点表示。若要学习到所有类型节点的表示，需要将所有的节点类型都设为target type。

2.3 贡献

（1）提出HAHE模型，捕获在meta paths和path instances上的个性偏好信息，用于HIN embedding。

（2）设计了分层注意力机制，学习在meta paths和path instances上的注意力系数。

3 HAHE模型

模型结构如下图所示：

3.1 Path instance attention layer

**这一注意力层的目的是，学习到meta path $\pi$ 的嵌入表示 $H^\pi$ ，**以区分path instances。

使用基于邻接向量 $A^\pi_i$ 的meta path，作为节点 $v_i$ 的结构特征表示。

通过path instances与 $v_i$ 相连的节点，与 $v_i$ 结构特征相似的节点，对应的注意力系数 $\alpha^\pi$ 应该更大，计算如下：

由于 $A^\pi_i$ 可能稀疏且高维，所以使用MLP将其转换到 $d$ 维。上式中的 $s^\pi_{ij}$ 就是基于meta path $\pi$ ，节点 $v_i, v_j$ 转换后的相似度。 $W^\pi_f$ 是针对 $\pi$ 的结构特征转换矩阵。 $\alpha^\pi_{ij}$ 是基于meta path $\pi$ ，为与节点 $v_i$ 相连的节点 $v_j$ 分配的注意力系数。这个注意力系数，是为了学习到向量 $h^\pi_i$ ， $i$ 是节点下标， $\pi$ 是元路径。

由于与一个节点相连的path instances可能非常多，全部聚合这么多节点的信息会导致聚合的特征变得稀疏。所以从连接的节点集合中均匀采样部分节点，进行信息聚合，得到聚合embedding $h^\pi_{N(i)}$ ：

再接着，聚合 $h^\pi_{N(i)}$ （针对元路径 $\pi$ 的邻居的embedding）和节点自身的特征，得到 $h^\pi_i$ ：

学习到的meta path based embedding $h^\pi_i$ 不仅含有节点自身的特征，还加权聚合了通过path instances与该节点相连的其他节点们的特征。

3.2 Meta path attention layer

给定path instance attention layer学习到的mata path based embedding ${H^1, H^2, ... H^M}$ ，应结合这些embedding以得到更易理解的节点embedding。每一个meta path based embedding，都保留了接地那在特定语义空间中的相似性信息。