Neighborhood Matching Network for Entity Alignment 邻域匹配网络用于实体对齐
Neighborhood Matching Network for Entity Alignment
邻域匹配网络用于实体对齐
作者:Peking University, China & University of Leeds, U.K
原文地址: https://www.aclweb.org/anthology/2020.acl-main.578.pdf
Github: https://github.com/StephanieWyt/NMN
目录
Neighborhood Matching Network for Entity Alignment
传统: Embedding-based entity alignment
文章:只用少量pre-aligned entities 做训练集,NMN 自动选择最具判别的邻居。
背景
知识图之间的结构异构性是实体对齐的一个突出挑战。现实生活中的knowledge graphs (KGs) KG通常是不完整的,并且不同的KG通常具有异构的模式。因此,来自两个KG的相同实体可能具有不同的形式或不相似的邻域结构。目前的方法主要是一种利用一组种子对齐,基于嵌入的方法对KG结构进行建模,以自动学习如何将不同KG之间的相同实体映射到统一的向量空间中,通过测量两个实体嵌入之间的距离来执行实体对齐。在这个方向上,绝大多数先前的研究都建立在一个重要的假设基础上,实体和它们的来自其他KG的对应物(counterparts)具有相似的邻域结构,则相似的嵌入将被生成为等效实体。但是,由于KG的不完全性和异质性,这个假设并不总是适用于真实场景。如下图(a)*中英文版本的两个等价实体。在这里,两个中心实体指的是同一个现实世界的身份,布鲁克林,纽约市的一个行政区。然而,这两个城市有不同的邻域和不同的拓扑结构。图(b) 这两个中心实体(都表示利物浦城)有着相似大小的社区和三个共同的邻居。然而,这三个共同的邻国(United Kingdom, England and Labour Party (UK))的区别性不够强。这是因为 England 有许多城市实体,在他们的街区也有这三个实体;
传统: Embedding-based entity alignment
- TransE
- MTransE
- JAPE
- IPTransE
- BoostEA
- OETA
- GNNs
- GCN-Align
- GMNN
- RDGCN
- AVR-GCN
- HGCN-JE
- Others
- KDCoE
- AttrE
- MultiKE
- HMAN
目前:解决异质问题
MuGNN:需要预对齐实体和关系
AliNet:只考虑one-hop距离(只考虑第一邻居)
文章:只用少量pre-aligned entities 做训练集,NMN 自动选择最具判别的邻居。
创新点
文章提出了一种新的实体对齐框架-邻域匹配网络(Neighborhood Matching Network (NMN))。NMN通过估计实体之间的相似性来获取拓扑结构和邻域差异。它提供了两个创新的组件,以更好地学习表示实体对齐。
- 使用一种新的图采样(graph sampling)方法为每个实体提取一个有判别力的邻域(discriminative neighborhood)。
- 采用基于注意力的交叉图邻域匹配模块级联对比两个实体的最具判别的子图实现鲁棒实体对齐。
这种策略允许NMN有效地构造面向匹配的实体表示,同时忽略对对齐任务有负面影响的噪声邻居。在三个实体比对数据集上的大量实验表明,NMN在更困难的情况下能够很好地估计邻域相似度,显著优于12种现有的方法。
方法
定义一个KG图: 分别表示实体、关系、三元组,目标:发现等效实体图 ,,得到等效实体对 ,