论文阅读笔记:A Survey on Knowledge Graph-Based Recommender Systems


原文: A Survey on Knowledge Graph-Based Recommender Systems.
28 Feb 2020
中科院计算所百度微软等学者

一、Abstract

为了解决各种在线应用中的信息爆炸问题,提高用户体验,推荐系统被提出来进行用户偏好建模。尽管人们已经做出了许多努力来实现更加个性化的推荐,但是推荐系统仍然面临着一些挑战,比如数据稀疏性和冷启动。近年来,以知识图谱作为边信息生成推荐引起了人们的极大兴趣。这种方法不仅可以缓解上述问题,提供更准确的推荐,而且可以对推荐的项目进行解释。 本文对基于知识图谱的推荐系统进行了系统的研究。我们收集了这一领域最近发表的论文,并从两个角度进行了总结。一方面,我们通过研究论文如何利用知识图谱进行准确和可解释的推荐来研究所提出的算法。另一方面,我们介绍了这些工作中使用的数据集。最后,我们提出了几个可能的研究方向。

二、Introduction

推荐算法是推荐系统的核心部分,主要分为

  1. 基于协同过滤(CF)的推荐系统:基于用户或项目在交互数据中的相似性来建模用户偏好。
  2. 基于内容的推荐系统:利用项目的内容特征。
  3. 混合推荐系统

基于CF的推荐系统由于能够有效地捕捉用户的偏好并易于实现而得到了广泛的应用。在多个场景下,不需要在基于内容的推荐系统中提取特征[5],[6]。然而,基于CF的推荐存在数据稀疏冷启动问题[6]。为了统一推荐系统的相似性和交互性,提出了混合的内容推荐系统。
KG是一个异构图,其中节点作为实体,边表示实体之间的关系。

将知识图谱应用在推荐系统的好处:

  1. 提高推荐系统的精度;
  2. 推荐的结果具有可解释性。

论文阅读笔记:A Survey on Knowledge Graph-Based Recommender Systems

推荐任务是向给定的用户推荐一个或一系列未被观察到的项目,它可以被描述为以下步骤:

  1. 首先,系统学习给定用户和项目的向量表示。
  2. 然后,它学习了一个评分函数:f : ui × vj → yˆi,j,它建模ui对vj的偏好。
  3. 最后,通过对项目的偏好得分排序来生成推荐。

要学习用户/项目的向量表示和评分函数,有三种主要方法:

2.1. Collaborative Filtering:

•CF假设用户可能对与他们共享相似交互记录的人选择的项目感兴趣。交互可以是显式交互,比如评级,也可以是隐式交互,比如点击查看。为了实现基于CF的推荐,需要来自多个用户和项目的交互数据,从而形成用户-项目交互矩阵。基于CF的方法包含两种主要技术,基于内存的CF和基于模型的CF。
具体地说,基于内存的CF首先从用户项交互数据中学习用户-用户相似性。然后,根据与特定用户相似的人的交互记录,将未观察到的项目推荐给给定的用户。
或者,一些模型学习项目之间的相似性,并根据用户的购买历史向用户推荐类似的项目。基于模型的CF方法试图通过建立一个推理模型来缓解稀疏性问题。一种常见的实现方法是潜因子模型[55],[56],它从高维的用户-项目交互矩阵中提取用户和项目的潜在表示,然后用内积或其他方法计算用户和项目之间的相似性。

2.2. Content-based Filtering:

•与基于CF的模型(从全局用户-项目交互数据中学习用户和项目的表示)相比,基于内容的方法从项目的内容描述用户和项目。基于内容过滤的假设是,用户可能对与他们过去交互的项目相似的项目感兴趣。项目表示是从项目的辅助信息中提取属性,包括文本、图像等,而用户表示是基于个人交互项目的特征。将候选项与用户配置文件进行比较的过程实际上是将它们与用户以前的记录进行匹配。因此,这种方法倾向于推荐与用户过去喜欢的项目相似的项目[57]。

2.3. Hybrid Method:

•混合方法是利用多种推荐技术,以克服仅使用一种方法的局限性。基于CF的推荐算法的一个主要问题是用户项交互数据的稀疏性,使得从交互角度寻找相似的条目或用户变得困难。这个问题的一个特例是冷启动问题,这意味着对于新用户或项目的推荐是困难的,因为没有任何交互记录就无法确定用户和项目项的相似性。通过将用户和项目的内容信息(也称为用户侧信息和项目侧信息)整合到基于CF的框架中,可以获得更好的推荐性能。一些常用的项目信息包括项目属性,如品牌、类别;项目多媒体信息,如文本描述、图像特征、音频信号、视频特征;以及项目评论。用户侧信息的常见选项包括用户的人口统计信息,包括职业、性别和爱好;以及用户网络。在这篇论文中,基于KG的推荐系统利用KG作为辅助信息,结合基于CF的技术来获得更准确的推荐。

三、知识图谱推荐系统的3种方法:

基于嵌入的方法、基于路径的方法和统一的方法
论文阅读笔记:A Survey on Knowledge Graph-Based Recommender Systems

3.1 Embedding-based Methods

KGE算法可分为两类[98]:翻译距离模型,如TransE[99]、TransH[100]、TransR[101]、TransD[102]等;语义匹配模型,如DistMult[103]。

3.2 Path-based Methods

3.3 Unified Methods