十月组队学习之——推荐系统Task03-矩阵分解和FM

    有幸参加了DataWhale举办的推荐系统组队学习。收获颇多。

    每天记录一些自己之前的知识盲点,需经常温习。

4
矩阵分解
4.1
隐语义模型与矩阵分解

        协同过滤算法的特点就是完全没有利用到物品本身或者是用户自身的属性, 仅仅利用了用户与物品的交互信息就可以实现推荐,是一个可解释性很强, 非常直观的模型, 但是也存在一些问题, 第一个就是处理稀疏矩阵的能力比较弱, 所以为了使得协同过滤更好处理稀疏矩阵问题,增强泛化能力, 从协同过滤中衍生出矩阵分解模型(Matrix Factorization,MF)或者叫隐语义模型, 两者差不多说的一个意思, 就是在协同过滤共现矩阵的基础上, 使用更稠密的隐向量表示用户和物品,挖掘用户和物品的隐含兴趣和隐含特征, 在一定程度上弥补协同过滤模型处理稀疏矩阵能力不足的问题。

4.2
隐语义模型

隐语义模型最早在文本领域被提出,用于找到文本的隐含语义。在2006年, 被用于推荐中, 它的核心思想是通过隐含特征(latent factor)联系用户兴趣和物品(item),基于用户的行为找出潜在的主题和分类,然后对item进行自动聚类,划分到不同类别/主题(用户的兴趣)。

这么说可能有点抽象,所以下面拿项亮老师《推荐系统实践》里面的那个例子看一下:

十月组队学习之——推荐系统Task03-矩阵分解和FM