推荐系统五
今天开始真正的推荐系统:
先来说一下推荐算法
- CB(Content--Base):基于内容的推荐算法
- CF(Collaborative--Filterin):基于协同过滤的推荐算法
那么关于CB算法呢
1、引入Item属性的Content Base推荐:
工作原理:
1图中的item属于物品元数据信息,会先将所有的元数据信息,经过正排再倒排后存放再nosql数据库中,即图中的内容属性索引
2 用户进行页面浏览数据,在推荐引擎中的分词服务会将词语进行切分,给数据库
3 返回大量的推荐列表信息
4 最后经过精排和去重,根据top-n原则展示排名前五个的物品
简单理解
比如我们在淘宝上买东西,买一个电脑,接下来基于item属性来推荐相关的物品,如会推荐一些二级,内存条,电脑包等。
优缺点:
优点:提升推荐结果的相关性;结果可解释(因为用户可以感知到);
缺点:没有个性化,依赖对item的深度分析。
2、引入user属性的Content Base推荐
工作原理:
1 类似item属性的Content Base但是引入了对用户的行为数据分析
2 用户行为数据就是用户的历史行为信息,比如:观看列表,点击行为等
3 对这些行为进行建模,可以理解为在下一次从给用户推荐的时候除了在展示页面展示用户点击内容外,根据用户历史行为可以进行相关的推荐。
简单说明:
比如我们多次在淘宝购物,哪个接下来会基于user推荐相关的物品,比如电脑包等,但是用户第一个购买了手机,这一次也会推荐手机壳等。
优缺点:
优点:用户模型刻画了用户兴趣需求(建立用户画像)
推荐形式多样,具有个性化
结果可解释
缺点:推荐精度低
马太效应(喜欢一样东西,推荐更多的类似物品)
用户行为稀疏导致覆盖率低