推荐系统简介

一:推荐系统的分类

基于数据源的分类

1.基于人口统计学的推荐(用户)

2.基于内容的推荐(物品)

3.基于协同过滤的推荐(行为)

二:推荐算法简介

1.基于人口统计学的推荐

推荐系统简介

2.基于内容的推荐

推荐系统简介

3.基于协同过滤的推荐

3.1基于用户的协同过滤推荐算法

推荐系统简介

3.2基于物品的协同过滤推荐算法 

推荐系统简介

4.混合推荐

三:推荐系统的评测

1.很多网站都有让用户给物品打分的功能,如果知道用户对物品的历史评分,就可以从中学习一个兴趣模型,从而预测用户对新物品的评分

2.预测的准确度一般用均方根误差(RMSE)或平均绝对误差(MAE)计算

RMSE

是预测值与实际值偏差的平方和与观测次数T比值的平方根

推荐系统简介

MAE

是绝对误差的平均值

推荐系统简介
3.Top-N推荐
网站提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做Top-N推荐;
Top-N推荐的预测准确率一般用精确率(precision)和召回率(recall)来度量;

TP:样本为正,预测结果为正;

FP:样本为负,预测结果为正;

TN:样本为负,预测结果为负;

FN:样本为正,预测结果为负。

准确率、精准率和召回率的计算公式如下:

准确率(accuracy): (TP + TN )/( TP + FP + TN + FN)

精准率(precision):TP / (TP + FP),正确预测为正占全部预测为正的比例

召回率(recall): TP / (TP + FN),正确预测为正占全部正样本的比例