推荐系统简介
一:推荐系统的分类
基于数据源的分类
1.基于人口统计学的推荐(用户)
2.基于内容的推荐(物品)
3.基于协同过滤的推荐(行为)
二:推荐算法简介
1.基于人口统计学的推荐
2.基于内容的推荐
3.基于协同过滤的推荐
3.1基于用户的协同过滤推荐算法
3.2基于物品的协同过滤推荐算法
4.混合推荐
三:推荐系统的评测
1.很多网站都有让用户给物品打分的功能,如果知道用户对物品的历史评分,就可以从中学习一个兴趣模型,从而预测用户对新物品的评分
2.预测的准确度一般用均方根误差(RMSE)或平均绝对误差(MAE)计算
RMSE
是预测值与实际值偏差的平方和与观测次数T比值的平方根
MAE
是绝对误差的平均值
3.Top-N推荐
网站提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做Top-N推荐;
Top-N推荐的预测准确率一般用精确率(precision)和召回率(recall)来度量;
TP:样本为正,预测结果为正;
FP:样本为负,预测结果为正;
TN:样本为负,预测结果为负;
FN:样本为正,预测结果为负。
准确率、精准率和召回率的计算公式如下:
准确率(accuracy): (TP + TN )/( TP + FP + TN + FN)
精准率(precision):TP / (TP + FP),正确预测为正占全部预测为正的比例
召回率(recall): TP / (TP + FN),正确预测为正占全部正样本的比例