推荐系统5---多目标排序
一、多目标排序
1.1为什么要有多目标排序?
⼯业界推荐系统多基于隐式反馈
•Global bias:不同⽬标表达不同的偏好程度
•Item bias:单个⽬标衡量不全⾯(标题党)
•User bias:⽤户表达满意度的⽅式不同
•综合⽬标收益最⼤化
多⽬标排序的难点
多⽬标 vs CTR预估
**•**部分⽬标数据稀疏,模型准确率低
**•**在线服务计算量⼤
**•**多个⽬标间重要性难以量化
**•**分数融合的超参难以学习
•>⼈⼯标注为label
•>长期⽬标为label
**•**规则不够智能化
1.2多⽬标排序流程
MAP:相关的又多大概率排到了前边
F1-Score
AUC
1>train AUC 》test AUC:模型过拟合
2>test AUC 》online AUC:特征不一致(偷窥数据);模型online精简
3>多用户AUC:
nDCG:
n:Normalization,不同指标大小不同,需要做normalization
D:Position discount,位置越靠前影响越大
C:Cumulating,
G:Gain,可以使相关性、点击率等指标
备注:NDCG是由各DCG除以当前DCG中最大的值得到的
Bayesian Personalized Ranking
•每个⽤户之间的偏好⾏为相互独⽴
•同⼀⽤户对不同物品的偏序相互独⽴
• ui>uj表⽰⽤户u对i的偏好⼤于对j的偏好
•>u满⾜完全性,反对称性和传递性
•最⼤后验估计
上图可看出BPR指标是模拟AUC的,其中
代表正样本排在负样本前边的数量;Iu+代表正样本数量,I\Iu+代表负样本。(即分母为正负样本的pair数)
Lambda-mart
Learning to Rank
•优势
•直接优化排序⽬标,排序效果好
•单模型融合多⽬标,serving压⼒⼩
•劣势
•样本数量⼤,训练速度慢
•有些偏序关系不容易构造
•多⽬标间的关系不易调整
MTL
•前提:多个任务具有相似性,可以共享底层特征
•解决数据稀疏问题
•不同模型善于学习不同特征,特征学习更充分
•引⼊归纳偏置(inductive bias),提⾼泛化性
1、所有参数共享,在全连接层针对不同目标再进行设计
2、部分参数共享