Youtube 推荐系统框架

Youtube 推荐系统框架

1 。推荐一般分为match和rank.

match阶段采用了word2Vec思想。关键的一点要理解vedio vector的权重在哪里。

在softmax那一步骤,比如user vector是100维,video vector是100w维。则需要一个100*100w的矩阵,这个矩阵的权重就是video vector。 这个框架通过训练在100w维中只有一个为1,其余都是为0,来训练矩阵权重以及user vector的100维度的向量。

每个user vector和video vector是相同的维度,100w个video的话,也就是有100*100w个权重

2.。 由于100w维度太大,这里也借鉴了word2vec的思想,采用负采样。可以采用trick,比如只负采样同一个城市的样本,只负采样同类别的数据