机器学习简介，ALS、LR

市面上的主流app，大多数情况下不同的用户看到的页面都是不同的，这里面就有一个推荐的因素了。

那么我们如果想要做推荐，首先需要实现的当然是千人千面，也就是不同的人推荐展示的内容是不一样的，再有就是需要根据场景去推荐。

离线指标：查全率、查准率、auc（是否预测对的比预测错的更靠前）等

在线指标：点击率、交易转化率等

A/B测试：A组和B组的公式同时测试，看哪个好。

ALS是最小二乘法，他利用矩阵分解的结果无限逼近现有数据，得到隐含特征。再利用隐含的特征预测其余结果。

先看下表格，4个用户，user2浏览过商品2和商品3，不管浏览了几次，都记做1分，user1购买过商品1，所以在1分的基础上再加2分，也就形成了我们这个矩阵表格。

而推荐系统需要做的是挖掘用户的潜在需求，就是预测没有数值的矩阵。这就是ALS要做的事情。

那ALS是怎么做的呢？

有两个表：

每个user和每个商品都会有五个特征，当然两个表中的特征可以不一样，但是数量必须一样，而且有相对应的打分。然后通过

机器学习简介，ALS、LR user矩阵和商品p转置矩阵相乘，user1的特征1乘商品1的特征1，最后相加，就会生成一个我们第一个的表格。那么ALS就是通过不断地递归拟合，去逼近现有表格中的分数，从而预测得到其他空格里面的数字。

LR，也叫逻辑回归。看一个公式：

Y=ax1+bx2+cx3+dx4...

排序的问题在某些意义上也可以看成是点击率预估，公式中x1x2x3这些可以看成是用户的特征，例如x1是年龄，x2是性别等等，在公式中，每个特征都有一个权重abcde等，结果会得到一个Y，越趋近1代表点击概率越大。这是个预测的过程。

机器学习简介，ALS、LR

LR算法也就是要算出abcde，在大数据平台会采集Y的样本，可能是1也可能是0，上面途中，蓝色为正样本，紫色为负样本，也lr需要推算出红线，等学习出红线以后，就可以做预测了，新进来一个x点，可以根据红线来推算这个点是正样本的概率大还是负样本的概率大。这就是比较简单的逻辑回归的排序算法原理。