正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）

L1正则化(lasso回归)是指权值向量w中各个元素的绝对值之和，通常表示为正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）。L1正则化可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择。

使用场景：输入特征的维度很高,而且是稀疏线性关系。

L2正则化(岭回归)是指权值向量w中各个元素的平方和然后再求平方根（可以看到Ridge回归的L2正则化项有平方符号），通常表示为正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）。L2正则化可以防止模型过拟合（overfitting）；一定程度上，L1也可以防止过拟合。

使用场景：数据线性相关，用LinearRegression拟合的不是很好。

考虑二维的情况，即只有两个权值正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）和，，在图中，当损失函数等值线与正则项Ｌ等值线相交的地方就是最优解，这个顶点的值是(0,w)。等值线与这些角接触的机率会远大于与L其它部位接触的机率，而在这些角上，会有很多权值等于0，这就是为什么L1正则化可以产生稀疏模型，进而可以用于特征选择。

L2正则化的函数图形是个圆，与方形相比，被磨去了棱角。因此相交时正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）和等于零的机率小了许多，这就是为什么L2正则化不具有稀疏性的原因。L2正则化不容易得到稀疏矩阵，同时为了求出损失函数的最小值，使得w1和w2无限接近于0，达到防止过拟合的问题。

正则L1和L2，以及L1不可导的处理（Proximal Algorithm近端算法）