机器学习领域常用**函数汇总

前言

这篇博客简介了一些常见的**函数，并简要总结了每个**函数的缺点。

部分常见**函数一览图：

机器学习领域常用**函数汇总

sigmoid

表达式：

机器学习领域常用**函数汇总

导数：

机器学习领域常用**函数汇总

sigmoid**函数图像如下：

机器学习领域常用**函数汇总

下面我们来看看sigmoid**函数有哪些缺点：

在饱和区域存在梯度缺失的问题。

sigmoid是一个非零中心的函数。

表达式较为复杂，计算复杂度高。

这里详细介绍第二个缺点，我们知道在NN的训练过程中，正向传播得到损失值会和反向传播得到偏导数做积，以此获得下一次更新的梯度，而非零中心带来的最大问题是，梯度更新的方向要么都为正向，要么都为反向，从而造成梯度更新的效率非常低。

tanh

机器学习领域常用**函数汇总

tanh的提出同样避免了sigmoid的一些缺点，首先它是零中心的函数的函数，这点很棒；但tanh同样不可避免的存在饱和区域存在梯度缺失的问题，而计算复杂度较高。

ReLU

机器学习领域常用**函数汇总

ReLU的提出在一定缓解了sigmoid**函数一部分缺点，首先它含有一半饱和区域，相比sigmoid来说大部分的饱和区域；同时它的计算成本也不高，相比sigmoid和其他的一些**函数，计算速度非常快；在实际中，我们使用ReLU**函数要比sigmoid和tanh收敛得快的多，大约快6倍左右。但同时我们发现它并没有改进非零中心的问题，在ReLU中依旧存在非零中心的问题。ReLU还会出现在0处，导数不存在的情况（根据图像可以清楚发现这一点），在实际的做法中我们人为设定在0处的偏导值为0。最后，ReLU会出现dead Relu的现象，准确来说就是存在输入小于0的情况，从而导致一部分神经元永远不会被**。