4. 驱动机器学习长足进步的因素 翻译自 吴恩达新书-Machine Learning Yearning
更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费?.
很多机器学习(神经网络)的想法都提出几十年了,为什么这些想法会突然的火了呢?
促进这一现象的最大两个驱动因素是:
- 数据规模 现在人们大量使用诸如手机,电脑等电子设备。使用的过程中,产生了大量数据,这些数据正是机器学习算法所必须的。
- 计算能力 因为计算能力的提升,我们近些年才可能训练出足够大的神经网络,来将这些数据利用起来。
具体来说,即使你积累了大量的数据,旧的算法比如逻辑回归,也不可能会有大的提升。当你提供再多的数据时,你也会发现它的学习曲线非常平坦。
就好像旧的算法并不知道该如何利用现有的数据一样。
但如果你使用神经网络,效果就会不一样了。
当你使用一个小型的神经网络时,你会发现模型性能略有提升。
这里的小型神经网络是指,层数、神经元和参数较少的神经网络。
接着,你再使用一个大型的神经网络试试,你会发现模型性能有了大幅度的提升。
从上图可以看成,想获取最好的性能,就需要
- 使用更大型的神经网络
- 使用更大量的数据集
还有很多其他的细节,比如神经网络结构也非常重要,这方面近些年来有很多的创新。
但当前最可靠的改进算法性能的方法仍是:
- 训练更大型的神经网络
- 使用更大量的数据集
实现上面这两个步骤,其实异常的复杂。本书将会详细讨论里面的细节。
我们先从对传统算法和神经网络都有用的策略开始说起,然后说下,如何在构建深度机器学习系统时,使用最先进的策略。
更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费?.