机器学习的碎碎念之概述

1、Arthur Samul (1956)提出机器学习的概念:
Field of study that gives computers the ability to learn without being explicitly programmed

2、机器学习不是一个特定的算法,而是很多算法的总称,它让计算机在数据中学习进而预测。
常见的算法有线性回归、支持向量机、决策树、随机森林、GBDT、XGboost等

3、机器学习的原理用一句话概括:通过已有的数据,使用计算机不断识别特征,不断训练模型,最后形成有效模型,这个过程就叫做机器学习。

4、机器学习通过一些训练方法对数据集进行训练,譬如:监督学习、无监督学习、强化学习等。

5、监督学习:给定一个数据集X和正确答案Y,计算机通过数据学习自变量X和因变量Y之间的映射关系,如下图所示。

机器学习的碎碎念之概述

6、非监督学习:给定一个数据集X,没有正确答案Y,计算机根据数据集的特点自动提取特征的过程。

7、机器学习的步骤:

收集数据-数据准备-选择模型-训练-评估-参数调整-预测

8、在Datewhale-初级算法梳理组队小组中的感悟

助教在参考大量文献的基础上,给出了超级详细的机器学习概述,特别感谢。

首先加深对机器学习发展史的了解。

其次是大量细节的概括,包括大量常用的机器学习算法、模型评价指标、损失函数、优化方法等。

每个方向都做了概括,是个很好的引子,接下来需要我们展开每一个方面的内容,去学习、讨论。