(一)Deep Learning笔记:初识机器学习

  • Machine Learning的定义

  1. Auther Smuel 在1950年代编写了一个跳棋游戏程序,尽管他本人并不擅长跳棋,但计算机程序通过观察赢与输时的布局特点,积累了丰富的经验,而成为了一个比Auther Smuel厉害的跳棋高手。他定义了Machine Learning:Field of Study that gives computers the ability to learn without being explicitly programmed。
  2. Tom Mitchell 认为定义为:A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E

以跳棋游戏为例,E为让计算机与自己玩上千次跳棋,T为玩跳棋,P为与新对手玩跳棋时的胜率。


以筛出垃圾邮件为例:

(一)Deep Learning笔记:初识机器学习

  • 监督学习

以Portland市的房价预测为例,收集到的数据集如下所示:

(一)Deep Learning笔记:初识机器学习

如果我有一个朋友,他的房子面积大概为750万英尺,他想知道这个房子可以卖多少钱。学习算法可以用这些数据拟合出一条直线,通过这条直线,我们预测这个房子可以卖15,000刀。

                            (一)Deep Learning笔记:初识机器学习

我们也可以用二阶多项式来拟合数据,预测这个房子可以卖20,000刀。

(一)Deep Learning笔记:初识机器学习

以上就是监督学习的一个例子。我们可以归纳出监督学习的概念:给定一个数据集,这个数据集中已经清晰的给出了right answers,学习算法的目的是为了给出更多的right answers。房价预测的例子也被成为回归问题 Regression Problem,我们设法去预测连续值的输出。

另一个监督学习的例子,假设我们要根据医疗记录去预测乳腺肿瘤是良性的还是恶性的,我们有以下一组数据:

(一)Deep Learning笔记:初识机器学习

假设我有一个朋友不幸得了乳腺肿瘤,学习算法会根据肿瘤的尺寸去预测这个肿瘤是良性的还是恶性的。事实上,这是一个分类问题,即预测离散值的输出。

在实际中,我们要预测肿瘤是良性或恶性,会用到不止一个特征,可能需要去处理无穷多的特征。

  • 无监督学习

假设我们有一个数据集,我不知道这些数据是什么,我也不知道每个数据是什么类型,我甚至不知道有哪些类型,无监督学习的目的是在其中找到某种结构。

与监督学习的区别在于无监督学习的数据是没有任何标签的。

(一)Deep Learning笔记:初识机器学习(一)Deep Learning笔记:初识机器学习