Learning Map

下图中，同样的颜色指的是同一个类型的事情
蓝色方块指的是Scenario，即学习的情境。通常学习的情境是我们没有办法控制的，比如做Reinforcement Learning是因为我们没有Data、没有办法来做Supervised Learning的情况下才去做的。如果有Data，Supervised Learning当然比Reinforcement Learning要好；因此手上有什么样的Data，就决定你使用什么样的Scenario
红色方块指的是Task，即要解决的问题。你要解的问题，随着你要找的Function的Output的不同，有输出Scalar的Regression、有输出Options的Classification、有输出Structured Object的Structured Learning…
绿色的方块指的是model，即用来解决问题的模型(function set)。在这些Task里面有不同的Model，也就是说，同样的Task，我们可以用不同的方法来解它，比如Linear Model、Non-linear Model
李宏毅老师机器学习入门

你想要找什么样的函数

不同的函数对应不同的机器学习任务。
总体分为Regression（回归）和Classification（分类）以及Generation（生成）：
1.Regression（回归）：函数输出一个Scalar数值。
2.Binary Classification（二元分类）：输出 Yes 或 No。
3.Multi-class Classification（多类别分类）：做多项选择题。
4.Generation（生成）：生成有结构的复杂的东西（例如：图片、文字）。

怎样告诉机器你要找什么样的函数

1.Supervised Learning（监督学习）：需要提供训练资料Labeled Data（标签数据）供机器自己学习。
2.函数的Loss（损失函数）：越小越好，类似于错误率，机器会自动找出Loss的最低函数。
3. Reinforcement Learning（强化学习）
Supervised Learning vs Reinforcement Learning（以围棋为例）：
监督学习需要让机器看到现成的数据集，比如告诉他现在棋局的形式，他才能够提供下一步的操作，结果可预测；强化学习则自己和自己或别人下棋，自己想办法，提高胜率，结果不可预测。
李宏毅老师机器学习入门
4. Unsupervised Learning（无监督学习）：提供无标注的数据供机器学习。
5.Semi-supervised Learning（半监督学习）：如果想要区分猫和狗，手头上有少量的Labeled Data，它们标注了图片上哪只是猫哪只是狗；同时又有大量的Unlabeled Data，它们仅仅只有猫和狗的图片，但没有标注去告诉机器哪只是猫哪只是狗，这些没有Labeled的Data，对机器学习也是有帮助的。
6.Transfer Learning（迁移学习）：有大量的不相干的Data（不是猫和狗的图片，而是一些其他不相干的图片），在这些大量的Data里面，它可能有Label也可能没有Label，Transfer Learning要解决的问题是，这一堆不相干的Data可以对结果带来什么样的帮助。

机器怎样找出你想要的函数

给定公式查找范围，比如Regression或者Classification。

课程作业安排

李宏毅老师机器学习入门