李宏毅老师机器学习入门


机器学习就是自动找函数(方法)。
典型应用如:语音识别、图像识别、下围棋、对话系统等等。

Learning Map

下图中,同样的颜色指的是同一个类型的事情
蓝色方块指的是Scenario,即学习的情境。通常学习的情境是我们没有办法控制的,比如做Reinforcement Learning是因为我们没有Data、没有办法来做Supervised Learning的情况下才去做的。如果有Data,Supervised Learning当然比Reinforcement Learning要好;因此手上有什么样的Data,就决定你使用什么样的Scenario
红色方块指的是Task,即要解决的问题。你要解的问题,随着你要找的Function的Output的不同,有输出Scalar的Regression、有输出Options的Classification、有输出Structured Object的Structured Learning…
绿色的方块指的是model,即用来解决问题的模型(function set)。在这些Task里面有不同的Model,也就是说,同样的Task,我们可以用不同的方法来解它,比如Linear Model、Non-linear Model
李宏毅老师机器学习入门

你想要找什么样的函数

不同的函数对应不同的机器学习任务。
总体分为Regression(回归)和Classification(分类)以及Generation(生成):
1.Regression(回归):函数输出一个Scalar数值。
2.Binary Classification(二元分类):输出 Yes 或 No。
3.Multi-class Classification(多类别分类):做多项选择题。
4.Generation(生成):生成有结构的复杂的东西(例如:图片、文字)。

怎样告诉机器你要找什么样的函数

1.Supervised Learning(监督学习):需要提供训练资料Labeled Data(标签数据)供机器自己学习。
2.函数的Loss(损失函数):越小越好,类似于错误率,机器会自动找出Loss的最低函数。
3. Reinforcement Learning(强化学习)
Supervised Learning vs Reinforcement Learning(以围棋为例):
监督学习需要让机器看到现成的数据集,比如告诉他现在棋局的形式,他才能够提供下一步的操作,结果可预测;强化学习则自己和自己或别人下棋,自己想办法,提高胜率,结果不可预测。
李宏毅老师机器学习入门
4. Unsupervised Learning(无监督学习):提供无标注的数据供机器学习。
5.Semi-supervised Learning(半监督学习):如果想要区分猫和狗,手头上有少量的Labeled Data,它们标注了图片上哪只是猫哪只是狗;同时又有大量的Unlabeled Data,它们仅仅只有猫和狗的图片,但没有标注去告诉机器哪只是猫哪只是狗,这些没有Labeled的Data,对机器学习也是有帮助的。
6.Transfer Learning(迁移学习):有大量的不相干的Data(不是猫和狗的图片,而是一些其他不相干的图片),在这些大量的Data里面,它可能有Label也可能没有Label,Transfer Learning要解决的问题是,这一堆不相干的Data可以对结果带来什么样的帮助。

机器怎样找出你想要的函数

给定公式查找范围,比如Regression或者Classification。

课程作业安排

李宏毅老师机器学习入门