机器学习-李宏毅-Lecture0-Introduction课程笔记
链接
AI ML DL关系
人工智能(AI)是我们要追求的目标。
机器学习(ML)是使用的手段,指机器通过学习可以和人一样聪明。
而深度学习(DL)是机器学习中的一种方法,指很多层网络叠加起来。
如下图所示。
Why ML?
使用规则可以解决一部分问题,但是难以考虑到所有的情况,永远无法超越创造者,没有freestyle。
What is ML?
机器学习其实所做的就是寻找一个function,从input到output的一个映射function。
数据可以是image、video、language、棋谱等等。
How ML works?
ML的Framework如下:
- 准备function set,包含许多function。也就是model
- 准备training data,告诉input和output.
- 根据data判断function的好坏
- 从function set中挑出best function
- 使用best function来做predict等任务
具体如下图所示:
总结成3个步骤:
- Step1:define a set of function
- Step2:evaluate goodness of function
- Step3:pick the best function
Learning Map
学习路线如上图所示,下面逐个介绍。
Regression
ML的一种Task,指function输出的值是一个连续的数值。有监督训练。
Classification
ML的一种Task,指function输出的值是离散值,类别信息。有监督训练。分为二分类和多分类。区别在于输出类别数量不同(判断题或选择题)。
二分类应用有垃圾邮件识别(是或不是),多分类应用有新闻分类(政治、经济、娱乐、体育等)。
可以做分类的model有很多种,也就是function set中包含很多function。
最简单的有Linear model.
Deep Learning是Linear model的一种。区别在于DL中的model较为复杂,是层次结构的。可以拟合复杂的信息。
非线性的model有SVM、decision tree、KNN等模型。
semi-supervised learning
上面的分类和回归问题都需要有大量的label信息。但是实际情况下不一定会有足够多的标注数据。
半监督学习也利用了没有label的data
transfer learning
迁移学习,是运用已存有的知识对不同但相关领域问题进行求解的一种机器学习方法。
unsupervised learning
数据没有label来进行训练。模型从大量没有标签的数据中自己学习。
structured learning
指的是输出不仅仅是简单的类别或数值信息,而可以是句子、语音、图像等结构化的信息。
reinforcement learning
强化学习,没有告诉model正确的答案是什么,机器所获得的只有环境信息(分数),也就是奖惩信息。从critics(评价)中学习。而supervised learning是从数据的label中学习。