吴恩达视频学习(一)

一、监督学习

从数据的角度来看,监督学习和无监督学习的区别就在于监督学习的数据不仅有特征组成,而且每一个数据样本都有其准确的值,譬如,在房价预测的问题中,数据有特征+房价组成,关于肿瘤样本也只有患了癌症和没有患癌症,即0和1.

1.1监督学习的分类

在监督学习中,我们的预测结果乐意是连续值,也可以是离散值,我们根据这样的属性将监督学习分为回归问题和分类问题。

吴恩达视频学习(一)

1.2监督学习举例
1.2.1回归问题

想通过一个房子的面积去预测这个放在在市场的价格,此刻房子面积就是特征,房子的价格就是一个输出值,为了解决这一问题,通过样本实验,绘制了房子面积和价格的走向图
吴恩达视频学习(一)

1.2.2分类问题

就是从一组数据样本去判断这件的是1还是0,例如,数据是关于乳腺癌的医学数据,包含了肿瘤的大小和改肿瘤是良性(0)还是恶性(1),然后在样本中根据离散值去选择对应的值
吴恩达视频学习(一)

2.无监督学习

在无监督学习中,虽然没有给数据特定的标签,但是也是预测某个值或者某个分类成了寻找数据集合中特殊的或者对我们来说有价值的数据。
吴恩达视频学习(一)
如图将数据分为两个簇,而将数据集分为不同簇的无监督学习算法也被称为聚类算法。

2.1无监督学习举例

2.1.1新闻分类

第一个是谷歌的例子,谷歌搜集网上的新闻,并根据新闻的主题分为许多簇,然后将同一簇的新闻放在一块,一打开就是那一簇。
吴恩达视频学习(一)

2.1.2根据给定基因将人群分类

如图是DNA数据,根据测量结果用聚类算法将其分类
吴恩达视频学习(一)