机器学习第一周(一)--机器学习引入

机器学习

1、机器学习算法主要分为俩大类,监督学习(Supervised Learning)和无监督学习(Unsupervised Learning).
监督学习与无监督学习一个最大不同是监督学习的数据是带标签的,而无监督学习的数据是不带标签的。
监督学习又分为分类问题和回归问题,分类问题是对给定带标签的数据集进行分类,如二分类,三分类等。
回归问题是根据所给的数据进行预测,如对房价的预测。

监督学习

下面以预测房价为例给出监督学习一般过程
机器学习第一周(一)--机器学习引入
对于给定的数据集,通过学习算法(Learing Algorithm)找到一个最优的模型(h),再用这个模型对新的数据样本进行分析(分类或回归预测)。

无监督学习

无监督学习典型的有聚类(Clustering)问题,无监督学习只有原始数据,没有任何标签数据和训练结果,直接对原始数据进行建模,再把原始数据分成几堆不同的簇。
分类与聚类:分类通过最优模型要求具体分到某一类,而聚类只要求相似数据聚在一起,并不关心某一类是什么。
机器学习第一周(一)--机器学习引入
机器学习第一周(一)--机器学习引入
无监督学习的另一种典型算法是鸡尾酒聚会问题(Cocktail party)。