机器学习(二)更新中!!(监督学习、非监督学习、半监督式学习、增强学习)

机器学习的主要问题
机器学习(二)更新中!!(监督学习、非监督学习、半监督式学习、增强学习)
supervised learing:监督学习 unsupervised learing:非监督学习
discrete:离散的 continuous:连续的
classification(or categorization):分类 clustering:聚类
regression:回归 dimensionality reduction:维度下降

(1)监督学习
用户将成对的输入和预期输出数据提供给算法,算法从中找到一种方法(,然后根据给定输入给出预期输出。

(事先知道正确答案,即拥有一个输入变量(x)和一个输出变量(Y),使用某种算法去学习从输入到输出的映射函数Y=f(X),我们的目标是足够好的近似映射函数,以便当我们在新的数据上可以预测输出变量)

监督式学习问题可以进一步被分为回归和分类问题
回归(Regression)和分类(Classification)的算法区别在于输出变量的类型,定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。

回归模型可预测连续值(预测房子的价格)
分类模型可预测离散值(预测垃圾邮件、非垃圾邮件)

(2)非监督学习

非监督式学习问题可以进一步分为聚类问题、关联问题、概率分布估计,降维

(3)半监督式机器学习 Semi-supervised learning

当我们拥有大部分的输入数据(X)(X)但是只有少部分的数据拥有标签(Y)(Y),这种情形

(4)增强学习reinforcement learning