【机器学习】机器学习算法分类及开发流程 No.6
1、算法分类
数据类型:离散型数据和连续型数据
数据的类型将是机器学习模型不同问题不同处理的依据
(1) 监督学习(预测):特征值+目标值
- 分类(目标值离散型): k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归,神经网络
- 回归(目标值连续型):线性回归、岭回归
- 标注:隐马尔科夫模型
(2)非监督学习:只有特征值
- 聚类:k-means
(3)相关概念
- 监督学习:可由输入数据中学到或建立一个模型,并依此推测新的结果。输入数据是由输入特征值和目标值组成。函数的输出可以是一个连续的值(称为回归),或是输出有限个离散值(称作分类)。
- 分类:分类是监督学习的一个核心概念,在监督学习中,当输出变量取有限个离散值时,预测问题变成分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。
- 回归:回归是监督学习中的一个重要问题。回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。
- 非监督学习:可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值组成。