【机器学习】机器学习算法分类及开发流程 No.6

1、算法分类

数据类型:离散型数据和连续型数据

数据的类型将是机器学习模型不同问题不同处理的依据

(1) 监督学习(预测):特征值+目标值

  • 分类(目标值离散型): k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归,神经网络
  • 回归(目标值连续型):线性回归、岭回归
  • 标注:隐马尔科夫模型

(2)非监督学习:只有特征值

  • 聚类:k-means

【机器学习】机器学习算法分类及开发流程 No.6

(3)相关概念

  • 监督学习:可由输入数据中学到或建立一个模型,并依此推测新的结果。输入数据是由输入特征值和目标值组成。函数的输出可以是一个连续的值(称为回归),或是输出有限个离散值(称作分类)。
  • 分类:分类是监督学习的一个核心概念,在监督学习中,当输出变量取有限个离散值时,预测问题变成分类问题。最基础的便是二分类问题,即判断是非,从两个类别中选择一个作为预测结果。
  • 回归:回归是监督学习中的一个重要问题。回归用于预测输入变量和输出变量之间的关系,输出是连续型的值。
  • 非监督学习:可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值组成。

2、机器学习开发流程

【机器学习】机器学习算法分类及开发流程 No.6