大数据开发之机器学习总结(二)

大数据开发之机器学习总结(二)

1. 精确率和召回率

  1. 监督学习中,如何评估一个模型的效果,这时候就需要相办法做指标评估。
  2. 监督学习中,针对分类场景,一般是分类准确率,定义为分类器对测试集正确分类的样本数与总样本数之比
  3. 对于二类分类问题,常用指标就是精确率和召回率,这时候按照真实数据所属类比与模型预测结果组合划分,有如下大数据开发之机器学习总结(二)
    大数据开发之机器学习总结(二)
    大数据开发之机器学习总结(二)

2. 回归问题

  1. 监督学习中,回归就是基于已有数据,找出输入和输出之间规律,然后根据输入的数据,得出预测的结果数据。
  2. 有点类似新建一个函数,来贴合现有的函数。这叫做拟合
  3. 回归问题分类,有多种标准

按照输入变量个数划分,一元回归,对元回归
按照模型类型,线性回归和非线性回归

  1. 回归学习的损失函数

平方损失函数,当选择平方损失函数作为损失函数,回归问题的参数求解可以使用最小二乘法求解

3. 模型求解算法

  1. 梯度下降算法
    大数据开发之机器学习总结(二)
    大数据开发之机器学习总结(二)
    大数据开发之机器学习总结(二)

  2. 牛顿法和拟牛顿法
    大数据开发之机器学习总结(二)