大数据开发之机器学习总结(二)
大数据开发之机器学习总结(二)
1. 精确率和召回率
- 监督学习中,如何评估一个模型的效果,这时候就需要相办法做指标评估。
- 监督学习中,针对分类场景,一般是分类准确率,定义为分类器对测试集正确分类的样本数与总样本数之比
- 对于二类分类问题,常用指标就是精确率和召回率,这时候按照真实数据所属类比与模型预测结果组合划分,有如下
2. 回归问题
- 监督学习中,回归就是基于已有数据,找出输入和输出之间规律,然后根据输入的数据,得出预测的结果数据。
- 有点类似新建一个函数,来贴合现有的函数。这叫做拟合
- 回归问题分类,有多种标准
按照输入变量个数划分,一元回归,对元回归
按照模型类型,线性回归和非线性回归
- 回归学习的损失函数
平方损失函数,当选择平方损失函数作为损失函数,回归问题的参数求解可以使用最小二乘法求解
3. 模型求解算法
-
梯度下降算法
-
牛顿法和拟牛顿法