大数据案例分析学习笔记1.3(分类及其性能度量)

分类问题

  • 分类问题是有监督学习的一个核心问题,当输出变量取有限个离散值时,预测问题别成为分类问题
  • 分类的机器学习的两大阶段(1)从训练数据中学习得到一个分类决策函数或分类模型,称为分类器(classifier);(2)利用学习得到的分类器对新的输入样本进行类别预测
  • 两类分类问题与多类分类问题。多类分类问题也可以转化为两类分类问题解决,如采用一对其余的方法,将其中一个类标记为正类。然后将剩余的其他类都标记为负类,假设共有n类,需要构建n个分类问题。

分类性能度量——准确率

大数据案例分析学习笔记1.3(分类及其性能度量)

分类性能度量——精确率和召回率

大数据案例分析学习笔记1.3(分类及其性能度量)

分类性能度量——P-R曲线

大数据案例分析学习笔记1.3(分类及其性能度量)

分类性能度量——F值

大数据案例分析学习笔记1.3(分类及其性能度量)

分类性能度量——ROC

大数据案例分析学习笔记1.3(分类及其性能度量)
大数据案例分析学习笔记1.3(分类及其性能度量)

分类性能可视化

大数据案例分析学习笔记1.3(分类及其性能度量)

分类报告

大数据案例分析学习笔记1.3(分类及其性能度量)