机器学习和深度学习常用的评价指标

一、分类器评价指标

1、混淆矩阵:衡量的是一个分类器分类的准确程度。适用于多分类器问题。
机器学习和深度学习常用的评价指标
TP(真正)True Positive:实际为正,预测为正
FP(假正)False Positive:实际为负,预测为正
FN(假负)False Negative:实际为正,预测为负
TN(真负)True Negative:实际为负,预测为负
主要指标计算:
真正类率:True Positive Rate
TPR=TPTP+FN\displaystyle TPR=\frac{TP}{TP+FN}【击中率】
假正类率:False Positive Rate
FPR=FPFP+TN\displaystyle FPR=\frac{FP}{FP+TN}【错误报警率】
真负类率:
TNR=TNFP+TN=1FPR\displaystyle TNR=\frac{TN}{FP+TN}=1 - FPR
2、准确率(ACC):正确预测的样本/样本总数
ACC = (TP+TN)/(TP+FP+FN+TN)
3、精确率(就预测结果而言):分类器不将负样本标记为正样本的能力。
precision=TPTP+FP\displaystyle precision=\frac{TP}{TP+FP}
4、召回率(就原来样本而言):分类器发现所有正样本的能力
recall=TPTP+FN\displaystyle recall=\frac{TP}{TP+FN}
5、F1:精确率和召回率的调和平均
F1=2(recall×precision)recall+precision\displaystyle F_{1} =\frac{2( recall\times precision)}{recall+precision}
6、logloss:逻辑损失或交叉熵损失
J(θ)=1mi=1m[y(i)log(hθ(x(i)))(1y(i))log(1hθ(x(i)))] J(\theta) = \frac{1}{m}\sum_{i=1}^{m}\big[-y^{(i)}\, log\,( h_\theta\,(x^{(i)}))-(1-y^{(i)})\,log\,(1-h_\theta(x^{(i)}))\big]

7、AUC:将测试样本排序,越可能是正例的排在越前面。AUC为ROC曲线以下的面积,看出AUC越大,模型的效果越好。
真正类率:
TPR=TPTP+FN\displaystyle TPR=\frac{TP}{TP+FN}
假正类率:
FPR=FPFP+TN\displaystyle FPR=\frac{FP}{FP+TN}
则有ROC曲线:
机器学习和深度学习常用的评价指标
(本图来源《机器学习》周志华)

二、回归器评价指标

1、均方误差(mean-square error, MSE)

MES(y,yi^)=1m(yiyi^)2\displaystyle MES\left( y,\widehat{y_{i}}\right) =\frac{1}{m}\left( y_{i} -\widehat{y_{i}}\right)^{2}

2、最大误差(max_error):

maxerror=max(yiyi^)\displaystyle max_{-} error=max\left( |y_{i} -\widehat{y_{i}} |\right)

3、平均绝对误差(mean_absolute_error)

MES(y,yi^)=1myiyi^\displaystyle MES\left( y,\widehat{y_{i}}\right) =\frac{1}{m} |y_{i} -\widehat{y_{i}} |