第3周作业 DL常用的评价标准

常见指标

  • 准确率(Accuracy)
  • 混淆矩阵(Confusion Matrix)
  • 精确率(Precision)
  • 召回率(Recall)
  • 平均正确率(AP)
  • mAP(mean Average Precision)
  • 交除并(IoU)
  • ROC+AUC
  • 非极大值抑制(NMS)

一、准确率(Accuracy)

acc=sum(正确)/总数

二、混淆矩阵(Confusion Matrix)

第3周作业 DL常用的评价标准

Aij 表示模型预测为i ,实际类别是J的数量

sum(对角线)/ 总数 = 准确率

三、精确率(precision)和召回率(recall)

第3周作业 DL常用的评价标准

对应二的混淆矩阵,纵坐标表示预测的种类,横坐标为实际的种类:

  • TP:预测是positive,实际也是positive。True Positive
  • FP:预测是positive,实际是negative。False ngeative
  • FN:类推
  • TN:类推

 

precision

第3周作业 DL常用的评价标准

recall

第3周作业 DL常用的评价标准

 

四、平均精度与mAP

 

平均精度:PR曲线下面的面积,越高,分类越好

mAP:每个类的AP,再求平均

五、IoU

第3周作业 DL常用的评价标准

第3周作业 DL常用的评价标准​​​​​​​

  • 七、PR曲线和ROC曲线的比较
    1. ROC中TPR偏向正例,FPR偏向负例,适用评估分类器真题性能
    2. PR完全聚焦于正例,实际中类别不平衡问题主要是由于正例,所以在此情况下,PR优于ROC