性能度量

测试准确率和测试错误率

混淆矩阵

性能度量

查准率和查全率(TPR)和FPR

查全率TPR

性能度量

查准率

性能度量

FPR

实际未负的样本中被错分为正样本的比例。
性能度量

权衡

  • 查全率导向任务
    • 传统的搜索和信息提取
    • 瘤检测
    • 经常伴随人类专家过滤处假正例
  • 查准率导向
    • 搜索引擎排序,查询建议
    • 文档分类
    • 许多面向客户的任务(用户会记住失败的例子!!)

F1_score和Fbeta_score

性能度量
β>0度量了查全率对查准率的相对重要性。

PR曲线和ROC曲线

PR曲线

PR曲线一般X轴是Recall,Y轴是Precision
性能度量

ROC曲线

性能度量

AUC

性能度量

多类别度量

宏平均

性能度量

微平均

性能度量

对比

性能度量
性能度量

回归度量

性能度量