评价分类结果
实际中我们把真正关注的标记为1(癌症病人 贷款失信人)
精准率:预测这个事件为发生 中 事件真正发生 有多少
预测我们关注的事件 预测准确度 做100次预测患病发生 预测正确占多少
召回率:事件真实发生中 我们 预测正确的为多少
100个人患病(真) 真正预测出患病的概率 关注的事件发生并且被正确预测
预测为上升的 希望预测的都是对的
所有真正有病的患者 能正确选出
其中一个很小一个很大 得到的值最终也会很小 只有两者都大 最终才会大
而算数平均值 一个很低另一个很高 最终的和显示的也会很好
X轴为步长 y为两个曲线 分类边界越大越有可能分的准 即召回率越大
x y 一个为召回率 一个为精准率
多分类混淆矩阵
==》中间是分类真确的
==》越亮犯错越多
总结:ROC 用于比较两个模型孰优孰劣 同样一个算法比较不同超参数下的分类效果
召回率 精准率用于评价 数据严重有偏的模型 这两个指标是很有必要的