准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure
这里主要解释的是前四个

先给出百度百科定义

召回率(Recall Rate,也叫查全率)是检索出的相关文档数文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;
精度是检索出的相关文档数检索出的文档总数的比率,衡量的是检索系统的查准率。

召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
F-measure应该是精准率和召回率之间的一个平衡点

举例来说:

一个数据库有500个文档,其中有50个文档符合定义。系统检索到75个文档,但是实际只有45个符合定义。则:

在做出解答前,我们要先了解一些概念:
对于数据测试结果有下面4种情况:
TP: 预测为正,实际为正
FP: 预测为正,实际为负
TN:预测为负,实际为负
FN: 预测为负,实际为正
精确率、准确率:Accuracy=(TP+TN)/(TP+TN+FN+FP)

精准率、查准率: P = TP(查找到的正确文档数)/ (TP+FP)(查找到的所有文档数)
召回率、查全率: R = TP(查找到的正确文档数)/ (TP+FN) (真正的正确文档数)

准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure

例子答案:

精度P=45/75=60%
检索文档数中给定文档的占比
预测为正的样本中有多少是真正的正样本,它是针对我们预测结果而言的

召回率R=45/50=90%
正确文档数中给定文档的占比
样本中的正例有多少被预测正确了, 它是针对我们原来的样本而言的。

参考博客:https://www.cnblogs.com/sddai/p/5696870.html