F1-Score

F1-Score又称为平衡F分数（balanced F Score），他被定义为精准率和召回率的调和平均数。

F1-Score指标综合了Precision与Recall的产出的结果。F1-Score的取值范围从0到1的，1代表模型的输出最好，0代表模型的输出结果最差。
更一般的，我们定义Fβ分数为

除了F1分数之外，F2分数和F0.5分数在统计学中也得到大量的应用。其中，F2分数中，召回率的权重高于精准率，而F0.5分数中，精准率的权重高于召回率。
人们通常使用精准率和召回率这两个指标，来评价二分类模型的分析效果。但是当这两个指标发生冲突时，我们很难在模型之间进行比较。比如，我们有如下两个模型A、B，A模型的召回率高于B模型，但是B模型的精准率高于A模型，A和B这两个模型的综合性能，哪一个更优呢？

F1-Score(A) = 68.57, F1-Score(B)=78.75,显然B模型更优。

再看另一例

算出的F1-Score(A)=F1-Score(B),就不太好判断了。为了解决这个问题，人们提出了 Fβ分数。Fβ的物理意义就是将精准率和召回率这两个分值合并为一个分值，在合并的过程中，召回率的权重是精准率的β倍 [1] 。F1分数认为召回率和精准率同等重要，F2分数认为召回率的重要程度是精准率的2倍，而F0.5分数认为召回率的重要程度是准确率的一半。

举例：要对产品分类：正品和次品。现在有200个产品，刚好100个正品，100个次品，训练之后的预测50个正品，150个次品，即：预测50个正品正确，有50个正品被预测为次品，100个次品预测全部正确。
此时：
TP: 50
FP: 50
FN: 0
TN: 100
TPR: 0.5
FPR: 0.5
Accuracy: 75%
Precision: 100%
Recall: 50%
F1-Measure: 66.7% 即(2323)

另外补充一些经常用到的评价指标。
F1-Score
假阳率：假阳对本来为阴的占比。

相关推荐