如何使用python计算精度,召回率和F分数?

问题描述:

labelTrainData.csv用于训练分类器以预测Testdata.csv的情感。最后我得到了BagOfCentroids.csv。如何使用python计算精度,召回率和F分数?

labelTrainData.csv

id sentiment Tweet 
1 0   tweet_1 
2 1   tweet_2 
3 0   tweet_3 

Testdata.csv

id  Tweet 
1  tweet_1 
2  tweet_2 
3  tweet_3 

BagOfCentroids.csv

id  sentiment 
1  0 
2  1 
3  1 

为了计算bove的指标,我正在尝试这个,

print 'Sentiment precision:' 

nltk.metrics.precision(BagOfCentroids['sentiment'], Testdata['sentiment']) 

print 'sentiment recall:' 

nltk.metrics.recall(BagOfCentroids['sentiment'], Testdata['sentiment']) 

print 'sentiment F-measure:' 

nltk.metrics.f_measure(BagOfCentroids['sentiment'], Testdata['sentiment']) 

有没有什么办法可以计算精度,回忆和F分数?

+3

有什么问题吗?指定你正在尝试达到的目标以及迄今为止所尝试的,我们不能帮助你,否则 –

+0

@AdamJaamour问题编辑 – Ankit

+1

当你尝试这个时会发生什么? – lenz

这篇文章会有所帮助:

TEXT CLASSIFICATION FOR SENTIMENT ANALYSIS – PRECISION AND RECALL

Detail about nltk.metrics package

这可能是因为一些进口问题