混合矩阵可视化函数封装
混合矩阵可视化函数封装
混合矩阵和交叉表类似,只不过表现的形式不一样, 都是在评判模型是否满足业务场景的一种检测方法, 可以直观的查看查全率.
函数定义如下:
import itertools
def plot_confusion_matrix(cm, classes,
title='Confusion matrix',
cmap=plt.cm.Blues):
"""
This function prints and plots the confusion matrix.
"""
plt.imshow(cm, interpolation='nearest', cmap=cmap)
plt.title(title)
plt.colorbar()
tick_marks = np.arange(len(classes))
plt.xticks(tick_marks, classes, rotation=0)
plt.yticks(tick_marks, classes)
threshold = cm.max() / 2.
for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
plt.text(j, i, cm[i, j],
horizontalalignment="center",
color="white" if cm[i, j] > threshold else "black")#若对应格子上面的数量不超过阈值则,上面的字体为白色,为了方便查看
plt.tight_layout()
plt.ylabel('True label')
plt.xlabel('Predicted label')
参数详解:
cm : 为生成的交叉表的数据,一般不用自己算,可以通过confusion_matrix方法来获得:
如:
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_) # y_test 为训练样本已知的目标值, y_ 为训练样本预测值,返回一个ndarray数据
classes: 目标值的分类,传入一个列表,有几类列表就有几个元素
title: 表名 一般写上recall (查全率也叫回调率)
cmap : 选择自己喜欢的表的颜色