AI_06_多分类、决策树分类、随机森林分类_03_评估指标_K折交叉验证
GridSearchCV 模型选择/验证 CV是CrossValidation(交叉验证)的简称
我们在用数据训练模型的时候,往往会给算法传入超参数(学习率,迭代次数,收敛的值)
regularization : 正则化
param_grid = {"tol": [1e-4, 1e-3, 1e-2],
"C": [0.4, 0.6, 0.8]}
log_reg = LogisticRegression(multi_class='ovr', solver='sag')
grid_search = GridSearchCV(log_reg, param_grid=param_grid, cv=3)
log_reg.fit(X, y) #拟合x数据,容易过拟合
grid_search.fit(X, y) #把数据分为cv=3份儿,组合超参数param_grid 选择更好的模型,所以训练模型的时长更长!!!
一般3 Grid 或是5 Grid交叉验证就够了!