关于交叉验证

1、机器学习之K折交叉验证 - 吉什么的文章 - 知乎 https://zhuanlan.zhihu.com/p/38121870

注意:cross_val_score() 传入的 X 和 y 是原始特征和标签,而非经过 train/test split 的训练集。

划分过程由 cross_val_score() 函数内完成。

2、Cross-validation: evaluating estimator performance

关于交叉验证       关于交叉验证       

3、Plotting Cross-Validated Predictions

4、Tuning the hyper-parameters of an estimator

It is possible and recommended to search the hyper-parameter space for the best cross validation score.

scikit-learn中提供了两种对搜索候选对象进行采样的通用方法:对于给定值,GridSearchCV穷举考虑所有参数组合,而RandomizedSearchCV可以从具有指定分布的参数空间中采样给定数量的候选对象。

请注意,通常这些参数的一小部分会对模型的预测或计算性能产生较大影响,而其他参数则可以保留其默认值。建议阅读估计器类的文档字符串,以更好地了解其预期行为,这可能是通过阅读随附的文献参考来实现的。