贷款违约预测第四周周报
模型优化
-
上周主要对训练集的一些特征值进行了一定分析,画了简单的统计图进行查看,这周主要是在上周的数据分析基础上,继续优化模型,从而得到更优的结果。
-
数据处理后,这次主要是针对所用的xgboost算法来进行模型调参:
-
本次调参主要是选取了xgboost算法中的部分参数
-
首先优化max_depth,min_child_weight两个参数:
-
得到最优参数为:max_depth:8,min_child_weight:1
-
然后是gamma参数:
-
得到最优参数为:0.05
-
最后是reg_alpha和reg_lambda两个参数:
-
得到最优参数为:
-
-
然后修改模型的参数,再跑一次模型:
-
提交结果查看成绩:
-
相较上次有所进步,当然还需要进一步优化。
小结
- 本周主要是对xgboost算法中的参数进行了调优,当然也没对所有参数进行调整,因为并不是所有参数单个调好整个算法就最优,需要一步步来调整,目前的成绩不是很好,之后还要对参数做进一步的处理,同时数据集也要多分析再优化,总的来说还是慢慢一步步了解到了数据挖掘的魅力,在自己一步一步处理数据调整算法参数的过程中收获到了很多东西。