随机森林-解决多重共线性降维进行调参

我们在使用python的随机森林包时,会用到max_feature这个参数
随机森林-解决多重共线性降维进行调参
这个参数是我们进行选择样本特征的个数,如果当样本的特征较多时,比如有50-100个,我们选择auto,全部特征可以进行降维,即有的特征重要性过低的可以舍去。选择sqrt可以去除样本中特征之间多重共线性的干扰,sqrt代表每次选择根号n个特征进行建树。从而减少样本间多重共线性的干扰。