综合实训周报三

目录标题

理论学习

本周的理论学习主要学习了特征选择相关的知识。

特征选择技术可以精简掉无用的特征,以降低最终模型的复杂性,它的最终目的是得到一个简约模型,在不降低预测准确率或对预测准确率影响不大的情况下提高计算速度。特征选择不是为了减少训练时间(实际上,一些技术会增加总体训练时间),而是为了减少模型评分时间。

有如基于特征间的关系进行筛选,如方差选择法。
方差选择法中,先要计算各个特征的方差,然后根据设定的阈值,选择方差大于阈值的特征。
from sklearn.feature_selection import VarianceThreshold
#其中参数threshold为方差的阈值
VarianceThreshold(threshold=3).fit_transform(train,target_train)

有如递归特征消除法 Wrapper(Recursive feature elimination,RFE),递归消除特征法使用一个基模型来进行多轮训练,每轮训练后,消除若干权值系数的特征,再基于新的特征集进行下一轮训练。 在feature_selection库的RFE类可以用于选择特征。

等等。

实践学习

本周主要进行了进一步的数据分析和数据处理。对特征值进行了简单的处理。对原始数据不怎么处理后跑了一遍,结果如图。
综合实训周报三