特征选择

参考链接:
特征选择:
https://zhuanlan.zhihu.com/p/37310887
https://www.zhihu.com/question/28641663

关于多重共线性:
https://zhuanlan.zhihu.com/p/56793236

在得到数据之后主要会进行以下操作
1、需要对数据进行异常值、缺失值的筛选
2、得到将数据表示成机器能识别的数字
3、对于单个特征,进行数据变换、标准化、归一化等,使得算法不受量纲影响
4、对于多个特征需要对特征进行筛选,筛选方式为:
(1)直接降维(原始特征看不出来了)
(2)采用算法选择重要特征

需要利用一些方法去除一些不必要特征,从而降低模型的计算复杂度。或去除多重共线性。

  • 特征选择标准:

特征是否发散
特征与目标的相关性

  • 特征选择方法分类:

特征选择