机器学习备忘录之组合特征
高维组合特征的处理
组合特征是指把一阶离散特征两两组合,构成高阶组合特征。
这里的维度就是2*2=4。可是如果考用户ID,那么参数规模非常大。此时考虑对用户ID用低维向量表示。
组合特征
简单地将特征两两组合容易存在参数过多、过拟合等问题。上面提出的是一种降维的思考,下面说的是基于决策树的组合特征寻找方法。
先建立决策树,根据决策树进行特征组合,可以减少无用的特征组合方式。
高维组合特征的处理
组合特征是指把一阶离散特征两两组合,构成高阶组合特征。
这里的维度就是2*2=4。可是如果考用户ID,那么参数规模非常大。此时考虑对用户ID用低维向量表示。
组合特征
简单地将特征两两组合容易存在参数过多、过拟合等问题。上面提出的是一种降维的思考,下面说的是基于决策树的组合特征寻找方法。
先建立决策树,根据决策树进行特征组合,可以减少无用的特征组合方式。