机器学习备忘录之组合特征

高维组合特征的处理
组合特征是指把一阶离散特征两两组合,构成高阶组合特征。
机器学习备忘录之组合特征
这里的维度就是2*2=4。可是如果考用户ID,那么参数规模非常大。此时考虑对用户ID用低维向量表示。
机器学习备忘录之组合特征

组合特征
简单地将特征两两组合容易存在参数过多、过拟合等问题。上面提出的是一种降维的思考,下面说的是基于决策树的组合特征寻找方法
机器学习备忘录之组合特征
先建立决策树,根据决策树进行特征组合,可以减少无用的特征组合方式。

参考:
百面机器学习 算法工程师带你去面试
百面机器学习|第一章特征工程知识点