机器学习:转换器与估计器
转换器与估计器
转换器:
fit_transform():输入数据直接转换
fit():输入数据但不做事情,只计算出相关的平均值方差等
transform():进行数据转换
特征工程的步骤:
1、实例化 (实例化的是一个转换器类(Transformer))
2、调用fit_transform()对于文档建立分类词频矩阵,不能同时调用
估计器:机器学习算法的实现
在sklearn中,估计器(estimator)是一个重要的角色,分类器和回归器都属于estimator,是一类实现了算法的API
1、用于分类的估计器:
sklearn.neighbors k-近邻算法
sklearn.naive_bayes 贝叶斯
sklearn.linear_model.LogisticRegression 逻辑回归
2、用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
估计器流程:
1.将数据划分为训练集和测试集
2.估计器就是一种算法,调用fit()将训练集数据穿进去,建立模型计算。fit(x_train,y_train).
3.预测模型,将测试集里面的数据传进去。测试数据predict(x_test)。还可以将数据传入score(x_test,y_test),查看预测的准确率。
估计器的工作流程: