机器学习--手推逻辑回归

机器学习–逻辑回归

逻辑回归Lodistic Regression
解决问题：一种分类方法，处理因变量为分类变量的回归问题，主要为二分类或二项分布问题。利用已知的自变量来预测一个离散因变量的发生概率值。
基本思想：将线性回归基本函数+sigmoid函数，参数theta在线性回归中；
数学分析：sigmoid函数将数据二值化，即目标变量只取0或1；将联合密度函数基础上应用最大似然估计；
损失函数：对数损失
流程：1、假设；2、优化目标；3、梯度下降
优缺点：实现简单，但不能拟合非线性数据，选取合适的多项式阶数对于回归模型拟合程度会产生重要影响。多项式阶数越高越容易产生过拟合现象。
模型训练：
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_predict
cols = loans.columns
train_cols = cols.drop(“loan_status”)
features = loans[train_cols] #特征矩阵
target = loans[“loan_status”] #标签矩阵
lr = LogisticRegression()
predictions = cross_val_predict(lr,features,target,cv=10) #交叉验证10组Kfold =10
lr.fit(features,target) #模型训练
predictions = lr.predict(features) #模型预测
机器学习--手推逻辑回归

机器学习--手推逻辑回归

机器学习–逻辑回归

相关推荐