数据挖掘笔记

线性回归主要是解决回归问题,而逻辑回归主要是解决分类问题。

线性回归最优化参数:梯度下降法;正规方程法

正规方程法:

数据挖掘笔记

逻辑回归最优化参数:梯度下降法

outlier:离群点       anomaly:异常点

重复值检测:滑动窗口法(前提:类似的、可能重复的数据在数据库中是相邻存放的)

Principal Component Analysis(PCA):主成分分析

高斯分布:坐标轴中的点近似成椭圆形    比如:

数据挖掘笔记

数据挖掘笔记

贝叶斯公式:

数据挖掘笔记

设A,B为随机事件,若同时发生的概率等于各自发生的概率的乘积,则A,B相互独立

数据挖掘笔记