数据挖掘笔记
线性回归主要是解决回归问题,而逻辑回归主要是解决分类问题。
线性回归最优化参数:梯度下降法;正规方程法
正规方程法:
逻辑回归最优化参数:梯度下降法
outlier:离群点 anomaly:异常点
重复值检测:滑动窗口法(前提:类似的、可能重复的数据在数据库中是相邻存放的)
Principal Component Analysis(PCA):主成分分析
高斯分布:坐标轴中的点近似成椭圆形 比如:
贝叶斯公式:
设A,B为随机事件,若同时发生的概率等于各自发生的概率的乘积,则A,B相互独立。