【机器学习】摘记-2

1:简单的数据分析思路

自动获取数据集训练集
模型训练不调参
打分
交叉验证-调优

2:天池比赛的数据分析思路

赛题理解
EDA
特征工程
模型构建调参
模型融合

3:遇到机器学习问题的思路

分类/回归
二元/多元/线性/非线性
模型选择,监督/非监督

4:机器学习中一些专有名词理解

  1. 欧式距离:欧氏距离是最常见的距离度量,衡量的是多维空间中各个点之间的绝对距离【机器学习】摘记-2

  2. 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类

  3. 过拟合:【机器学习】摘记-2

  4. 鲁棒性:算法对数据变化的容忍度 核函数:支持向量机里面的一个函数

  5. 泛化能力:模型对样本的适应程度

  6. 最小二乘法:最小二乘法公式是一个数学的公式,在数学上称为曲线拟合,此处所讲最小二乘法,专指线性回归方程!最小二乘法公式为a=y(平均)-b*x(平均)。