机器学习入门之svm-knn
先来看一些基本概念
什么是统计学?
基于数据构建统计模型 从而对数据进行预测与分析。
什么是监督学习?
学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。(有标签学习)
根据输入,输出变量的不同类型,对预测任务给予不同的名称。
回归问题: 输入,输出均为连续变量。
分类问题: 输出变量为有限个离散变量。
过拟合
学习时选择的模型所包含的参数过多,以致于出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。
泛化能力
模型对未知数据的预测能力。测试误差越小,泛化能力越好。
K近邻法(KNN)
对特征空间的划分:掌握距离量度,K值的选择,分类决策规则。