1.写在前面

最近机器学习课上学了决策树相关知识，对于我之前的理解又加深了一步，故再次总结学习。我之前看的是麦子学院关于决策树的讲解，还有代码实现，当时也做了笔记。有兴趣的可以可以看一下。

2.非线性问题

对于分类问题，如果是可以找出一条直线分开说明是线性可分，其他我们一般称为非线性可分。对于线性不可分数据，采用非线性决策的方法。如图左侧为线性可分，右侧为线性不可分。

非线性分类-决策树（离散值、连续值问题数选择）

2.1 线性扩展的思想

解决非线性问题，我们可以使用线性扩展的思想，也可以采用非线性扩展的思想。在线性扩展方面，我们有

非线性分类-决策树（离散值、连续值问题数选择）

2.2 非线性扩展的思想

非线性分类-决策树（离散值、连续值问题数选择）

一般会用到上面这几种方法，我感觉这几个方法其实还是比较独立的，有时间会把他们都做总结分享。首先介绍一下决策树方法。

3.决策树方法概述

顾名思义，决策树就是一棵树，一颗决策树包含一个根节点、若干个内部结点和若干个叶结点；叶结点对应于决策结果，其他每个结点则对应于一个属性测试；每个结点包含的样本集合根据属性测试的结果被划分到子结点中；根结点包含样本全集，从根结点到每个叶子结点的路径对应了一个判定测试序列。下面直接上个图，让大家看下决策树是怎样决策的（以二元分类为例），图中红线表示给定一个样例（表中数据）决策树的决策过程：

非线性分类-决策树（离散值、连续值问题数选择）