分段多项式和样条

分段多项式

为什么分段

线性模型虽然方便,且理论推导层面都很成熟了,但是线性模型预测不足的缺点也是显而易见的。
从线性回归到非线性回归,很自然的推广就是多项式回归,但是有时候想得到良好的拟合曲线,就要增加多项式的阶数,然而,随着阶数越高会出现更多的问题。分段多项式很好的解决了这个问题。
顾名思义,分段多项式就是将数据分段使用低阶的多项式进行拟合,从而很好的解决了多项式拟合的问题.

约束条件

当然分段进行多项式回归,是有一个结点处的约束问题的。

无约束

结点处没有约束,看图:
分段多项式和样条

结点处连续

结点处连续,即 f(C)=f(C+)f(C_{-}) = f(C_{+}), C表示结点。
,如图:
分段多项式和样条

结点处连续且一阶和二阶导相等

结点处连续其一阶和二阶导相等,在这个约束条件下的的拟合办法就叫三次样条,如图
分段多项式和样条

结点处连续、一阶和二阶导相等、边界线性

样条的拟合方法已经有很好的性质了,但是只是在结点处有约束条件,所以,边界处会不稳定。为了解决这个问题,就在边界处施加了一个线性约束,即在边界区域拟合曲线是线性的(边界区域:(,C1-\infty , C_1)和(CK,+C_K,+\infty),C1C_1,CKC_K指第一个结点和最后一个结点。)。自然三次样条的约束条件就是这样的。如图:
分段多项式和样条

[1]: ESL-统计学习导论 基于R应用
[2]: The Elements of Statistical Learning