初步选择一个好模型

我们有多种方案来对模型进行数据拟合,来得到模型的未知参数值,因此存在着一个问题,我们如何去挑选一个合适的模型。
我们先来考虑上一篇文章所讲的的模型y=Ax2的适配问题。

y=Ax2

对于这个模型,我们在上一篇就已经用 最小二乘法准则变换后的最小二乘准则 来对其进行拟合,我们发现,两个拟合后的结果并不大一样。对于一个模型是否很好的拟合了数据的一个评估途径是 计算模型数据点与实际点的偏差。稍后我们将对几种方式获得的模型的绝对偏差进行对比。
现在我们先应用 切比雪夫近似准则 来对该模型进行数据拟合。
因为有5个数据点,该数学问题就是最小化五个数 |ri|=|yif(xi)|中的最大者,我们将其记为r。我们需要极小化r,可以产生一系列线性规划约束方程,即

|rri|0

对这一系列线性规划约束方程进行求解,将产生 r=028293A=3.17073。这里我们将最大绝对偏差降到了0.28293。注意,这是我们所能获得的最大绝对偏差的最小值。
现在确定了该模型y=Ax2的三个估计,那么我们要选择其中哪个呢。下表将列举三个估计的绝对偏差与实测点的残差

xi yi yi3.1869x2i yi3.1368x2i yi3.17073x2i
0.5 0.7 -0.0967 -0.0842 -0.0927
1.0 3.4 0.2131 0.2632 0.2293
1.5 7.2 0.029475 0.1422 0.0659
2.0 12.4 -0.3476 -0.1472 -0.2829
2.5 20.1 0.181875 0.4950 0.28293

接下来我们对这三个模型的偏差进行一个总结

方法 模型 [yif(xi)]2 max|yif(xi)|
最小二乘 yi3.1869x2i 0.2095 0.3476
变换后的最小二乘 yi3.1368x2i 0.3633 0.4950
切比雪夫 yi3.17073x2i 0.2256 0.28293

从上表中我们可以看出,每一种方法都有其优势之处。所以在我们对模型估计进行挑选的时候,我们需要去考虑模型的使用目的,实际情况所要求的精度,数据的准确性等等因素去综合考虑

车辆的停止距离

回顾车辆的停止距离的问题,我们讨论了速度和刹车距离之间的关系,得到了一个停止距离模型

d=1.1v+0.054v2

现在我们利用 最小二乘准则 来对这个模型进行拟合,可得到结果为 d=1.104v+0.0542v2,可以发现结果并没有显著的差异。
接下来我们要分析拟合结果,如下图所示。
初步选择一个好模型
我们可以发现,我们的模型在70mph之前都是大于实测速度,之后都是低估了停止距离,为此我们可以划出该模型的 残差图 以此来看到哪里这个模型哪里出现了问题,将残差作为一个独立变量的函数而得到的函数图即为残差图。如下图所示
初步选择一个好模型
在这里可以很明显的看出,在70mph之前的残差都是大于0的值,之后都小于0。而如果一个模型是完美的拟合了实际情况的话,这个模型的残差图所展现的偏差不仅小,而且应该有正有负,所以我们得到的这个停止距离的模型,并不是一个完美的模型,他无法对我们的现实生活中的停止距离进行拟合。