随机抽样一致算法（Random sample consensus，RANSAC）

一、RANSAC理论介绍

普通最小二乘是保守派：在现有数据下，如何实现最优。是从一个整体误差最小的角度去考虑，尽量谁也不得罪。

RANSAC是改革派：首先假设数据具有某种特性（目的），为了达到目的，适当割舍一些现有的数据。

给出最小二乘拟合（红线）、RANSAC（绿线）对于一阶直线、二阶曲线的拟合对比：

可以看到RANSAC可以很好的拟合。RANSAC可以理解为一种采样的方式，所以对于多项式拟合、混合高斯模型（GMM）等理论上都是适用的。

RANSAC简化版的思路就是：

第一步：假定模型（如直线方程），并随机抽取Nums个（以2个为例）样本点，对模型进行拟合：

随机抽样一致算法（Random sample consensus，RANSAC）

第二步：由于不是严格线性，数据点都有一定波动，假设容差范围为：sigma，找出距离拟合曲线容差范围内的点，并统计点的个数：

随机抽样一致算法（Random sample consensus，RANSAC）

第三步：重新随机选取Nums个点，重复第一步~第二步的操作，直到结束迭代：

随机抽样一致算法（Random sample consensus，RANSAC）

第四步：每一次拟合后，容差范围内都有对应的数据点数，找出数据点个数最多的情况，就是最终的拟合结果：

随机抽样一致算法（Random sample consensus，RANSAC）

至此：完成了RANSAC的简化版求解。

这个RANSAC的简化版，只是给定迭代次数，迭代结束找出最优。如果样本个数非常多的情况下，难不成一直迭代下去？其实RANSAC忽略了几个问题：

每一次随机样本数Nums的选取：如二次曲线最少需要3个点确定，一般来说，Nums少一些易得出较优结果；

抽样迭代次数Iter的选取：即重复多少次抽取，就认为是符合要求从而停止运算？太多计算量大，太少性能可能不够理想；

容差Sigma的选取：sigma取大取小，对最终结果影响较大；

这些参数细节信息参考：*。

RANSAC的作用有点类似：将数据一切两段，一部分是自己人，一部分是敌人，自己人留下商量事，敌人赶出去。RANSAC开的是家庭会议，不像最小二乘总是开全体会议。　　

二、RANSAC应用简介

RANSAC其实就是一种采样方式，例如在图像拼接（Image stitching）技术中：

第一步：预处理后（据说桶形变换，没有去了解过）提取图像特征（如SIFT）

随机抽样一致算法（Random sample consensus，RANSAC）