,用于通过已知的数据点找到最能描述这些点的数学模型或曲线。
(本章以 Line Ftting 为例 )
鲁棒估计器
Robust Estimator,能够在数据中存在异常值的情况下,依然提供稳定的拟合结果。
RANSAC
Random Sample Consensus,随机采样一致性算法,专门用于在含有大量噪声的数据中找到合适的模型。
假设数据具有某种特性,为了达到目的,适当割舍一些现有的数据。
参数
- :随机采样点
- :判断是否为内点的距离阈值 (Distance threshold)
- 反映数据中噪声的标准范围。
- 如果已知噪声标准差 ,可以选择 为 的某个倍数 。
- 常见的 为 1.96(95% 置信区间)或 3.0(99.7% 置信区间)。
- 点到模型的误差如果小于 ,则被视为「内点 」(Inlier)
- 数据中的噪声称为「外点」(Outlier)
- :模型所需的最小内点数量
- :内点的概率
- 最大迭代次数,用于平衡时间效率和结果质量
- : 异常值概率
- :至少一个随机样本没有异常值的概率
原理
- 随机采样 个点
- 从数据集中随机选择 s 个点,作为当前的样本集。
- 用这些点拟合出一个候选模型 。
- 计算内点集合
- 使用候选模型 ,计算每个点到模型的误差。
- 将误差小于阈值 的点标记为内点,形成内点集合 。
- 评估候选模型
- 如果内点集合的大小 ,并且内点数量是当前最大值,则更新最佳模型 和内点集合 。
- 如果内点数量不足 ,则放弃该模型。
- 迭代
- 重复上述过程,直至达到最大迭代次数 ,或者找到符合要求的模型。
- 最后返回最佳模型 和对应的内点集合 。

优缺点
Pros- 简单且通用。
- 可以应用于许多不同的问题,且效果很好。
Cons- 参数较多,需要调整。
- 在内点比例较低时效果不好,可能需要过多的迭代,甚至完全失败)。
- 基于最小样本数无法总是很好地初始化模型。
霍夫变化
Hough Transform
通过将图像中的每个点映射到一个参数空间,该空间称为霍夫空间 (Hough space)。
在这个空间中,通过计算和搜索找到代表图像几何形状的参数。
假设有一幅图像,经过滤波,边缘检测等操作,变成了下面这张图的形状:

那么如何把这张图片中的直线提取出来?
基本的思考流程是:如果直线 在图片中,那么图片中必需有 点也在该线上(像素点代入表达式成立),
因此,问题可以转换为:求解所有的 组合。
设置两个坐标系,左边表示 值,右边表示 的值,即左边的一个 点在右边对应的是一条线。

这种方案存在问题: 的取值范围太大
- Unbounded parameter domain
- Vertical lines require infinite
改用 代替直线的一般表达式
算法概要
- 初始化:将累加器 的所有值初始化为零。
- 对每个边缘点 执行以下步骤:
- 对 从 0 到 180 进行迭代:
- 更新累加器:
- 结束 的循环。
- 结束边缘点的循环。
- 寻找峰值:在累加器 中,找到局部最大值对应的 值。
- 输出检测到的直线:在图像中对应的直线由方程 表示
