拟合
字数: 0
page icon
,用于通过已知的数据点找到最能描述这些点的数学模型或曲线。
(本章以 Line Ftting 为例 )

最小二乘法

Least Squares
notion image

总最小二乘法

Total Least Squares, TLS
对经典 LS 的扩展,适用于在数据中同时存在自变量 和因变量 的误差情况。

鲁棒估计器

Robust Estimator,能够在数据中存在异常值的情况下,依然提供稳定的拟合结果。

RANSAC

Random Sample Consensus,随机采样一致性算法,专门用于在含有大量噪声的数据中找到合适的模型。
💡
假设数据具有某种特性,为了达到目的,适当割舍一些现有的数据。

参数

  • :随机采样点
  • :判断是否为内点的距离阈值 (Distance threshold)
    • 反映数据中噪声的标准范围。
      • 如果已知噪声标准差 ,可以选择 的某个倍数
      • 常见的 为 1.96(95% 置信区间)或 3.0(99.7% 置信区间)。
    • 点到模型的误差如果小于 ,则被视为「内点 」(Inlier)
    • 数据中的噪声称为「外点」(Outlier)
  • :模型所需的最小内点数量
    • :内点的概率
    • 最大迭代次数,用于平衡时间效率和结果质量
    • 异常值概率
    • :至少一个随机样本没有异常值的概率

原理

  1. 随机采样 个点
      • 从数据集中随机选择 s 个点,作为当前的样本集。
      • 用这些点拟合出一个候选模型
  1. 计算内点集合
      • 使用候选模型 ,计算每个点到模型的误差。
      • 将误差小于阈值 的点标记为内点,形成内点集合
  1. 评估候选模型
      • 如果内点集合的大小 ,并且内点数量是当前最大值,则更新最佳模型 和内点集合
      • 如果内点数量不足 ,则放弃该模型。
  1. 迭代
      • 重复上述过程,直至达到最大迭代次数 ,或者找到符合要求的模型。
      • 最后返回最佳模型 和对应的内点集合
        • notion image

优缺点

Pros
  • 简单且通用。
  • 可以应用于许多不同的问题,且效果很好。
Cons
  • 参数较多,需要调整。
  • 在内点比例较低时效果不好,可能需要过多的迭代,甚至完全失败)
  • 基于最小样本数无法总是很好地初始化模型。

霍夫变化

Hough Transform
通过将图像中的每个点映射到一个参数空间,该空间称为霍夫空间 (Hough space)
在这个空间中,通过计算和搜索找到代表图像几何形状的参数。

假设有一幅图像,经过滤波,边缘检测等操作,变成了下面这张图的形状:
notion image
那么如何把这张图片中的直线提取出来?
基本的思考流程是:如果直线 在图片中,那么图片中必需有 点也在该线上(像素点代入表达式成立),
因此,问题可以转换为:求解所有的 组合。

设置两个坐标系,左边表示 值,右边表示 的值,即左边的一个 点在右边对应的是一条线。
notion image
⚠️
这种方案存在问题: 的取值范围太大
  • Unbounded parameter domain
  • Vertical lines require infinite
改用 代替直线的一般表达式

算法概要

  1. 初始化:将累加器 的所有值初始化为零。
  • 对每个边缘点 执行以下步骤
    • 从 0 到 180 进行迭代:
    • 更新累加器:
    • 结束 的循环。
  • 结束边缘点的循环。
  • 寻找峰值:在累加器 中,找到局部最大值对应的 值。
  • 输出检测到的直线:在图像中对应的直线由方程 表示
2023 - 2026