图像矩概述

1. 概述

矩函数在图像分析中有着广泛的应用,如模式识别、目标分类、目标识别与方位估计、图像编码和重构等。一个从一幅数字图像中计算出来的矩集,通常描述了该图像形状的全局特征,并提供大量的关于该图像不同类型的几何特性信息。

  • 一个概率密度函数的零阶、一阶、二阶矩分别表示其全概率、数学期望和方差。
  • 零阶到三阶矩用于描述总体水平上的图像特征,而更高阶矩则含有更好的图像细节,但通常对噪声更加敏感,可以变换方式减少或消除噪声的影响。

2. 定义

2.1 XY 坐标

将一幅图像看成一个二维密度分布 f(x,y)f(x,y),函数值 f(x,y)f(x,y) 表示点 (x,y)(x,y) 处图像像素的亮度值;用 ζ\zeta 表示 xyx-y 平面上图像的区域,即 f(x,y)f(x,y) 的定义域范围。设一幅图像的亮度函数为 f(x,y)f(x,y),它的 (p+q)(p+q) 阶矩函数的一般定义如下:

\begin{aligned} \Phi_{pq} = \iint\limits_\zeta \Psi_{pq}(x,y) f(x,y) \mathrm{d}x \mathrm{d}y \qquad p,q = 0,1,2,\cdots \tag{1} \end{aligned}}

其中,Ψpq(x,y)\Psi_{pq}(x,y) 是一个 ζ\zeta 内关于 (x,y)(x,y) 的连续函数,它被称为矩的权核基本集。下表 pqpq 通常表示函数 Ψpq(x,y)\Psi_{pq}(x,y) 中定义的坐标 x,yx,y 的次数。

2.2 极坐标

在极坐标 (r,θ)(r,\theta) 下的基函数需要按照图像空间的极坐标表示,因此图像的 (p+q)(p+q) 阶矩函数的一般定义如下:

\begin{aligned} \Phi_{pq} = \iint\limits_\zeta r^{p+q+1} \Psi_{pq}(\theta) f(r,\theta) \mathrm{d}r \mathrm{d}\theta \qquad p,q = 0,1,2,\cdots \tag{2} \end{aligned}}


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!