DIP概述

【注】本学习笔记参考自《数字图像处理(第三版)》——(美)冈萨雷斯。

1. 引言

数字图像处理(DIP)方法的重要性源于两个主要应用领域:

  • 改善图示信息以便人们解释(人类解释);
  • 为存储、传输和表示而对图像数据进行处理(机器感知)。

1.1 什么是 DIP

一幅图像可定义为一个二维函数 f(x,y)f(x,y),其中 xxyy 是空间(平面)坐标,而任何一对空间坐标 (x,y)(x,y) 处的幅值 ff 称为图像在该点处的强度或灰度。当 x,yx,y 和灰度值 ff 是有限的离散数值时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。

注意,数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅值,这些元素称为像素

从图像处理到计算机视觉的这个连续统一体内并没有明确的界限。然而,一种有用的范例是在这个连续的统一体中考虑三种典型的计算处理,即低级、中级和高级处理。

  • 低级处理涉及初级操作,如降低噪声的图像预处理、对比度增强和图像尖锐化。低级处理以输入、输出都是图像为特征。
  • 中级处理涉及诸多任务,譬如图像分割,减少这些目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。中级图像处理以输入为图像但输出为从这些图像中提取的特征(如边缘、轮廓及各物体的标识等)为特点。
  • 高级图像处理涉及「理解」已识别目标的总体,就像在图像分析中那样,以及在连续统一体的远端执行与视觉相关的认知功能。

1.2 DIP 应用方向

用于人类解释的应用方向有:

  • 在空间项目领域,利用计算机技术改善空间探测器发回的图像。
  • 在工业、医学及生物科学领域,计算机方法用于增强对比度或将灰度编码为彩色,以便解释 X 射线图像和其它图像。
  • 在地理学领域,从航空和卫星成像中研究污染模式。
  • 在考古学领域,使用图像处理方法已成功地复原了模糊的图片,这些图片是丢失或损坏的稀有物品的唯一现有的记录。图像增强和复原方法还可用于处理不可修复物体的退化图像,或太昂贵以至于不可复制的实验结果。
  • 在物理学和相关领域,计算机技术通常用于增强如高能等离子和电子显微镜等领域的实验图像。

用于机器感知的应用方向有:

  • 机器感知中使用的信息类型的例子有统计矩、傅里叶变换和多维距离度量。
  • 在机器感知中,使用图像的处理技术的典型问题是自动字符识别、产品装配线和检测的工业机器视觉、军事识别、指纹的自动处理、X 射线和血样分类、用于天气预报和环境评估的航空图像与卫星图像的机器处理。

1.3 DIP 应用实例

1.3.1 电磁波成像

电磁波谱

  • 伽马射线成像

伽马射线成像的主要用途包括医学和天文观测。在核医学中,这种方法是将放射性同位素注射到人体内,当这种物质衰变时就会放射出伽马射线,然后伽马射线检测仪收集到的放射线来产生图像。

  • 正电子放射断层(PET):它给病人注入放射性同位素,同位素衰变时放射出正电子。当正电子遇上一个电子时,两者湮没并放射出两束伽马射线。检测到这些射线后,就可以利用断层技术(见下文 X 射线成像中的 CT 技术)的基本原理创建断层图像。
  • X 射线成像

X 射线是最早用于成像的电磁辐射源之一。最熟悉的 X 射线应用是医学诊断,但是 X 射线还被广泛用于工业和其他领域,如天文学。用于医学和工业成像的 X 射线是由 X 射线管产生的,X 射线管量带有阴极和阳极的真空管。阴极加热释放自由电子,这些电子以很高的速度向阳极流动,当电子撞击一个原子核时,能量被释放并形成 X 射线辐射。X 射线的能量由另一边的阳极电压控制,而 X 射线的数量由施加于阴极灯丝的电流控制。

  • 计算机轴向断层(CT):CT 是图像处理在医学诊断领域最重要的应用之一。CT 是一种处理方法,在这种处理中,检测器环绕着一个物体,并且一个与该环同心的 X 射线源(与检测器环同心)绕着物体旋转。X 射线穿过物体并由环中对面的检测器进行收集。当 X 射线源旋转时,重复这一过程。断层由一些算法组成,这些算法使用感知的数据来重建通过物体的「切片」图像。当物体沿垂于检测器环的方向运动时,就产生一系列这样的「切片」,这些切片组成旋物体内部的三维再现。
  • 紫外波段成像

紫外光的应用多种多样,包括平板印刷术、工业检测、显微镜方法、激光、生物成像和天文观测等。

  • 紫外光用于荧光显微镜方法:紫外光本乐身并不可见,但当紫外辐射光子与荧光材料内原子中的电子碰撞时,它把电子提高到较高的能级,随后受激电子释放到较低的能级并以可见光范围内的低能光子形式发光。荧光显微镜方法的基本任务是用激发光照射一个样品,然后从较强的激发光中分离出较弱的荧光,这样仅有辐射光到达人眼或其他检测器,以允许检测足够的对比度而得到照射在背景上的荧光区。
  • 可见光及红外波段成像

可见光的成像应用领域非常广泛,而红外波段常用于与可见光相结合成像。可见光处理的一个主要应用领域是遥感,遥感通常包括可见光和红外波谱范围的一些波段。天气观测与预报也是卫星多光谱成像的主要应用领域。此外,可见光谱中的一个主要成像领域是生产产品的自动视觉检测。

  • 微波波段成像

微波波段成像的典型应用是雷达。成像雷达的独特之处是在任何范围和任何时间内,不考虑气候、周围光照条件的收集数据的能力。某些雷达波可以穿透云层,在一定条件下还可以穿透植被、冰层和极干燥的沙漠。在许多情况下,雷达是探测地球表面不可接近地区的唯一方法。

  • 成像雷达的工作原理就像一台闪光照相机,它自己提供照明(微波脉冲)去照亮地面上的一个区域,并得到一幅快照图像。与照相机镜头不同,雷达使用天线和数字计算机记录图像,在雷达图像中,能看到的只是反射到雷达天线的微波能量。
  • 无线电波成像

类似波谱另一端(伽马射线)的成像情况那样,无线电波段成像主要应用于医学和天文学。在医学中,无线电波用于核磁共振成像(MRI)。

  • MRI技术是把病人放在强磁场中,并让无线电波短脉冲通过病人的身体,每个脉冲将导致由病人的组织发射的无线电响应脉冲,这些信号发生的位置和强度由计算机确定,这些信号发生的位置和强度由计算机确定从而产生病人的一幅二维剖面图像。MRI 可以在任何平面产生图像。

1.3.2 其它成像方式

虽然电磁波谱成像一直占主导地位,但大量的其他成像方式也很重要。诸如声波成像、电子显微镜方法和由计算机产生的合成成像。

  • 声波成像

声波成像在地质勘探、工业和医学中得到了应用。地质应用采用的是声谱中的低端声波(几百赫兹),其它应用领域的成像使用超声波(百万赫兹)。

  • 图像处理在地质中的最重要商业应用是矿产和石油勘探。为了透过地表获取图像,主要方法之一是利用一辆大型卡车和一个大的钢制平板,平板由卡车压在地面上,同时卡车以 100 Hz 的频率振动。返回声波的强度和速度由地表下面的成分决定。这些声波经过计算机分析后,可由分析结果生成图像。为了从海洋获取图像,能源通常由两个位于船后部的空气枪组成。返回的声波由置于船后部电缆中的水听器检测,电缆不是放置在海底,就是用浮子悬吊着(垂直电缆)。两把空气枪交替加压至 2000 psi(磅/平方英寸)左右,然后使之爆发。船的匀速运动提供了横向运动,这种横向运动与返回的声波一起产生一幅海洋底部地下的合成三维图像。
  • 超声波成像常用于制造业,但这一技术最为熟知的应用是在医学领域,特别是妇产科。在妇产科,医生对未出生的胎儿成像,以确定其发育的健康状况。这一检测的副产品是确定胎儿的性别。超声波图像是利用下面的基本步骤生成的:
  1. 超声波系统(一台计算机、由超声波源和接收器组成的超声波探头及一台显示器)向人体发射高频(1~5 MHz)声波脉冲。
  2. 声波传入体内并碰撞组织间的边界(比如流体和软组织之间的边界、软组织和骨骼之间的边界)。一部分声波反射回探头;一部分声波则继续传播,直到它们到达另一个边界并被反射。
  3. 反射波被探头拾取并传给计算机。
  4. 计算机根据声波在组织中的传播速度(1540 m/s)和每个回波的返回时间,计算从探头到组织或器官边界的距离。
  5. 系统在屏幕布上显示回波的距离和亮度,形成一幅二维图像。
  • 电子显微镜方法

电子显微镜的功能与光学显微镜一样,只不过是用一个聚焦的电子波束代替光束形成图像标本。电子显微镜的操作包括下面几个基本步骤:由电子源产生一个电子流,用正电势朝着标本加速。该电子束用金属小孔和电磁透镜限制并聚焦为一个细的单色波束。然后使用一个磁透镜将单色电子束聚焦到样本上,在样本内部产生交互照射并影响电子束。这些交互作用和影响被检测并转换为一幅图像,这种方式与光被物体反射或吸收的方式一样。所有电子显微镜均执行这些基本步骤。

  • 透射电子显微镜(TEM):其工作原理很像一台幻灯片投影仪,投影仪发射出一束透过幻灯片的光;当光通过幻灯片时,它由幻灯片的内容调节。这一发射出的光束然后被投射到观察屏上,形成幻灯片的放大图像。除了发射的是一个电子束通过样本之外,TEM 以相同的方式工作。穿过样本的部分电子束被投射到荧光屏上,而电子击荧光物质的相互作用就产生了光,从而得到可观察的图像。TEM 具有非常高的空间分辨率(0.1~0.2 nm),但景深比较小,对样品表面不敏感,主要用于观察样品内部的结构
  • 扫描电子显微镜(SEM):与 TEM 不同的是,SEM 通过扫描电子束与样本的相互作用,激发样品中的二次电子,二次电子被探测器接收,通过信号处理在荧光屏上产生一个点。一幅完整的图像由通过样本的电子束光栅扫描形成(非常像电视摄像机),电子与荧光相互作用并产生光。SEM 的空间分辨率一般比 TEM 低得多(1~3 nm),但景深比 TEM 高得多,主要用于样品表面形貌的观察

2. DIP 基本步骤

DIP基本步骤

  • 图像获取:包括图像预处理,譬如图像缩放。
  • 图像增强:指对一幅图像进行某种操作,使其结果在特定应用中比原始图像更适合进行处理。
  • 图像复原:复原也是改进图像外观的一个处理领域。然而,与图像增强不同,图像增强是主观的,而图像复原是客观的;在某种意义上说,复原技术倾向于以图像退化的数学或概率模型为基础,而增强技术以什么是好的增强效果这种人的主观偏爱为基础。
  • 彩色图像处理:彩色是提取图像中感兴趣特征的基础。
  • 小波处理:小波是以不同分辨率来描述图像的基础。
  • 图像压缩:压缩指的是减少图像存储量或降低图像带宽的处理。
  • 形态学处理:其涉及提取图像分量的工具,这些分量在表示和描述形状方面很有用。
  • 图像分割:分割过程将一幅图像划分为它的组成部分或目标。
  • 表示与描述:描述又称为特征选择,涉及提取特征,它可得到某些感兴趣的定量信息,或是区分一组目标与其它目标的基础。表示与描述几乎总是在分割阶段的输出之后,通常这一输出是未加工的像素数据,这些数据不是构成一个区域的边界,就是构成该区域本身的所有点。

无论是哪种情况,把数据转换成合适计算机处理的形式都是必要的。首先,必须确定数据是应表示为一条边界还是应表示为整个区域。

  • 如果关注的是外部形状特征,比如角点和拐点,则表示为边界是合适的。
  • 如果关注的是内部特性,比如纹理或骨架形状,则区域表示是合适的。
  • 图像识别:识别是基于目标的描述给该目标赋予标志的过程。

3. DIP 系统组成

DIP系统组成