[科普中国]-图像数据处理-

简介

图像数据处理技术基本可以分成两大类：模拟图像处理（Analog Image Processing）和数字图像处理（Digital Image Processing）。数字图像处理是指将图像信号转换成数字信号并利用计算机进行处理的过程。其优点是处理精度高，处理内容丰富，可进行复杂的非线性处理，有灵活的变通能力，一般来说只要改变软件就可以改变处理内容。困难主要在处理速度上，特别是进行复杂的处理。数字图像处理技术主要包括如下内容：几何处理（Ceometrical Processing）、算术处理（Arithmetic Processing）、图像增强（Image Enhancement）、图像复原（Image Restoration）、图像重建（Image Reconstructiong）、图像识别（Image Recongnition）。图像处理技术的发展涉及到信息科学、计算机科学、数学、物理学以及生物学等学科，其理论和技术的发展对图像处理科学的发展有越来越大的影响。近年来，图像处理技术日趋成熟，被航空航天、军事、生物医学及人工智能等广泛应用。1

研究现状

数字图像数据处理技术是 20 世纪 60 年代随着计算机技术和 VLSI（Very Large Scale Integration）的发展而产生、发展和不断成熟起来的一个新兴技术领域，在理论、技术和实际应用方面都取得了巨大成就。早期图像处理的目的是改善图像质量，它以人为对象，以改善人的视觉效果为目的，输入的是质量低的图像，输出的是改善质量后的图像，目前发展到图像自动识别的新的阶段。

常用的图像数据处理方法有图像增强、复原、编码、压缩等。首次获得成功应用的是美国喷气推进实验室（JPL），即对航天探器徘徊者 7 号在 1964 年发回的几千张月球照片进行图像处理，如几何校正、灰度变换、去除噪声等，并考虑了太阳位置和月球环境影响，由计算机成功地绘制出月球表面地图，获得了巨大成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理，获得了月球地形图、彩色图及全景镶嵌图，为人类登月创举奠定了坚实的基础，也推动了数字图像处理这门学科的诞生。以后的宇航空间技术探测研究中，数字图像处理技术都发挥了巨大作用。

图像数据处理的大发展是从 20 世纪 90 年代末开始的。自 1986 年以来，小波理论与变换方法迅速发展，克服了傅里叶分析不能用于局部分析等方面的不足之处，被认为调和分析半个世纪以来工作之结晶。Mallat在 1988 年有效地将小波分析应用于图像分解和重构。小波分析被认为是信号与图像分析在数学方法上的重大突破。

进入 21 世纪，随着计算机及 ARM 技术的迅猛发展和相关理论的不断完善，图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就。但与此同时，图像处理和计算机视觉的工程应用中还有许多问题尚待解决。特别是传统的视频监控系统均以固定的工作站或 PC 机作为查看、控制客户端，成本高、使用不方便，更无法达到随时随地方便监控的效果。根据这种情况，研究设计出成本低、处理速度高、运行稳定的嵌入式可移动图像处理系统就显得尤为迫切。1

图像数据基本术语

图像（Image）就是采用各种观测系统获得的，能够为人类视觉系统所感觉到的实体。研究表明，人类交往用以传递信息的主要媒介是语言和图像。据统计，在人类接收的信息中，听觉占 20%，视觉占 60%（有人估计占 75%），其他占 20%。由此可见，作为信息传递媒介之一的图像的地位是非常重要的。

图像就其本质而言可以将分为模拟图像和数字图像两大类。模拟图像，用连续函数来描述，其特点为光照位置和光照强度均为连续变化。模拟图像的处理速度快，但精度和灵活性差，不便于用计算机处理，也不便于图像的储存、传输。数字图像，将连续的模拟图像经过幅度和位置的离散化处理后形成的数字图像。数字图像的传输快速有效，存储通用性强，精度高，处理方法灵活。本文涉及到的图像均指数字图像。图像处理着重考虑图像之间的变换，主要包括对图像进行各种加工以改善图像的视觉效果并为自动识别打基础，主要在图像像素级上进行处理，包括噪声滤波、图像增强等，为研究这些理论首先要搞清楚几个与图像数据有关的术语。

像素

当把一个监视的图像输入到视频监视系统时，将每个连续的图像描述成 M×N矩阵的形式，矩阵的每一个元素称为像素 P（i，j），是一个非负值标量，因为图像光强没有负值。从实际的图形转变成矩阵时，常把图像 x,y 的坐标原点设在左下角，而像素的数 i，j 则通常从矩阵的左上角开始。这样 x 与 i 有着对应的关系，而 y 与 j 则相反。

灰度矩阵

在图像被采样和模数转换后，代表图像上每个像素的光强用灰度来表示，它取决于模数转化，也与所用微处理器有关。目前常用的是 256 灰度级，相当于 8位，其数值由 0 到 255。对于灰度值，在转换时若采用四舍五入法，则灰度定量误差为1/512=0.2%。一个图像在存储或处理时都采用一个以像素为位置、灰度值数组元素的矩阵表示。像素除用灰度表示外，也可用 RGB 色彩成分表示，其包含更加丰富的信息。

窗口

在图像处理中常常需要在整个图像的某一部分进行，这个子区域称为子域，它常用四角对应的像素来表示。

图像数据去噪

图像数据去噪又称作图像滤波，其最终目的是改善给定的图像，解决实际图像由于各种寄生效应产生的图像质量下降的问题。通过去噪技术可以有效地提高图像的质量，增大信噪比，更好地体现原来图像所携带的信息，做为一种重要的预处理手段为后续的数字图像数据处理和目标识别奠定良好基础。

图形分割

图像分割是数字图像处理中的关键技术之一，图像分割是将图像中有意义的特征部分提取出来，其有意义的特征有图像中的边缘、区域等，这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法，但还没有一种普遍适用于各种图像的有效方法。因此，对图像分割的研究还在不断深入之中，是目前图像处理中研究的热点之一。

图像分割是将图像中有意义的特征或区域提取出来的过程。这些特征可以是图像的原始特征，如像素的灰度值、物体轮廓、颜色、反射特征和纹理等，也可以是空间频谱等，如直方图特征。图像分割的目的是把图像划分成若干互不相交的区域，使各区域具有一致性，而相邻区域间的属性特征有明显的差别。图像分割的应用非常广泛，几乎出现在有关图像处理的所有领域，并涉及各种类型。传统的图像分割方法包括基于区域的，基于边缘的和两者结合的图像分割方法。

基于区域的图像分割

基于区域的分割方法是以直接寻找区域为基础的分割技术，具体算法有区域生长和区域分离与合并算法。基于区域提取方法有两种基本形式：一种是区域生长，从单个像素出发，逐步合并以形成所需要的分割区域；另一种是从全局出发，逐步切割至所需的分割区域。在实际中使用的通常是这两种基本形式的结合。该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识不足的图像分割，效果较理想。

基于边缘的图像分割

基于边缘检测的分割方法试图通过检测不同区域的边缘来解决问题，通常不同的区域之间的边缘上灰度值的变化往往比较大，这是边缘检测方法得以实现的主要假设之一。它的基本思想是先检测图像中的边缘点，再按一定策略连接成轮廓，从而构成分割区域。其难点在于边缘检测时抗噪性和检测精度的矛盾，若提高检测精度则噪声产生的伪边缘会导致不合理的轮廓，若提高抗噪性则会产生轮廓漏检和位置偏差。

边缘与区域相结合的图像分割方法

边缘检测能够获得灰度值的局部变化强度，而区域分割能够检测特征的相似性与均匀性。边缘与区域相结合分割的主要思想是结合二者的优点，通过边缘点的限制，避免区域的过分割。同时，通过区域分割补充漏检的边缘，使轮廓更加完整。2

图像数据增强

图像增强是指按特定的需要突出一幅图像中的某些信息，消弱或去除某些不需要的信息的处理方法。由于受到各种条件的限制和随机干扰，使得图像外观质量严重退化，所以采取的基本手段是灰度校正，噪声滤波等，以使图像在视觉感知或某种准则下恢复原始图像，恢复原始图像其实是解决图像灰度与原始图像不匹配的问题。有选择的加强图中某些信息而抑制另一些信息，目的是增强图像的有用性。

图像增强技术是改善图像质量的一种重要技术。它可以改善图像的模糊状况，有目的的强调和增强图像的局部性，是图像更适合人的视觉效果。图像增强技术主要有直方图处理、平滑处理、锐化处理等。可以归纳为两大类：空域处理和频域处理。空域处理方法是直接对图像中的像素进行处理，基本上以灰度映射变换为基础，增强图像的对比度、改善图像的内部层次。频域处理时运用变换技术如傅里叶变换等，用数字滤波方法修改图像频谱，在反变得到增强的图像。2

图像数据目标检测与运动检测

图像的检测是利用图像不同区域的边缘上存在灰度值的不连续性或突变性来实现的，在对图像进行处理的三维显示过程中，边缘检测占有十分重要的地位。边缘检测可以分为并行法和串行法两种，并行法对边缘点的判定是基于所检测的点及其邻点，主要包括一些局部微分算子，其优点是速度快，但得到的往往是不连续、不完整的结构信息。串行法中判断一个被检测点是否为边缘点依赖于其周围的已检测像素点，即属于多阶段决策过程，可以检测到感兴趣边缘的单线、连续的结构信息，但这种方法速度较慢。

Montanar 第一个提出在边缘检测时可以考虑最优化判据，动态规划（DP）是一种解决多阶段决策过程最优化的方法。首先检测出图像的局部不连续性，再用串行搜索法将它们连成边界，从而实现目标的边缘检测。Pope 和 Parker 等曾经建立了一个搜索矩阵，把二维边缘的跟踪问题化为对似然矩阵从上到下的一维搜索，增强了方向性，对垂直于搜索方向的边缘线不灵敏，需人为进行错误跟踪及纠正。Morse 和 Mortensen 等尝试利用活动线(Live-sire)的方法获得最优化二维边缘搜索。用于边缘检测的 DP 模型以某一起始点到某一终止点的累积代价作为目标函数，起始代价阵元素作为变量，最优值就是使终止点的累积代价值最小。动态规划用于边缘检测时，要同时利用局部梯度信息和全局边缘累积代价信息，这正是它能获得全局最优解的原因。通过分析动态规划算法的原理可以得知，算法的核心是一个对全局数据的反复迭代，直到稳定的过程。该过程保证了 DP 算法在解决图像边缘检测时得到的轮廓线是稳定唯一的，这即是希望的全局最优解。

针对小直径的图像测量的边缘检测，可以利用最小二乘法确定优化目标函数，用 Powell 优化方法获得优化结果，最后采用正态分布理论对优化结果进行修正的新方法。优化目标函数的建立通过圆心坐标（x,y）和半径 r 可以获得一个标准圆的图像。用最小二乘估计值║f-g║来描述标准圆的图像和原图像的误差，将该误差定为优化目标函数。对孔测量采用圆径向方向目标图像的边缘点与标准圆周距离的平方和，作为其误差的描述。

运动目标检测的方法主要有减背景技术、帧差技术和光流技术对象分割算法等。

减背景技术

减背景技术是目前最常用的一种方法，利用当前图像与背景图像的差分米检测运动区域的一种技术。它一般能提供最完全的特征数据，但是对于动态场景的变化，如光照变化等特别敏感。最简单的背景模型是时间平均图像，大部分的研究人员都致力于开发不同的背景模型，以期减少动态场景变化对运动分割的影响。

帧差技术

帧差技术是在连续的图像序列中两个或三个相邻帧间采用基于象素的帧间差分并且阈值化来提取出图像中的运动区域。

光流技术

基于光流技术的对象检测采用了运动对象随时间变化的光流特性，如Meyer等通过计算位移向量光流场来扔始化基于轮廓的跟踪算法，从而有效地提取和跟踪运动对象。该方法的优点是在摄像机存在运动的前提下也能检测出独立的运动对象。然而，大多数的光流计算方法相当复杂，且抗噪性能差，如果没有特别的硬件装置则不能被应用于视频流的实时处理。2