简介
数字图像从获取到分割前的所有处理都可以统称为预处理。经过预处理后的图像在亮度、对比度、清晰度、几何位置等方面都能达到良好的效果,然后进一步进行图像分割,把感兴趣的目标和背景分割开,最后对分割出来的目标进行分类描述,建立特征库,进行进一步的分类识别。并根据输出的结果去驱动执行机构.这就是图像处理在工业领域的最终应用。
图像的描述是刘‘图像各组成部分的性质和彼此之间炎系的描述。区域描述是在图像中感兴趣的区域被分割出来后,对各个分割区域特点的描述,如形状、凹凸度等,关系描述则是研究把这些区域组织为一个有意义的结构。为了让计算机有效地识别分割出来的目标,有必要对各区域、边界的属性和相关关系用简洁明确的数值和符号进行表示,这样在保留原图像或图像区域重要信息的同时,能进一步减少描述区域的数据量。这些从原始图像中产生的数值、符号或者形状称为图像的特征,它们反映了原图像最重要的信息和主要特征。把这些表征图像特征的一系列符号称为描绘子,描绘子具有如下特点:
(1)唯一性:每个目标必须有唯一的表示,否则无法区分。
(2)完整性:描述是明确的,没有歧义的。
(3)几何变换不变性:描述应具有平移、旋转、尺度等几何变换不变性。
(4)敏感性:描述结果应该具有对相似目标加以区别的能力。
(5)抽象性:从分割区域、边界中抽取反映目标特性的本质特征,不容易因噪声等原I列而发生变化。
结合图像的特点,下面主要介绍一下图像的几何特征和一些常用的图像描述方法,包括时图像边界的描述、区域的描述、矩描述、纹理描述等,根据不同图像的特点选择适当的描述方法,并将其有机地结合起来。2
图像标识图像标识是图像描述的前提条件。图像经过分割后,一般得到若干个边界和目标区域,为了能够从中识别出目标,将它们提取出来,就需要对图像进行标识。好的图像标识应在尽可能区别不同目标的基础上对目标的尺度、平移、旋转等不敏感。
图像标识的一种常见方法是对每个区域标注一个唯一的数字,一般为整数。获取最大整数之后即可方便得出图像中区域的数目。另一种常见方法是使用较少数目的标号,保证两个相邻区域不存在柑同编号即可。但是这种方法必须将区域相关像素的信息加到描述中。
标识算法的输入一般为二值图像或多亮度级别的图像,其中背景可用零值像素表示,目标则用非零像素表示。下面介绍一种实用的4邻域标记算法和8邻域标记算法。
(1)第一遍扫描:按从左到右,从上而下的顺序搜索整个图像A,对每个非零像素点A(i,j)赋予一个非零值b,根据邻域像素点的标号来选择b的值。邻域可参见下图。
如果所有的邻域像素值都为0,则赋予A(i,j)一个新的标号。
如果邻域中仅有一个非零标号或是全部非零标号相同,那么将这个标号赋予A(i,j)。
如果邻域中存在不同的非零标号(标号冲突),将这个标号对保存在等价表中。
(2)第二遍扫描:由于标号冲突,一些区域存在不同标号的像素。重新扫描图像,使用等价表的信息标注像素(一般选择等价对中的最小值)。
4邻域标记算法与8邻域标记算法基本相同,邻域的形状如上图所示。下面给出一个使用4邻域标记算法的例子,如下图所示。3
图像描述基础表示区域涉及到两个基本选择:(1)用外部特征(区域的边界)表示区域;(2)用内部特征(组成区域的像素)表示区域。然而,选择一种表示方案仅仅是使数据更适宜于计算机处理的任务的一部分。下一个任务是在选择了表示方案的基础上描述区域。例如,区域可以用边界来表示,而边界可以用诸如边界长度和其包含的凹面象征的数目等特征来描述。
图像描述方法(1)曲线拟合的实现;
(2)链码:包括归一化链码和一级差分链码;
(3)基于弧长极半径的傅立叶描述子。
(4)矩描述:实现HU不变矩的计算。
静态图像描述位图与矢量图位图(又称像素图或点阵图像)是由许多小栅格(即像素)组成的,处理位图时,实际上是编辑像素而不是图像本身。像素是组成图像的最小单元,每个像素的大小是由图像的分辨率决定的,图像分辨率越高,单位长度上的像素点就越多,每个像素点就越小。每个像素点的位置、色彩、亮度不同,组合在一起形成规则的点阵结构,就组成了图案。
矢量图是用直线、曲线等几何形状来记录和表现图形信息的。使用矢量图最大的好处是任意缩放图像和以任意分辨率的设备输出图像时,都不会影响图像的品质,也就是说,矢量图的质量不受分辨率高低的影响。其优点在于可以对图中的每个部分分别进行控制,在屏幕上移动每个部分以及将之压缩、放大、扭转和旋转均不会破坏画面。
图像分辨率分辨率是和图像的细节表现能力相关的重要概念,分辨率一般指单位长度内的像素数量。图像分辨率越高,图像画面的质量越好,对应的图像文件大小越大,图像细节的表现越丰富。
图像分辨率是针对位图而言的,矢量图是不存在分辨率的。
像素像素是构成数字图像的基本单元。
像素的颜色深度用来衡量像素中颜色信息的多少,又被称为位深度。颜色深度用每个像素点上颜色的数据位数(bit)来表示。例如8位颜色深度可以表示256(28)种颜色值,一位的颜色深度可以表示黑、白两种颜色。
常用的图像的文件格式BMP格式是一种与硬件设备无关的图像文件格式,它采用位映射存储格式,文件所占用的空间很大。文件存储数据时,图像的扫描方式是从左到右、从下到上的顺序。
TIFF格式灵活易变,它定义了4类不同的格式。TIFF-B适用于二值图像:TIFF-G适用于黑白灰度图像;TIFF-P适用于带渊色板的彩色图像;TIFF-R适用于RGB真彩图像。
GIF格式采用LZW压缩算法来存储图像数据,并采用了可变长度等压缩算法。GIF的图像深度为1~8.也即GIF最多支持256种颜色的图像。GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。
JPEG格式采用对称的压缩算法,也即在同一系统环境下压缩和解压缩所用的时间相同。采用JPEG压缩编码算法压缩的图像,其压缩比为1:5~1:50,甚至更高。
PSD格式是Photoshop的固有格式,PSD格式可以比其他格式更快速地打开和保存图像,很好地保存图层、通道、路径、蒙版,以及压缩方案不会导致数据丢失等。用PSD格式保存图像时,图像没有经过压缩,当图层较多时,会占很大的硬盘空间。4
动态图像描述动态图像包括动画和视频信息,是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,通常称做动画;当序列中每帧图像是通过实时摄取的自然景象或活动对象时,称为影像视频,或简称视频。
视频技术包括视频数字化和视频编码技术两个方面。视频数字化是将模拟视频信号经模数转换和彩色空间变换转为计算机可处理的数字信号,使得计算机可以显示和处理视频信号。视频编码技术是将数字化的视频信号经过编码成为电视信号,从而可以录制到录像带中或在电视上播放。对于不同的应用环境有不同的技术可以采用。从低档的游戏机到电视台广播级的编码技术都已成熟。常见的视频文件格式如下表所示。4
图像描述应用当我们对形状特征表示感兴趣时,可以选择外部表示;当我们的主要注意力集中于区域属性时,可以选择内部表示,如颜色和纹理。有时可用这两种表示来解决同一问题。无论是哪一种情况,被选择描绘子的特征应该尽可能对区域大小、平移与旋转的变化不敏感。在很大程度上,描述子满足一个或者多个这样的属性。