图像处理系统的功能包括:增强、编码、压缩、复原与重构。1
图像增强图像增强系统所执行操作的结果是使人们觉得处理后的图像质量更好。如对比度增强、亮度放缩、边缘锐化等。
图像增强可分成两大类:频率域法和空间域法。
前者把图像看成一种二维信号,对其进行基于二维傅里叶变换的信号增强。采用低通滤波(即只让低频信号通过)法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。
后者空间域法中具有代表性的算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等,它们可用于去除或减弱噪声。
方法:
图像增强的方法是通过一定手段对原图像附加一些信息或变换数据,有选择地突出图像中感兴趣的特征或者抑制(掩盖)图像中某些不需要的特征,使图像与视觉响应特性相匹配。
在图像增强过程中,不分析图像降质的原因,处理后的图像不一定逼近原始图像。图像增强技术根据增强处理过程所在的空间不同,可分为基于空域的算法和基于频域的算法两大类。
空域法是对图像中的像素点进行操作,用公式描述如下:
g(x,y)=f(x,y)*h(x,y)
其中是f(x,y)是原图像;h(x,y)为空间转换函数;g(x,y)表示进行处理后的图像。
基于空域的算法处理时直接对图像灰度级做运算,基于频域的算法是在图像的某种变换域内对图像的变换系数值进行某种修正,是一种间接增强的算法。
基于空域的算法分为点运算算法和邻域去噪算法。
点运算算法即灰度级校正、灰度变换和直方图修正等,目的或使图像成像均匀,或扩大图像动态范围,扩展对比度。
邻域增强算法分为图像平滑和锐化两种。
平滑一般用于消除图像噪声,但是也容易引起边缘的模糊。常用算法有均值滤波、中值滤波。锐化的目的在于突出物体的边缘轮廓,便于目标识别。常用算法有梯度法、算子、高通滤波、掩模匹配法、统计差值法等。2
图像编码编码使研究图像信息的表达方式,使其更经济与有效,这包括量化方法、冗余消除。编码还可能包括研究图像信息的表达方式,使其在传输或存储图像中出现错误时仍具有鲁棒性。
图像编码系统的发信端基本上由两部分组成。首先,对经过高精度模-数变换的原始数字图像进行去相关处理,去除信息的冗余度;然后,根据一定的允许失真要求,对去相关后的信号编码即重新码化。一般用线性预测和正交变换进行去相关处理;与之相对应,图像编码方案也分成预测编码和变换域编码两大类。
预测编码预测编码利用线性预测逐个对图像信息样本去相关。对某个像素S0来说,它用邻近一些像素亮度的加权和(线性组合)┈作为估值,对S0进行预测。S0与┈之间的差值e(u)就是预测误差。由于相邻像素与S0间存在相关性,差值的统计平均能量就变得很小。因此,只需用少量数码就可以实现差值图像的传输。
图像预测编码(差值脉码调制)主要有三种预测方法。①一维固定预测(一维差值脉码调制):用图2a中的S1或S2对S0预测,加权系数固定并且小于1。②二维固定预测(二维差值脉码调制):当预测估值取S1和S2的平均时,称之为二维平均预测,而当预测估值取┈=S1+S2-S3时,称之为二维平面预测。③条件传输帧间预测(帧差脉码调制):用前一帧同一平面位置的像素作为预测估值。对于只有少量活动的图像(如可视电话),画面中约有百分之七十以上的帧间差值等于零或很小,因此这些差值可舍弃不传。由于帧间差值的传输以其幅度是否大于某个阈值为条件,又称为条件传输帧间预测。3
变换域编码用一维、二维或三维正交变换对一维n、二维n×n、三维n×n×n块中的图像样本的集合去相关,得到能量分布比较集中的变换域;在再码化时,根据变换域中变换系数能量大小分配数码,就能压缩频带。最常用的正交变换是离散余弦变换(DCT),n值一般选为8或16。三维正交变换同时去除了三维方向的相关性,它可以压缩到平均每样本1比特。图像编码可应用于基本静止图片的数字传输、数字电视电话会议以及数字彩色广播电视。相应的压缩目标,即传输数码率范围,初步定为64千比特/秒、2兆比特/秒、8兆比特/秒和 34兆比特/秒级。虽然压缩性能较高的图像编码方案需要进行复杂的多维数字处理,但随着数字大规模集成电路的集成度和工作速度的提高,以及大容量传输信道的实现,数字图像传输必将逐步从实验方案进入实用阶段。
图像压缩目的在于减少存储与传输图像的比特数量。
图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。
信息时代带来了“信息爆炸”,使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。在遥感技术中,各种航天探测器采用压缩编码技术,将获取的巨大信息送回地面。
图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。4
图像复原对图像中的错误进行修改。如添加一个确定性的模糊操作,随机噪声等。
图像复原技术主要是针对成像过程中的“退化”而提出来的,而成像过程中的“退化”现象主要指成像系统受到各种因素的影响,诸如成像系统的散焦、设备与物体间存在相对运动或者是器材的固有缺陷等,导致图像的质量不能够达到理想要求。图像的复原和图像的增强存在类似的地方,它也是为了提高图像的整体质量。但是与图像复原技术相比,图像增强技术重在对比度的拉伸,其主要的目的在于根据观看者得喜好来对图像进行处理,提供给观看者乐于接受的图像,而图像复原技术则是通过去模糊函数去除图像中的模糊部分,还原图像的本真。其主要采用的方式是同采用退化图像的某种所谓的先验知识来对已退化图像进行修复或者是重建,就复原过程来看可以将之视为图像退化的一个逆向过程。图像的复原,首先要对图像退化的整个过程加以适当的估计,在此基础上建立近似的退化数学模型,之后还需要对模型进行适当的修正,以对退化过程出现的失真进行补偿,以保证复原之后所得到的图像趋近于原始图像,实现图像的最优化。但是在图像退化模糊的过程中,噪声与干扰同时存在,这给图像的复原带来了诸多的不确定性。5
图像重构指若干局部图像重构成一幅完整图像的过程。
投影重建利用X射线、超声波透过被遮挡物体(如人体内脏、地下矿体)的透视投影图,计算恢复物体的断层图。利用断层图或直接从物体的二维透视投影图重建物体的形状。这种重建技术是通过某种射线的照射,射线在穿过组织时吸收不同,引起在成像面上投射强度的不同,反演求得组织内部分布的图像。X光CT技术就是应用了这种重建,为医学诊断提供了手段。投影重建还用于地矿探测,在探测井中,用超声波源发射超声,用相关的仪器接收不同地层和矿体反射的超声。按照超声波在媒质的透射率和反射规律,用有关技术得到的透射投影图进行分析计算,即可恢复重建埋在地下的矿体形状。
明暗恢复形状单张照片不含图像中的深度信息,利用物体表面对光照的反射模型可以对图像灰度数据进行分析计算恢复物体的形状。
物体的成像是由于光源的分布、物体表面的形状、反射特性,以及观察者(照相机、摄像机)相对于物体的几何位置等因素确定。用计算机图形学方法可以生成不同观察角度时的图像。在计算机辅助设计中得到应用,可以演示设计物体从不同角度观察的外形,如房屋建筑、机械零件、服装造型等。反过来的处理,则可以通过图像中各个像素明暗程度,并且根据经验假设光源的分布,物体表面的反射性质以及摄像时几何位置,计算物体的三维形状。这种重建方法计算复杂,计算量也相当大,目前主要用于遥感图像中的地形重建中。
立体视觉重建用两个照相机(或摄像机)在左右两边对同一景物摄下两幅照片(或摄像图像),利用双目成像的立体视觉模型恢复物体的形状,提取物体的三维信息,也称三维图像重建。这种方法是对人类视觉的模仿。先从两幅图像提取出物体的边沿线条、角点等特征。物体的同一边沿和角点由于立体视差在两幅图中的位置略有不同,经匹配处理找出两幅图中的对应线和对应点,经几何坐标换算得到物体的形状。主要应用于工业自动化和机器人领域,也用于地图测绘。
激光测距重建应用扫描激光对物体测距,获得物体的三维数据,经过坐标换算,恢复物体的三维形状数据。激光测距的特点是准确。一种方法是固定激光源,让物体转动,并作升降,就可以录取物体在各个剖面的三维数据,重建物体在各个方向上的图像。另一种方法是激光源在一个锥形区域进行前视扫描.获得前方物体的三维数据。这种方法在行走机器人中得到应用,可以发现前方障碍,计算出障碍的区域,绕道行走。图像重建在通信领域也得到重要的应用,例如,利用图像重建技术获得非常直观的无线电场强的三维空间分布图像;通过极高压缩比的人脸图像传输用图像重建技术可在接收端恢复原始人脸图像。6