版权归原作者所有,如有侵权,请联系我们

[科普中国]-图像分区

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

图像分区是一种图像处理技术。图像区域分割的目的是从图像中划分出某个物体的区域,即找出那些对应于物体或物体表面的像元集合,它们表现为二维的团块状,这是区域基本形状特点之一。

定义图像分区就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。

分类现有的图像分区方法主要分以下几类:基于阈值的分区方法、基于区域的分区方法、基于边缘的分区方法以及基于特定理论的分区方法等。

从数学角度来看,图像分区是将数字图像划分成互不相交的区域的过程。图像分区的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。1

简介数字图像处理技术是一个跨学科的领域。随着计算机科学技术的不断发展,图像处理和分析逐渐形成了自己的科学体系,新的处理方法层出不穷,尽管其发展历史不长,但却引起各方面人士的广泛关注。首先,视觉是人类最重要的感知手段,图像又是视觉的基础,因此,数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。其次,图像处理在军事、遥感、气象等大型应用中有不断增长的需求。

1998年以来,人工神经网络识别技术已经引起了广泛的关注,并且应用于图像分区。基于神经网络的分区方法的基本思想是通过训练多层感知机来得到线性决策函数,然后用决策函数对像素进行分类来达到分区的目的。这种方法需要大量的训练数据。神经网络存在巨量的连接,容易引入空间信息,能较好地解决图像中的噪声和不均匀问题。选择何种网络结构是这种方法要解决的主要问题。

图像分区是图像识别和计算机视觉至关重要的预处理。没有正确的分区就不可能有正确的识别。但是,进行分区仅有的依据是图像中像素的亮度及颜色,由计算机自动处理分区时,将会遇到各种困难。例如,光照不均匀、噪声的影响、图像中存在不清晰的部分,以及阴影等,常常发生分区错误。因此图像分区是需要进一步研究的技术。人们希望引入一些人为的知识导向和人工智能的方法,用于纠正某些分区中的错误,是很有前途的方法,但是这又增加了解决问题的复杂性。

在通信领域中,图像分区技术对可视电话等活动图像的传输很重要,需要把图像中活动部分与静止的背景分开,还要把活动部分中位移量不同的区域分开,对不同运动量的区域用不同的编码传输,以降低传输所需的码率。

分区方法阈值分区灰度阈值分区法2是一种最常用的并行区域技术,它是图像分区中应用数量最多的一类。阈值分区方法实际上是输入图像f到输出图像g的如下变换:

其中,T为阈值,对于物体的图像元素g(i,j)=1,对于背景的图像元素g(i,j)=0。

由此可见,阈值分区算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分区开来。阈值确定后,将阈值与像素点的灰度值逐个进行比较,而且像素分区可对各像素并行地进行,分区的结果直接给出图像区域。

阈值分区的优点是计算简单、运算效率较高、速度快。在重视运算效率的应用场合(如用于硬件实现),它得到了广泛应用。

人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等等。

全局阈值是指整幅图像使用同一个阈值做分区处理,适用于背景和前景有明显对比的图像。它是根据整幅图像确定的:T=T(f)。但是这种方法只考虑像素本身的灰度值,一般不考虑空间特征,因而对噪声很敏感。常用的全局阈值选取方法有利用图像灰度直方图的峰谷法、最小误差法、最大类间方差法、最大熵自动阈值法以及其它一些方法。

在许多情况下,物体和背景的对比度在图像中的各处不是一样的,这时很难用一个统一的阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阈值进行分区。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的邻域范围选择每点处的阈值,进行图像分区。这时的阈值为自适应阈值。

阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值,例如当直方图明显呈现双峰情况时,可以选择两个峰值的中点作为最佳阈值。

区域分区区域生长和分裂合并法是两种典型的串行区域技术,其分区过程后续步骤的处理要根据前面步骤的结果进行判断而确定。

区域生长:

区域生长的基本思想是将具有相似性质的像素集合起来构成区域。具体先对每个需要分区的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素(根据某种事先确定的生长或相似准则来判定)合并到种子像素所在的区域中。将这些新像素当作新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来。这样一个区域就长成了。

区域生长需要选择一组能正确代表所需区域的种子像素,确定在生长过程中的相似性准则,制定让生长停止的条件或准则。相似性准则可以是灰度级、彩色、纹理、梯度等特性。选取的种子像素可以是单个像素,也可以是包含若干个像素的小区域。大部分区域生长准则使用图像的局部性质。生长准则可根据不同原则制定,而使用不同的生长准则会影响区域生长的过程。

区域生长法的优点是计算简单,对于较均匀的连通目标有较好的分区效果。它的缺点是需要人为确定种子点,对噪声敏感,可能导致区域内有空洞。另外,它是一种串行算法,当目标较大时,分区速度较慢,因此在设计算法时,要尽量提高效率。

区域分裂合并:

区域生长是从某个或者某些像素点出发,最后得到整个区域,进而实现目标提取。分裂合并差不多是区域生长的逆过程:从整个图像出发,不断分裂得到各个子区域,然后再把前景区域合并,实现目标提取。分裂合并的假设是对于一幅图像,前景区域由一些相互连通的像素组成的,因此,如果把一幅图像分裂到像素级,那么就可以判定该像素是否为前景像素。当所有像素点或者子区域完成判断以后,把前景区域或者像素合并就可得到前景目标。

在这类方法中,最常用的方法是四叉树分解法(如图3所示)。设R代表整个正方形图像区域,P代表逻辑谓词。基本分裂合并算法步骤如下:

(1)对任一个区域,如果H(Ri)=FALSE就将其分裂成不重叠的四等份;

(2)对相邻的两个区域Ri和Rj,它们也可以大小不同(即不在同一层),如果条件H(Ri∪Rj)=TRUE满足,就将它们合并起来。

(3)如果进一步的分裂或合并都不可能,则结束。

分裂合并法的关键是分裂合并准则的设计。这种方法对复杂图像的分区效果较好,但算法较复杂,计算量大,分裂还可能破坏区域的边界。

边缘分区图像分区的一种重要途径是通过边缘检测,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种不连续性称为边缘。不同的图像灰度不同,边界处一般有明显的边缘,利用此特征可以分区图像。

图像中边缘处像素的灰度值不连续,这种不连续性可通过求导数来检测到。对于阶跃状边缘,其位置对应一阶导数的极值点,对应二阶导数的过零点(零交叉点)。因此常用微分算子进行边缘检测。常用的一阶微分算子有Roberts算子、Prewitt算子和Sobel算子,二阶微分算子有Laplace算子和Kirsh算子等。在实际中各种微分算子常用小区域模板来表示,微分运算是利用模板和图像卷积来实现。这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。

由于边缘和噪声都是灰度不连续点,在频域均为高频分量,直接采用微分运算难以克服噪声的影响。因此用微分算子检测边缘前要对图像进行平滑滤波。LoG算子和Canny算子是具有平滑功能的二阶和一阶微分算子,边缘检测效果较好,如图4所示。其中loG算子是采用Laplacian算子求高斯函数的二阶导数,Canny算子是高斯函数的一阶导数,它在噪声抑制和边缘检测之间取得了较好的平衡3。

展望对图像分区算法的研究已有几十年的历史,借助各种理论已提出了上千种各种类型的分区算法。尽管人们在图像分区方面做了许多研究工作。但由于尚无通用分区理论,因此现已提出的分区算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分区算法。但是可以看出,图像分区方法正朝着更快速、更精确的方向发展,通过各种新理论和新技术结合将不断取得突破和进展。

本词条内容贡献者为:

张静 - 副教授 - 西南大学