[科普中国]-对象图像分割-

简介

对象图像分割是指对研究对象的图像数据进行图像分割。不同的领域，图像的内容是不同，所以要采用图像分割方法一般是不同。但主要目的是相同的即采用有关图像分割方法分割出图像重要的区域特征，用于分析。很多领域都属于对象图像分割，例如遥感气象服务，医学影像分析，军事研究领域、交通图像分析、图像压缩、图像检索等。

图像分割图像分割即将图像分成具有各自特性的同质区域并提取出感兴趣目标物体的技术和过程，它是图像处理到图像分析的关键步骤，是图像处理和机器人视觉领域的基本问题之一。图论是应用数学的一个分支，主要以图为研究对象，与图像之间有很好的映射关系，近年来使用图论中许多成熟的理论和数学工具进行图像分割已成为图像分割领域研究的热点。其主要思想是将待分割图像映射为加权图，图像的像素构成图的顶点集，其特征信息(灰度、颜色等)对应每个顶点的属性，像素之间的相邻关系对应图的边集，边的权值对应像素之间的相似性或差异性。将图像映射为图后，图像分割过程可以看作是根据像素的特征信息，对每一个像素分配标记的过程，相同特性的像素具有相同的标记，不同特性的像素具有不同的标记。图像分割的结果是图像上子区域的集合（这些子区域的全体覆盖了整个图像），或是从图像中提取的轮廓线的集合（例如边缘检测）。一个子区域中的每个像素在某种特性的度量下或是由计算得出的特性都是相似的，例如颜色、亮度、纹理。邻接区域在某种特性的度量下有很大的不同1。

对象图像分割两种策略1) 根据图像灰度值的相似性或同质性将图像划分为区域，目标物体通过部分区域的合并产生，例如阈值法、聚类法、区域分离以及区域融合等。

2) 根据图像灰度值的不连续性和突变性寻找目标物体或其轮廓的位置，根据该位置进行空间上的延伸，即通过检测图像的特征点、线、面进行图像分割，例如边缘检测法。

聚类方法K-均值聚类法是一种将图像分割成K个聚类的迭代技术。基本算法如下：

首先从n个数据对象任意选择 k 个对象作为初始聚类中心；

对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；

然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；

重复第2和3步骤，直至收敛（聚类不再发生变化）。

这里，距离指像素与聚类中心之间绝对偏差或偏差的平方。偏差通常用像素颜色、亮度、纹理、位置，或它们的加权组合。K值可以手动选取、随机选取、或其它方式得到。此算法保证收敛，但它可能不会返回最佳的解决方案。该解决方案的质量取决于最初的一组集群和K值。

基于区域的图像分割方法基于区域的分割方法是以直接寻找区域为基础的分割技术，具体算法有区域生长和区域分离与合并算法。基于区域提取方法有两种基本形式：一种是区域生长，从单个像素出发，逐步合并以形成所需要的分割区域；另一种是从全局出发，逐步切割至所需的分割区域。在实际中使用的通常是这两种基本形式的结合。该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识不足的图像分割，效果较理想。

基于边缘的图像分割方法基于边缘检测的分割方法试图通过检测不同区域的边缘来解决问题，通常不同的区域之间的边缘上灰度值的变化往往比较大，这是边缘检测方法得以实现的主要假设之一。它的基本思想是先检测图像中的边缘点，再按一定策略连接成轮廓，从而构成分割区域。其难点在于边缘检测时抗噪性和检测精度的矛盾，若提高检测精度则噪声产生的伪边缘会导致不合理的轮廓；若提高抗噪性则会产生轮廓漏检和位置偏差。边缘与区域相结合的图像分割方法。边缘检测能够获得灰度值的局部变化强度，而区域分割能够检测特征的相似性与均匀性。边缘与区域相结合分割的主要思想是结合二者的优点，通过边缘点的限制，避免区域的过分割；同时，通过区域分割补充漏检的边缘，使轮廓更加完整2。

基于图论的图像分割方法基于图论的图像分割技术是近年来国际上图像分割领域的一个新的研究热点。该方法将图像映射为带权无向图，把像素视作节点，利用最小剪切准则得到图像的最佳分割。该方法本质上将图像分割问题转化为最优化问题，是一种点对聚类方法，对数据聚类也具有很好的应用前景。目前，基于图论的图像分割方法的研究主要集中在以下几个方面：( 1)最优剪切准则的设计；( 2)谱方法用于分割；( 3)快速算法的设计等。基于图论的图像分割方法的基本原理如下：令 G=( V, E)表示一个无向图 , 其中节点 v i ∈ V 表示图像像素，边( v i ,v j ) ∈ E 连接节点v i 和 v j 。每条边有一个相应的非负权重 w( v i ,v j ),表示相邻节点 v i 和 v j 的不相似度。在图像分割中，边的权重表示两个像素间的不相似性度量，如灰度、颜色、运动、位置或其它局部分布的差别。

基于神经网络的图像分割方法20 世纪 80 年代后期，受到人工智能发展的影响 ,出现了基于神经网络的的图像分割技术。利用神经网络进行图像分割，其基本思想是用训练样本集对神经网络进行训练以确定节点间的连接权值，再用训练好的神经网络对新输入的图像数据进行分割。由于神经网络具有可并行计算、自学习等和便于硬件实现等特性，所以它比传统方法有更大的潜力，其理论及应用探讨引起了学术界学者的重视，并提出了基于各种神经网络模型的图像分割方法。根据相应类型的图像，可以选用Hopfield 神经网络、BP 神经网络、振子神经网络、细胞神经网络、概率自适应神经网络、自组织神经网络、脉冲耦合神经网络、径向基神经网络和 Kohonen 神经网络等。其中 ,基于脉冲耦合神经网络( Pulse Coupled Neural Network ,PCNN) 的图像分割方法成为近年来的关注热点。

图像语义分割方法聚类方法可以将图像分割成大小均匀、紧凑度合适的超像素块，为后续的处理任务提供基础。但在实际场景的图片中，一些物体的结构比较复杂，内部差异性较大，仅利用像素点的颜色、亮度、纹理等较低层次的内容信息不足以生成好的分割效果，容易产生错误的分割。因此，需要更多地结合图像提供的中高层内容信息辅助图像分割，称为图像语义分割。语义分割的概念最早由 Ohta 等人于 1978 年提出，其定义为：为图像中每个像素分配一个预先定义的表示其语义目标类别的标签。语义分割的方法分为两种：一种是自顶向下 (top-down) 的方法，即，使用物体形状模型在待分割图像中做匹配搜索，由于每种物体的形状可变性非常大，这种方法的效果和适应性不佳；另一种是自底向上 (bottom-up) 的方法，这类方法无需物体形状的先验知识，首先从图中生成区域假设 (region hypotheses) 或候选区域 (region candidates)，然后对候选区域进行分类打分并预测。这种方法的主要问题是缺乏能够生成高质量候选区域的算法，因此最初采用在物体检测中的滑动窗口方法生成候选区域 , 这种方法相当费时费力，而且无法描述不规则形状的物。2010 年，Carreira 等人提出的 CPMC(constrained parametric min-cuts) 算法能够在图像中生成高质量的候选区域。使自底向上的方法得到了长足的发展3。

发展趋势进一步提高算法的性能现有的多数图像分割算法只能针对某一类图像或者已经进行初步分类的图像库，其效率不高，也不具有通用性。为此，可以通过多种特征的融合( 原始灰度特征、梯度特征、几何空间特征、变换特征和统计特征等)和多种分割方法的结合两个方面来提高现有算法的效率和通用性。

新理论与新方法的研究新的分割方法的研究主要以自动、精确、快速、自适应和鲁棒性等几个方向作为研究目标 . 随着图像分割研究不断深入，图像分割方法将向更快速、更精确的方向发展，图像分割方法的研究需要与新理论、新工具和新技术结合起来才能有所突破和创新2。

面向专门领域的应用目前，随着图像分割在医学、遥感、电子商务、专利检索和建筑设计等领域得到了广泛应用，人们不断寻找新的理论和方法来提高图像分割的效果。随着不同学科研究人员对图像分割的日益关注，新的理论和方法会不断应用到更多领域中去。