版权归原作者所有,如有侵权,请联系我们

[科普中国]-主动外观模型

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

概述

图像分割是由图像处理进入图像分析的关键步骤。图像在分割后处理,如特征处理、目标识别等都依赖于图像的分割质量,因此具有十分重要的意义。目前,研究图像分割的算法可谓多种多样,如基于边缘的分割方法、基于区域的分割方法、结合边缘和区域的分割方法和基于模型的分割方法等1。

基于主动外观模型AAM的图像分割方法,利用PCA方法得到的平均模型不仅包括形状轮廓模型,还包括纹理轮廓模型,这样使得分割过程让人觉得更加可信。除此以外,更加重要的是在图像分割的运用中,通常精确度具有很强的说服力,例如对于某些情况下,精确度不够有可能导致误诊:用图像分割来测试某人的心脏或其它器官是否正常,通常极小的偏差都可能会导致医生的误诊,因此这时候AAM(主动外观模型)就突出了它的优势。

所谓的AAM算法就是基于主动外观模型的图像分割算法,该方法可以分为两大部分,第一部分是训练部分,即构造一个事物的主动外观模型,这部分需要一个训练集,它的作用是让程序记住需要切割的图像的形状特征和外观特征;第二部分是图像分割阶段,这个部分是将刚才的训练集收集的关于该事物的特征在需要分割的图像里面寻找,找到与训练集相似的物体图像的轮廓和外观,然后将其从整幅的图像中分割出来。这种算法在训练集收集事物特征时,不仅要收集事物的轮廓特征,也要收集事物的外观特征,即物体表面的颜色灰度分布和纹理特征等。主动外观模型能够有效组合目标的外观信息和轮廓信息,可以取得较好的图像分割效果。

AAM的算法原理该方法的基本思想是用一条由n个控制点组成的连续闭合曲线作为snake模型,再用一个能量函数作为匹配度的评价函数,首先将模型设定在目标对象预估位置的周围,再通过不断迭代使能量函数最小化,当内外能量达到平衡时即得到目标对象的边界与特征。

主动外观模型的构造主动外观模型算法中的取点对整个实验具有很大的作用,好的取点可以使实验误差更小,因此在取点的过程中,必须遵守以下原则:在高曲率或转折点的地方用关键点进行标记,在平滑的地方用蓝色点(实验中这样定义)进行描述,目的是更好地标记边界,并且还会在两个关键点之间等距的插入若干个点,使得标记更加详尽。

事物的轮廓,即事物的形状模型,在该实验中,事物的形状轮廓是由取点得到的矩阵来描述的,例如,该实验中是二维图形,然后取点为n个,因此此时就会有2n个元素,先将该向量矩阵设为x,即得到表示形状轮廓的矩阵为:

设该训练集中有s个训练样本,即可得到该训练集有s个xi向量矩阵。

事物的纹理是指一幅图中的颜色和光强度,在一个主动外观模型的构造过程中,需要用点矩阵将训练集里的图形更加具体的描绘出来。这些点矩阵不仅要包括事物的轮廓,也要包括事物的纹理,即:

其中x指的是模型的轮廓,指的是图形的平均轮廓,g指的是模型的纹理,指的是图形的平均纹理,Qx和Qg代表了训练集里描述图像的点协方差特征向量组成的矩阵,c指的是控制物体形状和纹理的参数。

主动外观模型的训练完成主动外观模型的构造后,需对这些点进行处理从而建立一个主动外观模型,因此先要将这些数据建立成一个训练集,它的作用在于使计算机知道所要分割的图像是什么。在训练中运用梯度下降法、PCA(主分量分析)以及金字塔这些数学模型,其中图像金字塔模型是研究创新点。原理是以多分辨率来解释图像的一种有效且概念简单的结构,它是由一系列以金字塔形状排列的分辨率逐渐下降的图像集合。如图,它的底部是待处理的图像的高分辨率模型,然后随着向金字塔上层移动,模型的尺寸和分辨率逐渐降低,从而得到不同分辨率的模型。对于数字图像,假如底部的分辨率为1,则通过数据的提取和重新组合,分别得到1/2、1/4、1/8等分辨率的模型,这些分辨率的模型组成的图像即是金字塔模型。

主动外观模型算法其实就是利用模型的形状特征和外观特征来对图像进行还原或者是分割以及边界检测。主动外观模型的训练步骤如下:

收集大量的实验训练样本,对样本进行取点,然后利用PCA方法找出样本中最能表现特征的数据,从而建立描述形状的控制点的运动模型。

运用金字塔原理从平均模型中得到不同分辨率下的平均模型,同时运用梯度下降法对平均模型进行多次拟合以达到最优化处理。

通过以上的处理,就会得到相对比较理想的训练集平均模型(如果训练集样本足够庞大的话)。用该模型对新的图形进行分割,这里同样需要调整位置、尺度和外观分布等参数,调整过程利用到梯度下降法,从而得到最接近原图像本身的形状和纹理,即得到最优化的模型。

综上所述,主动外观模型就是图像分割时所运用的算法之一。且其可作为图像分割的较优算法主要在于它能够更好的体现和表示出事物的本身,因为在图像分割的拟合阶段,训练集得到的模型不仅会得到该事物的基本形状的信息,同时还会得到它的外观信息,这样做的结果使得训练集模型在测试模型拟合过程中对噪声等具有更强的抗干扰能力,因此虽然付出了时间的代价,但相对与ASM(主动形状模型)算法而言,可以获得较好的分割结果。

AMM存在问题人们已经针对AMM在实际应用中存在的问题提出了很多改进方法,但这些改进对于实际中的应用仍显不足。以下是存在的问题2:

AMM釆用梯度下降法寻找最优解,从初始值开始沿着梯度减小的方向,迭代进行,直至找到极值,由于可能存在局部极值,初始值对这类方法有很大影响,好的初始值可以减少迭代次数,从而提高运算效率,并且尽可能的减少其陷入局部极值的机会。

AMM模型对于光照和姿态的变化比较敏感,在姿态变化时,若初值不理想,迭代容易陷入局部极值,使得匹配的精度下降。

由于AMM将纹理切分为三角网格后进行对齐和误差最小化,并采用全局最优的方式寻解。找到的特征点为网格的顶点,梯度下降的对象是其相邻的面片的纹理,相邻的面片数多且对应在基础形状中像素数较多的顶点其精度相比较少的顶点精度要高,而位于脸部边缘的顶点由于仅有一侧有纹理信息,精度会较低,容易向脸内部塌缩。

在AMM提取面部特征点后,如何在尽可能减少人工干预的情况下,方便快捷的向非真实感表情传递,尤其是由视频驱动的漫画风格的表情或脸谱化表情传递,是其在动画领域应用的主要研究内容。