介绍
目前计算机视觉领域的图像内容表示方法分为基于全局特征的图像内容表示方法和基于局部特征的图像内容表示方法。为提高图像内容表示的性能,研究者提出了大量的图像区域描述算法,其中部分描述算法是为全局特征设计的,部分是为局部特征设计的。全局特征和局部特征描述算子在本质上没有明显差别。1
一种较好的图像算子应该具备:重复性、判别性、局部不变性、富含信息、量化描述以及精确高效等特性。
种类基于分布统计的描述算子基于分布统计的描述算子使用直方图表现图像的不同外观或形状特点下面,下面为几种应用比较广泛的基于分布统计的描述算子。
1.SIFT描述算子
可以用来描述任意的归一化后的图像区域,是一个3D梯度位置方向直方图,位置被量化到4×4局部栅格,梯度角度分为8个方向,算子为4×4×8=128维。
2.GLOH (Gradient location-orientation histogram)描述算子
GLOH是SIFT描述子的一种延伸,为了增强其鲁棒性和独立性。以对数极坐标在半径方向建立三个带(6,11,15)和8个角度方向,形成17个位置带,中心带在半径方向不分块。梯度方向量化为16个带,形成272维矢量,并利用PCA降维。
3.Shape context描述算子
与SIFT描述算子相似,但是基于边缘 Shape context是一个边缘点位置和方向的3D直方图,以对数极坐标在半径方向建立三个带(6,11,15)和4个角度方向,生成36维描述子。
4.Geometric histogram描述算子
在一个区域内描述边缘分布直方图。
5.PCA-SIFT描述算子
以特征点周围39×39像素块形成3024维矢量,用PCA降维36维。
6.Spin image描述算子
是一个量化像素位置和强度的直方图 ,在5个圆环中计算10个强度带,生成50维算子。
7.Steerable filters and differential invariants
是使用与高斯卷积后的导数。
基于矩的描述算子针对于一幅图像,我们把像素的坐标看成是一个二维随机变量(X,Y),那么一幅灰度图像可以用二维灰度密度函数来表示,因此可以用矩来描述灰度图像的特征。矩和不变矩是一种常用的局部图像算子。矩特征主要表征了图像区域的几何特征,又称为几何矩, 由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。它是一处高度浓缩的图像特征。
基于滤波器的描述算子Koenderink 和 VanDoorn 提出利用"local jet"建模人类视觉系统的感应域,后来该描述方法被Schmid和Mohr用来描述图像区域。该描述算法基本思想是通过对待描述图像区域与高斯函数的各阶导数实施卷积运算而得到待描述区域的量化表示。Schaffalitzky和Zisserman利用复数滤波器进行图像表示。该描述子首先对待描述图像区域进行变换,以达到对光照和仿射具备一定的不变性,然后,在处理后的局部图像区域上使用滤波器组滤波。除了上面提到的各滤波器,还有其他很多基于滤波器的图像区域内容表示方法,如Schaffalitzky和Zisserman提出了复数滤波器图像区域描述子。这些特征对图像内容的几何形变以及一维仿射变换,都具有很好的鲁棒性。
微分算子一阶微分边缘算子,经典算子比如:Roberts(罗伯特)、Prewitt(普鲁伊特)、Sobel(索贝尔),Canny(坎尼)等,二阶微分边缘算子,LOG边缘检测算子。
1.Sobel算子
其主要用于边缘检测,在技术上它是以离散型的差分算子,用来运算图像亮度函数的梯度的近似值,缺点是Sobel算子并没有将图像的主题与背景严格地区分开来,换言之就是Sobel算子并没有基于图像灰度进行处理,由于Sobel算子并没有严格地模拟人的视觉生理特征,所以提取的图像轮廓有时并不能令人满意,算法具体实现很简单,就是3*3的两个不同方向上的模板运算,这里不再写出。
2.Robert算子
根据任一相互垂直方向上的差分都用来估计梯度,Robert算子采用对角方向相邻像素只差
3.Prewitt算子
该算子与Sobel算子类似,只是权值有所变化,但两者实现起来功能还是有差距的,据经验得知Sobel要比Prewitt更能准确检测图像边缘。
5.Canny算子
该算子功能比前面几种都要好,但是它实现起来较为麻烦,Canny算子是一个具有滤波,增强,检测的多阶段的优化算子,在进行处理前,Canny算子先利用高斯平滑滤波器来平滑图像以除去噪声,Canny分割算法采用一阶偏导的有限差分来计算梯度幅值和方向,在处理过程中,Canny算子还将经过一个非极大值抑制的过程,最后Canny算子还采用两个阈值来连接边缘。
5.Laplacian算子
拉普拉斯算子是一种二阶微分算子,若只考虑边缘点的位置而不考虑周围的灰度差时可用该算子进行检测。对于阶跃状边缘,其二阶导数在边缘点出现零交叉,并且边缘点两旁的像素的二阶导数异号。
6.LoG算子
也就是 Laplace of Gaussian function(高斯拉普拉斯函数)。常用于数字图像的边缘提取和二值化。LoG 算子源于D.Marr计算视觉理论中提出的边缘提取思想, 即首先对原始图像进行最佳平滑处理, 最大程度地抑制噪声, 再对平滑后的图像求取边缘。