应用背景
视觉在人类生活中起着非常重要的作用,每天人们都通过眼睛采集大量的信息,这些信息经过大脑的处理,成为人们认知和理解世界的基础。科学证明,人类从外部世界得到的总信息的来自于视觉系统。计算机视觉技术对移动机器人来说同样至关重要,通过视觉采集环境的信息是机器人感知外部环境的最主要、最直接的手段。近几年来,由于计算机图像处理能力和技术的飞速发展以及大量的数字图像处理设备性能价格比的提高,视觉传感器在移动机器人环境识别、导航、路径规划等领域中的应用越来越受到研究者的重视,并表现出很好的发展前景。因此,利用视觉传感器作为主要的环境识别手段来实现环境识别,并进行导航、路径规划等方面的应用有着很重要的应用价值。
应用技术视觉系统为移动机器人提供了大量的信息,而图像作为视觉感知环境所获得信息量的客观表现,对图像的识别显得尤为重要。图像识别所研究的是如何根据计算机通过对图像所提供的特征信息的分析将图像或图像中的一个或多个客体目标进行识别并分类。这正是对图像所表示场景信息进一步分析所要具备的基础。它研究的理论和方法在很多科学和技术领域中得到了广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。在图像理解和机器人视觉中使用了很多图像识别的概念和方法,移动机器人的环境识别与图像识别的关系尤为密切,两者相互交叉,不可分割。因此,图像模式识别技术的不断发展对图像理解和机器人视觉的发展起着重要的支持作用。
计算机视觉通过对环境信息的感知,可以实现目标识别、定位、环境地图构建、障碍检测等。其中最丰富、经济的手段是通过视觉采集环境的信息。
视觉系统的准确性与实时性直接影响到整个系统的工作状况〕。目前,计算机视觉既是工程领域、也是科学领域中的一个富有挑战性的重要研究领域,作为一门综合性的学科,它已经吸引了来自各个学科的研究者参与研究,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等。
计算机视觉是指用计算机实现人的视觉功能,是对客观世界的三维场景的感知、识别和理解。它可以定义为这样一个过程利用视觉传感器获取三维景物的二维图像,通过视觉处理算法对一幅或多幅图像进行处理、分析和解释,得到有关景物的符号描述,并为特定的任务提供有用的信息。
基于图像外观的环境识别人类能够主要使用路标进行环境识别与定位是因为其有能力快速准确地从自然环境中分割并识别路标,而对于机器视觉来说却是非常困难的。尤其是非结构化的未知环境,没有人工路标,更难以提取自然路标以什么作为自然路标等。这种情况下,直接利用景物图像的外观信息,如色彩、纹理等全局特征进行环境识别成为一种合理的方案。
在得到环境图像后,为进行学习,机器人首先由人操作或自动地在工作环境中漫游,并获取该环境的大量图像序列。然后进行手动或自动地环境分类与学习,并通常手工进行分类标记。在环境分类与学习方面主要使用的技术有多维直方图、主成分分析等方法。
基于直方图的环境表示有学者基于直方图提出一种非常实用的环境表示方法。离线学习阶段机器人首先使用全景摄像头获取环境的图像序列,对每幅图像计算HLS空间和正则化RGB空间共6个一维直方图,并用此表示环境。为更好地描述像素间的空间关系,以弥补单纯色彩直方图的缺陷,Chao Zhou等增加了纹理、边密度、梯度的直方图描述,从而构成多维直方图的图像外观描述。直方图方法是对图像的一种致密的描述,可有效地降低存储空间,而且该描述具有旋转不变性。但该方法通常都是对整幅图像的全局描述,因而随着机器人的移动,微小的前进后退或光线变化都会引起直方图的很大变化,而且采用哪些特征构成多维直方图仍然需要进一步研究。
基于PCA的环境表示PCA方法是对高维图像数据的一种有效的降维策略,在环境识别与定位方面也有很多应用。马建光等首先采用Parzen窗概率密度估计算法对经边缘提取的全向图像进行概率密度估计,再提取图像旋转不变特性,然后用PCA方法提取主成分,建立图像特征空间。为改进PCA方法需要大量样本数据进行训练的缺陷,一些研究人员提出并实现了增量式建立特征空间的方法,。每当获得新的图像信息时,首先判断该信息能否用现存的特征空间模型描述,如果不能,则将该图像的主元添加到模型中,即更新特征空间模型。但是该方法目前仍然存在特征空间维度增长快以及计算量大等缺陷。而且正如文献所述,PCA方法能够保证对高维数据的最佳描述,但不能保证最佳分类。1
基于兴趣点的环境识别兴趣点检测是一类非常有效的景物特征提取技术。在移动机器人环境识别领域可以从图像中提取兴趣点或区域统称特征表示环境。生物视觉系统的研究显示当生物体例如果蝇观察周围环境时,往往由于行为目的需求或局部景象线索如突出物体将注意力有选择地集中在某个或某些景物上,将这样的景物作为路标是自然路标选择的有益尝试。所谓“兴趣点”,广义地说是指图像中存在信号变化的点,是信息含量高、数量相对少的局部特征。目前有很多兴趣点检测方法,如各种拐点、角点检测方法、基于灰度变换的检测以及基于尺度不变特征变换检测等等。
基于角点的兴趣点检测拐点是凹圆弧与凸圆弧的平滑过渡点角点是目标边界上曲率超过一定闭值的局部极大值点。他们都能够较好地概括图像中物体的轮廓。但由于角点是比拐点更重要的特征点,因此角点受到人们普遍重视。
角点检测方法中比较著名的有Harris的角点检测方法。该方法使用图像的一阶差分,计算每个象素处的平均平方梯度矩阵,通过特征值分析给出角点响应。对于图像的旋转,灰度的变化和视点的变换,它也是一种稳定的点特征提取算子,可以定量的提取均匀而且合理的特征点。Harris算法在简单图像的特征点提取上有着广泛的应用。
基于SIFT的兴趣点检测Harris角点检测方法只能对一幅图像按照一个固定的比例提取图像中的角点,对尺度变化很敏感,不具有远近尺度不变的特性。而实际环境中,通常需要对两幅比例发生了较大变化的图像进行匹配。因此,Lowe提出正方法,将特征检测推广到多尺度空间以提高特征检测的稳定性。该方法首先在尺度空间进行特征检测,并确定关键点的位置和关键点所处的尺度, 然后使用关键点邻域梯度的主方向作为该点的方向特征,以实现算子对尺度和方向的无关性。好的稳定性。检测出特征点以后,Lowe经过复杂的处理过程得到一个128维的SIFT描述子进行特征描述。由于SIFT特征对图像的缩放、旋转、光照强度和摄像机观察视角的改变以及噪声扰动具有很好的稳定性,SIFT方法很快得到了比较广泛的采用。2
优缺点比较基于图像外观的方法只根据像素值进行计算,而无需更复杂的分析,对于计算机而言易于实现。但该方法并非完善,还存在许多问题,如全局特征不能描述图像的细节,会丢失图像的空间信息,模式分类中的特征选择问题等。
基于兴趣点的方法优点在于充分利用了图像灰度的统计特性和相关特性有效地消除由于背景或局部环境,光照等造成的局部辐射失真引起的误配准对图像的各种非本质变化如旋转、缩放和光照强度变化等不敏感配准的速度较快。但该类方法往往由于特征的不完全提取,导致配准率较低。2