[科普中国]-图像目标识别-

概念

图像是客观景物在人脑中形成的影像，是人类最重要的信息源，它是通过各种观测系统从客观世界中获得，具有直观性和易理解性。图像处理正显著地改变着人们的生活方式和生产手段，比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等，在这些应用中，都离不开图像处理和识别技术。图像识别是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。

图像目标识别是通过存储的信息（记忆中存储的信息）与当前的信息（当时进入感官的信息）进行比较实现对图像的识别1。前提是图像描述，描述是用数字或者符号表示图像或景物中各个目标的相关特征，甚至目标之间的关系，最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时，可以采用模板匹配模型。在某些具体的应用中，图像识别除了要给出被识别对象是什么物体外，还需要给出物体所处的位置和姿态以引导计算初工作。目前，图像识别技术已广泛应用于多个领域，如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。2随着技术的发展，出现了基于机器视觉的目标识别、基于深度学习的目标识别等，大大提高了图像识别的准确度和识别效率。

主要步骤图像预处理图像预处理需要对图像进行平移、旋转和缩放等几何规范，使得图像识别能够快速、准确。同时，图像滤波的主要目的是在保持图像特征的状态下进行噪声消除，其可分为线性滤波和非线性滤波。与线性滤波相比，非线性滤波能够在去噪的同时保护图像细节，是目前图像滤波方法中研究的热点。非线性滤波中具有代表性的是卡尔曼滤波和粒子滤波。

图像分割图像分割是实现机器视觉图像自动识别与分析的重要问题，其分割质量对后续图像的分析具有重要影响。快速、精确地将特征目标从复杂的图像中分割出来一直是国内外学者的研究重点。图像分割可采用 3 种途径，即区域分割、边界分割和边界形成分割。

特征提取作为机器视觉图像目标识别的一个中间节点，特征提取对目标识别的精度和速度具有重要影响。从复杂的图像信息中提取有用的特征，对实现机器视觉的目标识别起到决定性的作用。根据不同分类方法，可将图像特征分为多种类型，例如可根据区域大小分为全局特征和局部特征，根据统计特征分为矩特征、轮廓特征及纹理特征等。与全局特征相比，用局部特征在复杂的背景下对图像目标进行描述非常高效，常用的检测方法有稀疏选取、密集选取和其他方法选取。从现有的研究成果来看，这3 类方法都有一定的不足——对图像目标背景依赖性大，因此，采用多种描述子进行机器视觉的图像目标识别是一种发展趋势。

对于图像特征提取，不同的描述子不断被提出，其中，GLOH（Gradient location orientation histograms）和 SIFT（Scaleinvariant feature transform）描述子性能稳定，应用较为广泛；SURF（Speeded-up robust features）描述子在图像目标特征明显时能够快速识别，应用效果较好。除此之外，不变矩和导向滤波器在低维描述子中表现较好。3

主要识别技术指纹识别指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段，主要应用于身份验证。指纹识别是生物特征的一个部分，它具有不变性：一个人的指纹是终身不变的；唯一性：几乎没有两个完全相同的指纹1。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前，指纹识别技术与我们的现实生活紧密相关，如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

人脸识别目前大多数人脸识别系统使用可见光或红外图像进行人脸识别，可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下，其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响，但由于红外线不能穿透玻璃，如果待识别的对象戴有眼镜，那么在图像识别时，眼部信息全部丢失，将严重影响人脸识别的性能4。

文字识别文字识别是将模式识别、文字处理、人工智能集与一体的新技术，可以自动地把文字和其他信息分离出来，通过智能识别后输入计算机，用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档，如银行票据、文稿、各类公式和符号等自动录入，可以提供文字的处理效率，有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络5。由于文字的数量庞大、结构复杂、字体字形变化多样，使得文字识别技术的研究遇到一定的阻碍。

[科普中国]-图像目标识别

微信扫一扫：分享