简介
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。自动模式识别简单来说是指无需人为干扰,机器能自动把具体的样本归类到某一个模式,自动模式识别技术是人工智能技术重要组成部分。现在自动模式识别主要是应用机器学习中有关方法实现。
模式当人们看到某物或现象时,人们首先会收集该物体或现象的所有信息,然后将其行为特征与头脑中己有的相关信息相比较,如果找到一个相同或相似的匹配,人们就可以将该物体或现象识别出来。因此,某物体或现象的相关信息,如空间信息、时间信息等,就构成了该物体或现象的模式。广义的说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式。 Watanable 定义模式“与混沌相对立,是一个可以命名的模糊定义的实体”。比如,一个模式可以是指纹图像、手写草字、人脸、或语言符号等。“广义的说,存在于时间和空间中可观察的事物,如果我们可以区别他们是否相同或相似,都可以称之为模式”。
步骤数据获取数据获取是指利用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号(串)集合。 习惯上,称这种数值或符号(串)所组成的空间为模式空间。 这一步的关键是传感器的选取。 为了从这些数字或符号(串)中抽取出对识别有效的信息,必须进行数据处理,包括数字滤波和特征提取。
数据处理数据处理是为了消除输入数据或信息中的噪声,排除不相干的信号,只留下与被研究对象的性质和采用的识别方法密切相关的特征(如表征物体的形状、周长、面积等等)。 举例来说,在进行指纹识别时,指纹扫描设备每次输出的指纹图像会随着图像的对比度、亮度或背景等的不同而不同,有时可能还会产生变形, 而人们感兴趣的仅仅是图像中的指纹线、指纹分叉点、端点等,而不需要指纹的其它部分或背景。因此,需要采用合适的滤波算法,如基于块方图的方向滤波、二值滤波等,过滤掉指纹图像中这些不必要的部分。
特征提取特征提取是指从滤波数据中衍生出有用的信息,从许多特征中寻找出最有效的特征, 以降低后续处理过程的难度。我们对滤波后的这些特征进行必要的计算后,通过特征选择和提取形成模式的特征空间。 人类很容易获取的特征,对于机器来说就很难获取了,特征选择和提取是模式识别的一个关键问题。 一般情况下,候选特征种类越多,得到的结果应该越好。 但是,由此可能会引发维数灾害,即特征维数过高,计算机难以求解。 因此,数据处理阶段的关键是滤波算法和特征提取方法的选取。 不同的应用场合,采用的滤波算法和特征提取方法以及提取出来的特征也会不同。
分类决策或模型匹配基于数据处理生成的模式特征空间,人们就可以进行模式识别的最后一部分:模式分类或模型匹配。 该阶段最后输出的可能是对象所属的类型,也可能是模型数据库中与对象最相似的模式编号。 模式分类或描述通常是基于己经得到分类或描述的模式集合而进行的。 人们称这个模式集合为训练集,由此产生的学习策略称为监督学习。 学习也可以是非监督性学习,在此意义下产生的系统不需要提供模式类的先验知识,而是基于模式的统计规律或模式的相似性学习判断模式的类别。 模式分类或模式匹配的方法有很多,主要是基于以下思想设计的:
成员表:即模板匹配。 基于该思想,分类系统中会预先存储属于同一模式类的模式集,然后将输入的未知模式与系统中己有的模式相比较,具有相同或相似匹配的模式类即为该未知模式的所属类型。
一般特征:这里模式的一般特征被存储在一个分类系统中,当有一个未知模式进入该系统时,系统会将其一般特征与系统中现有类的一般特征相比较,并将其归入到与其有相似特征的类中。
聚类:文中笔者用实数向量来表示目标类的模式,这样,利用其聚类特性,可以轻易地将未知模式进行分类。 如果目标向量在几何位置上相距很远, 就容易确定未知模式的类别。 但是如果目标向量相距较近,或甚至有重叠,人们就需要采用比较复杂的算法来确定未知模式的类别。 最小距离分类法就是一个基于聚类概念的简单算法。 该算法通过计算未知模式与希望的己知模式集之间的距离,来决定哪一个己知模式与该未知模式最近,并最终将该未知模式归入到与其相距最短的己知模式类中。 该算法对于目标向量在几何位置上相距很远的模式分类很有效。
方法统计模式识别统计模式识别方法是受数学中的决策理论启发而产生的一种识别方法。 其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征矢量。 不同的特征向量,或者说不同类别的对象,都对应于此空间中的一点。 在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征对象的目的。 统计识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取 。
统计模式识别方法适用于在给定的有限数量样本集,已知研究对象统计模型或已知判别函数类条件下,根据一定的准则通过学习算法能够把 d 维特征空间划分为 c 个区域,每一个区域与每一类别相对应,模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。
句法结构模式识别句法识别是对统计识别方法的补充。 统计方法用数值来描述图像的特征, 句法方法则是用符号来描述图像特征的。它模仿了语言学中句法的层次结构, 采用分层描述的方法,把复杂图像分解为单层或多层的简单子图像,主要突出了识别对象的结构信息。 图像识别是从统计方法发展起来的,而句法方法扩大了识别的能力, 使其不仅限于对象物的分类,而且还用于景物的分析与物体结构的识别。句法结构模式识别主要用于文字识别、遥感图形的识别与分析、纹理图像的分析中。 该方法的特点是识别方便,能够反映模式的结构特征,能够描述模式的性质,对图像畸变的抗干扰能力较强。 如何选择机缘是本方法的一个关键问题,尤其是当存在干扰及噪声时,抽取基元更困难,且易失误1。
模糊模式识别模糊模式识别的理论基础是模糊数学。 它根据人辨识事物的思维逻辑,吸取人脑的识别特点,将计算机中常用的二值逻辑转向连续逻辑。 模糊识别的结果是用被识别对象隶属于某一类别的程度即隶属度来表示的,一个对象可以在某种程度上属于某一类别,而在另一种程度上属于另一类别。 一般常规识别方法则要求一个对象只能属于某一类别。 基于模糊集理论的识别方法有 : 最大隶属原则识别法、择近原则识别法和模糊聚类法。
伴随着各门学科,尤其是人文、社会学科及其他“软科学”的不断发展,数学化、定量化的趋势也开始在这些领域中显现。 模糊模式识别不再简单局限于自然科学的应用,同时也被应用到社会科学,特别是经济管理学科方面。
人工神经网络模式识别人工神经网络的研究起源于对生物神经系统的研究。 它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制可以模仿人的神经系统的动作过程,以达到识别分类的目的。 人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。 神经网络侧重于模拟和实现人认知过程中的感知觉过程、 形象思维、分布式记忆、自学习和自组织过程,与符号处理是一种互补的关系。 但神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习的能力,特别适用于处理需要同时考虑许多因索和条件的、不精确和模糊的信息处理问题。