[科普中国]-图形识别- · 科普中国网

主要内容

我们现在所处的这个时间，计算机已经广泛普及，信息技术也在以几何级的速度高速发展，图像已经成为人们日常生活中处理数字信息时不可或缺的重要载体。图像中的图形特征比较符合人类视觉的认知习惯，例如字符识别、工业零件识别、商标识别以及地图边界和海岸线识别、航空照片中景物轮廓的识别等。

目前在许多图形识别的相关研究中，图形特征描述有傅里叶算子，Freeman链码表示法，Blum图形骨架法和不变矩特征描述算子等。但由于实际应用中的较多限制，要对图像中的图形特征做出识别，除了提取出主要的图形特征，还需要提取出图像中图形的相关特征区域来提高识别的精度与准确率。

直线提取方法在计算机视觉和图像处理领域，图形的各种特征经常被用作高层处理如立体匹配、目标跟踪、物体识别等的输入信息；在航空和卫星图像中，城市道路、建筑物、水上桥梁等都具有图形的各种特征，直线检测和分析对航空和卫星图像中有特别重要的意义；直线特征在物体轮廓检测和机器人自动导航等领域也有重要应用。在过去几十年里，研究人员提出了多种图形特征提取方法，而提高直线提取的实时性一直是众多学者的努力方向。当前广泛使用的图形提取方法大致可分为两类。2

HT(Hough Transform)及其改进法HT(霍夫变换)是一种依据全局统计信息的直线提取方法，它基于图像空间点向参数空间对应位置投票累加并搜索参数空间峰值获得直线方程。HT对直线断裂、局部遮挡等缺陷不敏感，对随机噪声具有鲁棒性；但 HT 需要较大的存储空间和较长的计算时间，无法保证实时性，因而其应用受到限制。3

矢量基元组合方法矢量元组合方法可以通过图像空间中像素点的某种特定关系进行边缘连接获得矢量基元，通过某种准则合并基元得出完整直线。这种方法在一定程度上克服了 HT 计算量大、计算时间长等缺点，但其精度依赖于基元的选择情况，对基元断裂和噪声敏感，而且缺少全局性4。针对以上问题，综合以上两种方法，近年来又提出了一种既有效利用直线边缘局部特征又兼顾其全局性的直线图形快速提取算法。该算法分析了离散图像中直线轮廓的结构特征，用行基元、列基元和斜基元表示连续的边缘图像点，通过计算基元倾角对基元中心点分别进行极角约束HT，进而从变换点数量和变换角度范围两方面进行计算量控制，可显著提高信息处理速度。

图像分割方法基于熵的最优门限分割基于熵的最优门限分割方法采用最大熵原则选择阈值。这种方法的目的在于将图像的灰度直方图分成两个或多个独立的类，使得各类熵的总值最大，从信息论的角度来说就是这样选择阈值获得的信息量最大5。

基于二叉树结构聚类算法的彩色图像分割该方法首先对待分割图像采用最优阈值化方法获取R,G,B三个颜色空间的最佳阈值，然后通过构造自适用二叉树进行一次粗分割提取目标区域，最后采用C-均值聚类算法对二叉树的每个叶子结点进行精确分割提取出图形区域结构6。