定性视觉是1990 年 J .Aloimonos 提出的,定性视觉方法的核心是将视觉系统看成执行某一任务的更大系统的子系统,视觉系统所要获取的信息,只是完成大系统任务所必需的信息。在许多情况下,只要景物的定性或不完全描述就够了,无需如 Marr理论所要求的完整的定量描述。景物的描述与识别,也不只经历一个自下而上的单向信息处理过程,而是在自下而上与自上而下相结合的控制策略下实现的。
背景介绍上世纪80年代初马尔视觉计算理论提出后,学术界兴起了“计算机视觉”的热潮。人们想到的这种理论的一种直接应用就是给工业机器人赋予视觉能力,典型的系统就是所谓的“基于部件的系统”(parts-based system)。然而,10多年的研究,使人们认识到,尽管马尔计算视觉理论非常优美,但“鲁棒性”(Robustness)不够,很难想人们预想的那样在工业界得到广泛应用。这样,人们开始质疑这种理论的合理性,甚至提出了尖锐的批评。
对马尔计算视觉理论提出批评最多的有二点:一是认为这种三维重建过程是“纯粹自底向上的过程”(pure bottom-up process),缺乏高层反馈(top-down feedback);二是“重建”缺乏“目的性和主动性”。由于不同的用途,要求重建的精度不同,而不考虑具体任务,仅仅“盲目地重建一个适合任何任务的三维模型”似乎不合理。
对马尔视觉计算理论提出批评的代表性人物有:马里兰大学的J. Y. Aloimonos;宾夕法尼亚大学的R. Bajcsy和密西根州立大学的A. K. Jaini。 Bajcsy 认为,视觉过程必然存在人与环境的交互,提出了主动视觉的概念(active vision). Aloimonos认为视觉要有目的性,且在很多应用,不需要严格三维重建,提出了“目的和定性视觉”(purpose and qualitative vision) 的概念。 Jain 认为应该重点强调应用,提出了“应用视觉”( practicing vision)的概念。上世纪80年代末到90年代初,可以说是计算机视觉领域的“彷徨”阶段。真有点“批评之声不绝,视觉之路茫茫”之势。
基于定性视觉分析裂纹定性方法是用文字语言描述,主要凭分析者的直觉、经验,凭分析对象过去和当前的延续状况及最新信息资料,对分析对象的性质、特点和发展变化规律做出判断。分析样本,裂纹状缺陷的定性视觉特征主要包括:
(1)表现为细长线条;
(2)线条长度不确定:
(3)线条宽度不确定,但相对于长度值小得多;
(4)生长的方向不确定,但大致朝一个大方向生长;
(5)缺陷的灰度变化不定,但在线条宽度方向其中部灰度高于边缘;
(6)缺陷灰度高于所在区域的背景灰度;
(7)缺陷与背景灰度差很小:
(8)缺陷与背景存在灰度过渡区域。
裂纹缺陷的语义提取模犁如图1所示。第1步,先将上述定性视觉特征映射到中层对象语义,对裂纹缺陷包含的语义进行检测。第2步,将中层语义映射到高级语义,对整个图像样本进行理解和判断。1
本词条内容贡献者为:
王慧维 - 副研究员 - 西南大学