显微图像特征量
单个细胞的几何特征就是各连通区域的几何特征,各特征量之间存在着密切的联系和影响, 样片中各细胞的分布和统计就是图像中各连通区域的分布和统计.细胞各特征量的计算是统计与分析的基础, 而正确的判断和统计还需经过数理统计、均值聚类等进一步计算和分析而获得.各连通域的计算包括对几何特征如周长、面积、重心的运算和形态特征如圆度、矩形度、矩的应用、边缘复杂度的运算。2
各特征值的定义形态特征的计算首先涉及到细胞连通区域的标记, 区域标记是指将连在一起的同一区域像素赋上相同的标记的过程.不同细胞的连接部分赋上不同的标记.为了能更好地区分不同的细胞体, 可采用颜色差值区域标记法, 给不同的连通体赋上不同的像素值, 而且其颜色差值比较大, 这样我们就可以很清楚地区分每个独立的细胞区域.连通区域的面积通过连通区域的总像素的求和得到, 而连通区域的周长通过获得连通域的外轮廓, 然后求取累积边界的长而获得, 对于边界对角线上的点, 其长度应计为√2。
对于面积一定的图形, 一般周长越小, 圆形外轮廓表面越光滑, 越接近圆;反之, 周长越大, 则图形外轮廓表面褶皱越多, 形状也就越复杂.由此可采用圆度C 来衡量图形的复杂程度, 其最常用的计算公式如下:。其中, P 为图形周长, A 为周长所围面积。2
特征值的综合分析与统计考虑到排除图像噪音的需要, 在对细胞的几何与形态特征量的运算中, 通过对细胞特征中周长、面积、圆度、长短半轴等量的数学期望以及它们的方差的计算, 可以排除掉过小的噪声点而使有效的连通域进入进一步的计算.统计量期望的计算公式为:。其中, n 为细胞图像中细胞的个数, xn 为第n个细胞的特征量(如:周长、面积等).
根据连通域特征的定义和数学模型, 各特征量的单独计算很容易得到, 为了全面分析它们, 需综合分析这些特征量.细胞大小、细胞的圆度、细胞的长宽、细胞的矩等在不同目标判别中, 其占有的权重不同, 系统而全面的分析还可通过各特征的期望与方差, 可区分或筛选出图像中有效的连通区域.同时, 用K 一均值聚类和FCM 算法可从宏观上进一步过滤掉连通域噪声并给出更为全面准确的细胞分类和判断分析结果, 得到精确的分析统计结果。2
显微图像系统医学显微图像是进行医疗诊断的重要参考依据,也是医疗手段现代化和计算机化的重要一环.传统的医学显微图像的分析过程一般是在病人送来检样后,在光学显微镜下由检测员用肉眼观看并计数和分析,并对照显微例图样本而给出诊断结论. 这样的操作过程使得检测员的工作强度较大,对检测员的技术水平要求较高,且检测的结果是以文字方式记录下来的,不利于主治医师和住院部医师对显微图像的进一步分析.
如果采用计算机技术将显微图像以数字图象的方式摄入和记录下来就将大大提高这个医疗信息的使用效益. 由于检测员在大屏幕上观测显微图像,工作强度将大大减少. 同时,显微图像将被打印在诊断报告单上,为其他医师和病人家属提供一个作进一步分析的图像样本,这也是医院医疗信息网上的共享资源,这还是基于Internet的远距离医疗诊断系统的一部分. 由于计算机上已储存有标准的显微例图样本,检测员可在计算机上对照被测图例而进行分析判别. 同时在软件系统上增加DNS和其它医疗显微图像的分析判断模块,系统将提供更为可靠和快捷的分析结果.3
构成医学显微图像处理系统的构成如图所示。
病历录入和改写模块可输入和编辑病人的基本医疗情况,病历查询模块可方便查询和编辑其诊断图像信息,图像摄入模块将光学图像变为数字化图像,诊断报告打印模块将打印有显微图像的诊断报告,图像标注模块为在图像上写字和标记图像的特征区域提供工具,图像对比分析模块为所检测的图像与样本图像的比较和分析提供对比和分析的环境.从系统构成的框图上可知,系统的各基本模块是可相互调用的,软件系统的使用者可在可视化环境中用鼠标方便地完成各种操作。3
应用与发展前景显微图像处理系统主要应用了图像对象与数据库的关联技术和面想对象的编程方法,通过系统的实际运行检验,表明系统的软件框架设计合理,为高效准确地提供显微图像诊断结果和医疗信息计算机化提供了一个良好的操纵平台,我们将添加更多的医疗图像种类的分析模块.同时,该系统可拓广到CT、X光透视图像的管理及无损医学检验中.3
显微图像拼接图像拼接的主要问题是处理相邻两个图像样本之间的重叠部分。图像拼接的质量主要依赖图像的对准程度,通常的匹配算法是基于两图像重叠部分的对应像素在RGB或CMY颜色系统中的灰度相似性。
目前已提出一种基于网格匹配的快速匹配算法,其基本思路是利用图像中相邻像素的灰度值相差不大的特点,在第二幅图像的重叠区域取一个网格,然后将网格在第一幅图像上移动,计算所有网格点的两幅图像对应点的RGB值的差的平方和。记录最小的值的网格位置,即认为是最佳匹配位置。并且将匹配分为粗细两个步骤,可明显减少计算量。
图像拼接技术目前主要应用于全景视频系统和地理信息系统中,实现若干幅部分重叠的小图像拼接成一幅大的图像,以得到全景信息。在显微图像的研究中,同样地存在类似的图像拼接问题。智能化铁谱诊断系统是一个典型的显微图像应用领域4,其基本思想是通过对显微图像中的机械磨损颗粒图像进行识别以进行机械磨损故障分析。在低的物镜放大倍数下(如× 4、× 10) ,磨粒的整体形貌在同一现场中基本上能得到完整显示,但在高放大倍数下(如× 40、× 60) ,在一个视场中往往不能完整显示一个尺寸较大的磨粒,所以经常出现磨粒被截断的现象,从而导致后续磨粒识别的困难。5
模板匹配拼接模板匹配又称为基于块kuai匹配的算法,是一种最常用的图像匹配算法。在模板匹配中使匹配的两个表达都是图像。对图像的匹配可以是整幅图像和整幅图像间的匹配,也可以是图像间的一部分(子图像)间的匹配,显然图像拼接中的模板匹配是在第二幅图像中建立模板,在第一幅图像中去寻找与模板最相似的图像区域,从而以确定图像的重叠区域,最终实现图像拼接。匹配中的主要工作是将模板在图上平移并计算相关,相关值最大处即为匹配最好处。5
多分辨率匹配又称基于金字塔数据结构的多分辨率匹配。在模板匹配中,如果模板的尺寸选取过大,虽能保证足够的精度,但匹配的速度将大大降低; 如果模板的尺寸选取过小,虽能有效地提高计算速度,但匹配的精度又将明显降低。
一种减少匹配搜索时间的有效方法是用图像的金字塔式数据结构,按先粗后细的顺序寻找匹配位置。其基本思路是先对图像中2× 2领域内的像点灰度值取平均,得到分辨率低一级的图像。照此原理,可得到一组呈金字塔式的图像。当把待匹配的两幅都作此预处理后,匹配搜索从二图的某一低分辨率的开始。这里不但像点数目少,高频信息也平滑掉一部分。因此粗匹配结果可能出现不只一个匹配位置。因为图中点数少,即使粗匹配是在全部参考点上进行,搜索过程仍很快。接下去转到高一级分辨率的图上找匹配,但搜索空间只限于一个或几个粗匹配点附近,计算量不大。第三次找匹配同第二次的。仿此下去,直到在k= 0的一级即原图像上找出二图的匹配点为止。
将基于图像金字塔数据结构的多分辨率匹配技术运用于图像拼接需要注意以下几点:
( 1)图像的金字塔数据结构层数并不是越多越好,它必定存在一个最佳值。一般以最顶层图像数据长和宽不少于200个像素较合适。
( 2)由于图像的金字塔数据结构顶层的图像分辨率低,匹配精度不高,所以顶层的最佳匹配点并不一定是真正的最佳点,如果只在顶层寻找一个最佳的匹配点,然后在逐层向下以顶层的匹配点为依据进行搜索,这样误匹配的概率必将大大增加。解决的方法是在顶层以相关系数值的大小为依据,从大到小寻找多个匹配点,然后以该多个粗匹配点为基础逐层向下搜索,这样匹配的可靠性将大为提高,因此粗匹配点的选取数目也需要认真考虑。一般取5~ 10个点。
( 3)由于基于块匹配的图像拼接算法对图像灰度的依赖性很大,所以不同质量的图像匹配的难易程度不同,对于图像清晰,对比度强,图像中景物很多的图像,显然匹配容易,此时要求图像重叠区域要少些,模板也可小些; 而对于图像模糊,对比度差,尤其是图像中景物很少的图像,拼接将变得很困难,有时甚至会失败,此时要求图像的重叠应多些,匹配的模板也要大些。所以在对具体图像进行拼接时,图像的重叠区域大小及匹配模板的大小均需仔细考虑。一般要求图像重叠区域在1 /2幅图像宽左右。5
无缝拼接当找到两幅待拼接图像的最佳匹配点后,下一步工作就是将两幅图像合成一幅图像, 如果对于重叠部分只是简单的取重叠区域中第一幅图像或第二幅图像数据, 将会造成图像的模糊和明显的连接痕迹,这是图像拼接所不能容忍的, 它同样会影响到后续的图像分割和识别, 即使取两幅图像重叠区的平均值,效果也不能令人满意。因此为了能使拼接区域平滑,目前广泛采用渐入渐出的方法,即在重叠部分由第一幅图像慢慢过渡到第二幅图像。这样便可实现图像的无缝拼接。两幅图像的左右方向拼接示意图如图所示.5