版权归原作者所有,如有侵权,请联系我们

[科普中国]-二元图象

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

二元图象,也就是二值图像,是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。二值图像一般用来描述文字或者图形,其优点是占用空间少,缺点是,当表示人物,风景的图像时,二值图像只能描述其轮廓,不能描述细节1。

二元图像是每个像素只有两个可能值的数字图像。人们经常用黑白、B&W、单色图像表示二元图像,但是也可以用来表示每个像素只有一个采样值的任何图像,例如灰度图像等。

二元图象常见于防伪图象中,例如一些商标、文字以及经二元化处理的指纹等等都是二元图象。

二元图像中所有的像素只能从0和1这两个值中取,因此在MATLAB中,二值图像用一个由0和1组成的二维矩阵表示。这两个可取的值分别对应于关闭和打开,关闭表征该像素处于背景,而打开表征该像素处于前景。以这种方式来操作图像可以更容易识别出图像的结构特征。二值图像操作只返回与二值图像的形式或结构有关的信息,如果希望对其他类型的图像进行同样的操作,则首先要将其转换为二进制的图像格式,可以通过调用MATLAB提供的im2bw()来实现。二值图像经常出现在数字图像处理中作为图像掩码或者在图像分割、二值化和dithering的结果中出现。一些输入输出设备,如激光打印机、传真机、单色计算机显示器等都可以处理二值图像。

二元图像经常使用位图格式存储。

二元图像可以解释为二维整数格Z,图像变形处理领域很大程度上就是受到这个观点启发。

二元特征二元特征(又称二值化图象特征)是指仅由0,1串组成的特征向量。计算两个二元特征的汉明距离十分高效。即使是在普通PC上,两个对象之间的汉明距离也可以在几毫秒内计算,这只需要用到异或和位计数操作。即使是线性扫描,根据查询对汉明空间中的对象进行排序也可以进行得非常快。我们还知道相同长度的二元特征要比浮点数特征所需的存储要小的多。所以二元特征可以大大的减少特征存储和相似度计算的开销。简洁的二元特征表达可以很好的应用于大规模和实时视觉问题,也能使一些本来对于浮点数计算来说很繁琐的算法变得可行。

图象二元化方法哈希算法最简单的获得二元特征的方法就是对已有的图象特征进行二值化处理。典型的方法就是利用哈希算法。哈希算法的初衷是为了实现快速最近邻搜索。快速近邻搜索已经成为了许多大型计算机视觉和信息检索任务中的一个关键步骤。

利用哈希进行特征二值化时,可以看成是将输入的高维数据映射到一个低维的二进制空间。这个过程要求在量化过程中,要保持原有特征空间中的距离(无监督)或语义关系(有监督)。不同于传统的降维技术,二进制嵌入是确保快速的检索性能的关键。人们可以根据对它们汉明距离的查询,也被称为汉明排序,从而通过快速的线性扫描二进制数据对数据库中的对象进行排序。因为汉明距离计算非常快,即使是线性扫描,根据查询对汉明空间中的对象进行排序也可以进行得非常快。尤其如果输入数据的维度非常高的,哈希方法可以带来巨大的计算的节约。

直接提取图像二元特征相比对已有图像特征进行二值化,从像素层面直接提取图像二元特征能满足更高的速度要求。因为得到二元特征的过程并不像二值化已有特征那样受制于原始特征,其抽取速度更快,表达更自由。其目的都在于提高特征匹配的速度,和降低特征存储的开销。为了达到这个目的,很多方法被提出,大体上可以分为两类:一种方法是将长的特征描述变成短的,通常可以通过降维技术达到这个目的。而更剧烈的降维可以通过哈希函数获得,它可以将SIFT特征降为二元特征。这些过程需预先计算全特征以进行后续的处理。因此,它们的功效主要取决于它们原本的特征。另一个就是基于快速分类器。通过合成大量的关键点周围的小块,将特征匹配问题看作一个分类问题,每一类都是同一个关键点周围生成的小块的集合。这些小块被用来训练分类器。但是,他们通常都需要消耗大量的内存,且不能提供关键点的姿态信息。为了解决以上方法的问题,人们直接从图像中提取二元特征。例如通过随机采样像素值而进行比较大小关系得到二元码,通过无监督学习得到合理的二元表达2。

二元图象的防伪加密人们为实现防伪的目的,需要将信息经某种变换由一种可以直接读取的形式,转变为另一种不可以直接读取的形式,这一过程称为信息的加密过程。在密钥已知的情况下,可以根据密钥,对加密后的信息实施与加密过程
相反的操作,将原信息恢复出来,这一过程称为信息的解密过程。解密过程所必需的密钥既可以是具体的,如一组数据,也可以是抽象的,例如它描述了一种操作方法,或者一个映射函数等等。采用何种变换形式即采用何种加密方法,以及密钥的选取直接关系到加密后信息的安全程度。在光学加密中,被加密的信息一般是以图像的形式进行存储的。一种以相息图(kinoform)作为加密后的图像的载体的特殊情况,即,将图像加密为一个仅相位分布的相息图。其中要加密的图像经过一个处理器,变换为另一个不可直接读取的相息图。在这一变换过程的同时,也确定了一个密钥,用于将图像从相息图中恢复出来。虽然加密后的相息图含有原图像的信息,但并不能直接显示原图像,只有在密钥的参与下,通过处理器进行逆变换,才能将原图像恢复出来,即实现了图像的解密3。

相息图作为光学加密图像的载体—相息图,可以认为是最早的二元光学元件。它是一种特殊的计算全息(CGH)元件。它是在假设记录平面上光波振幅函数为常数的条件下,仅记录波前相位信息的元件。相息图的最大优点是同轴再现、衍射效率高。在理想情况下,相息图可把全部入射光用于图像的再现,故理想情况下衍射效率可达到l 0 0%。正因为如此,将图像加密成一个仅相位分布的相息图是很有吸引力的。而且,特别是对于广泛使用的图像复制仪器,如CCD,扫描仪等,由于其对相位不敏感,因而很难对仅相位的相息图进行识别和复制。因而,相息图用于光学加密有很高的安全性。需要说明的是,所有的相息图只能是通过计算机产生的。

基于相息图的光学加密防伪相息图能够实现防伪加密功能,其原因主要在于:

1.相息图是仅相位元件,而CCD等强度敏感元件不能探测相位信息,因而将图像加密成相息图后,有很好的防复制特性。

2.相息图的相位分布与照明光波长强烈相关。对于某一特定波长设计的相息图,当照明波长与设计波长不同时,会改变相息图的相位,从而不能再现其中的图像。

3.对于付氏变换相息图,其再现像成在夫琅和费区,而不是在空域成像。因而简单的对相息图的照明并不能实现图像的荐现。

4.可以对相息图进行随机相位编码,迸一步增加其保密性。

基于以上各点,应用相息图的图像加密可以有以下几种方式:

1)由图像到相息图的简单变换

将一幅要加密的图像利用GS算法变换成相息图,就是实现了这幅图像的加密。我们把这种相息图称为简单变换相息图。如果用波长为相息图的设计波长的相干光对相息图进行照明,则在它的付氏谱空间就的到了原图像,即实现了图像的解密。可以认为,在这种加密/解密方式下,相干光的波长以及“用相干光照明”这样一种操作是图像解密的密钥。

2)简单变换相息图的二次随机相位加密

很显然,上述加密方法的安全性还是有限的。因此有人在简单变换相息图的基础上,引入了一个随机相位因予,即先将图像变换成简单变换相息图,然后在这个相息图上加上一个预先设定的随机相位因子,转换为另一个仅相位的相息图。我们把这种加上一个随机相位因子的过程称为二次随机相位加密。在需要图像解密时,首先从加密后的相息图中去除二次加密时所附加的随机相位因子,然后用相干光照明,在频谱面上即可得到解密后的图像。在这里,预先设定的随机相位因子作为图像解密的密钥。由于该相位因子具有随机性.因而图像加密的安全性很高。

3)基于相息图迭代获得密钥的随机相位加密

与前面两种不同,本加密方法中的密钥是通过相位恢复算法迭代求得的。其加密过程如下;将图像与一个
预先设定的随机相位因子相乘,然后作付氏变换,并在谱面上再乘以一个特定的相位因子,然后再作逆付氏变换,得到相息图。在谱面上所乘的相位因子就是解密的密钥,它是通过相位恢复算法求出的。其鳃密过程则是,将相息图作付氏变换,在谱面上与密钥的复共轭相乘,然后再作逆付氏变换,即可将图像解密。与前面所说的两种情况不同之处还在于,在图像解密过程中,解密后的图像是在像空间成像,而不像前面的两种加密方法中,解密后的图像都是在谱空间成像。由于本方法中也包含一个随机相位因子,并且密钥的表达与这个随机相位因子又直接相关,因而本方法也有很高的安全性3。