图像深度是指存储每个像素所用的位数,也用于量度图像的色彩分辨率。图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位,则最大灰度数目为2的8次方,即256。一幅彩色图像RGB3个分量的像素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方,即1024,就是说像素的深度为10位,每个像素可以是1024种颜色中的一种。
概述图像深度是指每个像素可以用来表示颜色数,图像深度是用来描述图像深度信息中每个像素的灰度值或颜色数的基础。在单目图像深度估计问题中,一幅图像对应场景的深度信息一般由相同大小的灰度图来描述,灰度图中每个像素的灰度值描述该点对应场景的深度值,该灰度图又称为深度图,只有知道像素深度,才能计算出每个像素点对应深度值1。例如:一幅画的尺寸是1024*768,深度为16,则它的数据量为1.5M。
计算如下:1024*768*16bit(位)=(1024*768*16)/8Byte(字节)=[(1024*768*16)/8]/1024KB=1536KB={[(1024*768*16)/8]/1024}/1024MB=1.5MB。
国内外估计图像深度的方法图像深度估计的方法主要分为单y深度估计的方法和双目深度估计的方法,单目是基于一个镜头,而双目是基于两个镜头,基于它们有许多深度估计的方法,2下面分别给予介绍。
单目深度估计方法单目是基于一幅图像来估计它的深度信息,相对于双目深度估计的方法,-有一定的难度,许多学者提出了大量的基于单目来深度估计的方法,有基于图像内容理解,基于聚焦,基于散焦,基于明暗变化等,下面简要介绍其中的两种方法2。
(1)基于图像内容理解的深度估计方法 图像内容理解的深度估计方法主要是通过对图像中的各个景物分块进行分类,然后对每个类别的景物分别用各自适用的方法估计它们的深度信息2。
(2)描于聚焦的深度估计方法 聚焦深度测量(depth from focus, DIT)就足使摄像机相对于被测点处于聚热位货,然)根据透镜成像公式可求得被测点相对于摄像机的距离2。
(3)基于图模型的深度图估计方法是通过对图像区域提取单目视觉线索的人工特征,并利用图模型来建模特征与深度之间关系以及图像上下文之间的联系,从而恢复出深度图像。由于二维平面图像的形成是三维场景的一个投影,当给定一幅二维平面图像的时候,与它对应的三维场景可能有无数个,但并不是所有的场景都符合人类的理解,只有符合人类理解的场景,利用人类先验知识推出的三维场景才可能是正确的3。
双目深度估计方法国内外比较成熟且应用广泛的双目深度估计的方法是越于双视差的深度估计方法,它是用两个摄像头成像,因为两个摄像头之间存在一定的距离,所以同一景物通过两个镜头所成的像有一定的差别,既视差,因为视差信息的存在,可以由于来估计出景物的大体深度信息2。
双目视差的深度估计方法只有在近距离时,测量才较准确,而远距离时测量精度就难以保证。双目立体视觉成像系统通常包括相机建模、特征提取、图像匹配、深度计算以及图像插值运算,具体测量过程分为如下几步2:
从左图像中选出某些特征点2;
找出该特征点在右图像中的匹配点,般称为立体匹配2;
根据以上点对的匹配关系,计算匹配点在摄像机坐标系中的空间三维坐标2;
由于在⑶步中只能计算匹配点的二维坐标,因此其他点则需要用插值的方法来获得,实现三维重建2。
立体匹配问题始终是双目视觉测量的一个主要难点,国内外在多学者对此进行深入而持久的研究,提出了大量的匹配算法并进行了实验验证2。
有关术语灰度值在计算机领域中,灰度(Gray scale)数字图像是每个像素只有一个采样颜色的图像。这类图像通常显示为从最暗黑色到最亮的白色的灰度,尽管理论上这个采样可以任何颜色的不同深浅,甚至可以是不同亮度上的不同颜色。灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑白两种颜色,灰度图像在黑色与白色之间还有许多级的颜色深度。但是,在数字图像领域之外,“黑白图像”也表示“灰度图像”,例如灰度的照片通常叫做“黑白照片”。在一些关于数字图像的文章中单色图像等同于灰度图像,在另外一些文章中又等同于黑白图像。灰度使用黑色调表示物体,即用黑色为基准色,不同的饱和度的黑色来显示图像。 每个灰度对象都具有从 0%(白色)到100%(黑色)的亮度值。 使用黑白或灰度扫描仪生成的图像通常以灰度显示。4
使用灰度还可将彩色图稿转换为高质量黑白图稿。 在这种情况下,Adobe Illustrator 放弃原始图稿中的所有颜色信息;转换对象的灰色级别(阴影)表示原始对象的亮度。将灰度对象转换为 RGB 时,每个对象的颜色值代表对象之前的灰度值。 也可以将灰度对象转换为 CMYK 对象。4
深度图在3D计算机图形和计算机视觉中,深度图是一种图像或图像通道,其中包含与场景对象的表面到视点的距离有关的信息,用于模拟的3D形状或重建他们。深度图可以由3D扫描仪生成或从多个图像重建5。
位分辨率位分辨率(Bit Resolution)又称位深,用来衡量每个像素存储的信息位数,这个分辨率决定在图像的每个像素中存放多少信息。如一个24位的RGB图像,即表示其各原色R、G、B都使用了8位,三者之和为24位。在RGB图像中,每个像素都要记录R、G、B三原色的值,因此每个像素所存储的位数即为24位。6
位深度计算是以2为底数的指数的幂。常见的有:
1位:2种颜色,单色光,黑白二色,用于compact Macintoshes。
2位:4种颜色,CGA,用于gray-scale早期的NeXTstation及color Macintoshes。
3位:8种颜色,用于大部分早期的电脑显示器。
4位:16种颜色,用于EGA及不常见及在更高的分辨率的VGA标准,color Macintoshes。
5位:32种颜色,用于Original Amiga chipset。
6位:64种颜色,用于Original Amiga chipset。
7位:128种颜色
8位:256种颜色,用于最早期的彩色Unix工作站,低分辨率的VGA,Super VGA,AGA,color Macintoshes。
灰阶,有256种灰色(包括黑白)。若以24位模式来表示,则RGB的数值均一样,例如(200,200,200)。
彩色图像,若以24位模式来表示,则RGB的数值均一样,例如(200,200,200)。就是常说的24位真彩,约为1670万色。
9位:512种颜色
10位:1024种颜色,
12位:用于部分硅谷图形系统,Neo Geo,彩色NeXTstation及Amiga系统于HAM mode。
16位:用于部分color Macintoshes( 红色占5 个位、蓝色占 5 个位、绿色占 6 个位,所以红色、蓝色、绿色各有 32、32、64 种明暗度的变化总共可以组合出 64K 种颜色 )。
24位:有16,777,216色,真彩色,能提供比肉眼能识别更多的颜色,用于拍摄照片。
32位:基于24位而生,增加8个位的Alpha通道。
另外有高动态范围影像(High Dynamic Range Image),这种影像使用超过一般的256色阶来储存影像,通常来说每个像素会分配到32+32+32个bit来储存颜色资讯,也就是说对于每一个原色都使用一个32bit的浮点数来储存。
本词条内容贡献者为:
闫晓东 - 副教授 - 中央民族大学信息工程学院