版权归原作者所有,如有侵权,请联系我们

[科普中国]-信息提取

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

在测绘学中,信息提取指的是遥感影像信息提取。所谓遥感信息提取是指从海量、不完全的、有噪声的、模糊的、随机的实际应用遥感影像数据中提取出蕴涵在其中的大量的对用户有用的信息(例如地物、植被、温度等),并将其(形成结构化的数据)放入数据库中或以其它形式提供给用户查询使用的过程。

随着航天遥感信息获取技术的飞速发展,从遥感信息中自动提取专题信息已经成为遥感信息生产流程中的瓶颈环节1。

背景遥感影像是地面对象集合的一种反映,每个对象与周围环境有着密切的内在联系,比如树、楼房等会有阴影,居民区会有房屋、街道网和植被等等;对象之间在概念上还具有一定的层次关系,比如一般植被具有绿色特性,而草地和树木除了具有植被的绿色共性外还具有自己的特性,比如具有不同的高度分布、独特的影像纹理等等;因此利用面向对象的技术对遥感影像进行信息提取更加符合人的认知过程,是一种由高到低(top一bottom)的处理过程。

遥感信息提取目前,大部分遥感信息的分类和提取,主要是利用数理统计与人工解译相结合的方法。这种方法不仅精度相对较低,效率不高,劳动强度大,而且依赖参与解译分析的人,在很大程度上不具备重复性。尤其对多时相、多传感器、多平台、多光谱波段遥感数据的复合处理,问题更为突出。因此,研究遥感信息的智能化提取方法对于提高遥感信息的提取精度和效率具有重要意义2。

遥感图像分类遥感图像分类是遥感图像处理系统的核心功能之一,也是信息提取的重要环节,它实现了基于遥感数据的地理信息提取,主要包括监督分类,非监督分类,以及分类后的处理功能。非监督分类包括等混合距离法分类等。监督分类包括最小距离分类、最大似然分类、贝叶斯分类、以及波谱角分类、二进制编码分类等。

基于知识发现的遥感信息提取遥感成像是从多到少的映射,是个确定过程,而影像解译是从少到多的映射,是个不确定过程,无法从数学上直接求得确定解,因此需要依赖于人的知识给出假设和约束,以求最优解。从信息论的角度说,因为遥感成像过程丢失了信息,或由于加入噪音而减少信息量,使得遥感影像所携带的信息量不足以表达人们所希望求解的诸多地理对象内在的不确定度"因而在遥感影像解译时,有一个重要的地学处理过程。包括两个方面,一是把遥感未带回的信息再补上去,即补充其它地学相关的信息;二是根据影像信息进行地学分析,来推断出影像上未反映的信息;这些都需要地学知识的支持。计算机领域中人工智能的出现,使得基于知识的专题信息提取成为可能。如何把地学专家用于目视解释的知识定量化表达,并参与计算机处理,成为从根本上解决信息提取的问题。故人机交互的后一阶段已转入基于知识的图像信息提取。采用交互式输入某一层次的知识信息,来对目标进行有效地识别。

基于符号知识的逻辑推理遥感信息提取基于符号知识的逻辑推理遥感分类方法是在传统基于地学规律的分类方法基础上,通过对地学知识进行符号化表达和形式化逻辑推理的过程,来实现信息的判别,一定程度上能真实地反映地学分布规律。但是,由于遥感信息模糊!复杂的特点,很难用结构化、符号化的地学知识来表达蕴涵的土地覆盖规律及其动态发展的过程,而且遥感影像包含的信息量巨大,用串行的符号逻辑推理的处理方式进行影像分析,效率不高。近年来,在遥感分类应用研究中,开始尝试基于知识的逻辑推理分类方法和建立专家系统来进行遥感分类工作。

小波变换与遥感信息智能化提取近年来飞速发展的小波分析理论为遥感影像的高效压缩提供了契机。由多尺度分析、时频分析、金字塔算法等发展起来的小波分析理论己经成为了图像压缩、处理和分析最有用的工具。基于离散小波变换的多分辨率无缝影像数据库是由美国LizardTech公司开发的新一代图像压缩、解压、存储和提取技术,它利用离散小波变换对图像进行压缩、拼接和镶嵌,通过局部转换,使图像内部任何一部分都具有一致的分辨率和非常好的图像质量。

发展趋势基于地物纹理知识的信息提取当地物组成复杂,且大小大于传感器的空间分辨率时,就可能遥感到地物的结构和组成.其影像就存在着明显的纹理特征.当存在着有别于背景地物的纹理结构特征时,当只靠基于光谱特征的知识的提取难以完全解决信息的提取问题时,就必须将地物的光谱知识与纹理知识一起用来提取信息.纹理是指灰度值在空间上的变化.它是由一些纹理基元按照不同的空间配置形式所构成的一种图案.纹理基元的空间配置可以是随机的、确定的、概率和函数的.纹理可分为结构纹理和非结构性纹理,非结构性纹理又叫随机纹理.在目视判读中,纹理一般用粗细度、平滑性、颗粒性、随机性、方向性、直线性、周期性、重复性等术语来描述和表达.在通过纹理识别地物时,需要将某专题的纹理特征与周围地物的纹理特征进行比较分析.发现纹理知识的方法有共生矩阵法、半变差函数法、分形分维法、马尔可夫随机场和小波变换法、极值纹理法、结构单元法等.其中最常用的是共生矩阵纹理法和半变差函数法。

基于地物形状知识的信息提取有时,地物与背景之间,不仅在光谱特征上相同或相近,而且在纹理特征上也比较相似.在这种情况下,就得依据地物的形状知识进行深一步的提取.例如,黎夏等利用水塘与河流在形状的差异,将二者区分开来,实现信息的计算机自动提取.对形状的描述有规则的几何形状,如长方形、正方形、菱形、圆形、椭圆形、三角形、五角形、纺锤形等等,以几一些不规则的几何图形.发现地物的形状知识的方法有基于周长和面积的方法、基于面积的方法以及基于面积和区域长度的方法。

基于地物边缘特征知识的提取不同的地物具不同的边缘形状.对地物边缘形状的描述有,直线状、锯齿状、波浪状等等.可用线分维来发现地物的边缘特征知识,边缘特征知识可用于地物的定位定性识别,在用于定性定位识别时,首先,通过边缘增强,提取边缘信息,然后利用地物的边缘特征知识对地物进行定性.在用于定性提取时,主要是对所提取的信息再进一步肯定其属性。

基于地物的过程知识的提取当我们据有多期遥感图像时,我们就可以建立基于地物过程的遥感信息提取.这是因为,不同的地物,有其不同的变化周期,在其变化周期内,有着独特的变化特征.例如,落叶树一般在冬季会落叶,而常绿植物一年四季都不落叶,根据这一特征,就可以将其提取出来.又如,根据其过程光谱特征就可以建立基于其过程知识的提取模型。

基于影像空间关系知识的信息提取影像空间关系知识是指地物之间在空间上的配置关系,一般可分为相邻、包含和被包含,按其可能分为确定性空间关系和概率空间关系,同时,还可以分为肯定性空间关系和否定性空间关系.确定性空间关系是指两地物之间的空间关系是确定的,只要地物A的存在(或不存在),就必然会有地物B的存在(或不存在).概率性空间关系是指两地物之间的空间关系是以一定的概率而存在(或不存在),地物A的存在(或不存在),可以说明有存在或不存在地物B的可能性,其可能性的大小可用一定的概率表示.这种空间关系知识如,有的道路两旁有树,这样我们可以通过识别道路两旁的树木来达到识别道路的目的.在对这类知识的应用时,可以从图像上提取出地物A,然后,根据A与B的相关关系肯定或排除B的存在3。

GIS中多源数据和知识的利用在信息提取中,除了利用遥感数据外,一般还要利用大量的相关数据,这些数据多为来自于GIS的图形数据和非图形数据.图形数据是指已经有的各种图件.非图形数据一般是指人口、社会、经济等统计数据.在对图形数据的利用方面,有两个步骤,第一步,需要挖掘知识;第二步,将这些知识用来将图形数据与遥感影像联系起来,以支持信息的提取.这些知识是一些正相关知识和反相关知识.对这两种知识而言都还可以进一步分为确定性知识和概率性知识,对图形数据而言,根据它们与我们所要提取信息的关系,可以进一步将它的分为四种情况,一、对该信息过去状态或未来状态的定性、定位描述;二、对包含该信息的上一级信息的过去状态或未来状态的定性定位描述;三是使该专题存在的条件信息的定性定位描述,这包括邻近条件和叠置条件;四、限制该专题存在的条件信息之定性、定位描述,这包括邻近限制和叠置限制4。