版权归原作者所有,如有侵权,请联系我们

[科普中国]-无缝数据库

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

背景

随着GIS 应用的范围和领域的不断扩大,GIS 系统需要表述越来越大的空间范围和管理越来越多的空间信息,空间数据库的缝隙问题逐渐凸现,对于缝隙的全面认识是组织无缝空间数据库的首要问题,如何在多源异构环境中信息数据共享是无缝空间数据库的目的和要求。

无缝GIS概念和内涵地图是用于描述现实世界的载体,是地球三维椭球面的二维平面表达。地图学功能的延伸和扩展就是地理信息系统(GIS)。随着计算机技术的飞速发展,GIS研究不断深化,在应用推动上,由原来单一的GIS即以图幅为单位的一小块不连续的空间上进行数据分析、管理、描述和应用等,到区域性的GIS在大区域多图幅上连续处理地理信息,人们迫切要求GIS够处理连续的、无缝隙的空间信息,由此提出了无缝化的GIS从而使人们可以在更广阔的空间数据基础上进行分析应用。

无缝化的概念包括了管理和应用的结合。无缝GIS要更丰富的空间数据作为支持,一方面空间数据的获取是一项耗时耗力的工作,另一方面GIS迅速发展和广泛应用导致了多源空间数据的产生,这些数据从投影方式到比例尺可能各不相同,如何实现不同源头的空间数据共享,能被无缝GIS接使用,即多源空间数据的融合,成为无缝GIS展的关键。

数据缝隙产生的原因探讨缝隙产生的原因,要考查GIS 数据采集、表达和处理的全过程。在现实世界中,地理空间是由地貌、地物组成的连续的表层空间,地理信息则是有关地理空间的一切有用的知识。在计算机世界中,地理信息通过抽象、建模形成数字化的表示形式,通过空间数据库来进行表达、存储、存取和管理。1

缝隙的产生主要集中在以下几个方面和过程:

数据源由于历史和现实的原因,地图是绝大多数GIS 系统直接的数据源。地图是地球三维椭球面的二维平面表达,本身对真实世界有扭曲;地图是对连续空间的割裂表达,实体被分割到不同的地图空间中去;高斯投影是基本比例尺地形图经常选用的投影,也是绝大多数GIS系统的数学基础,由于分带的原因,使得投影后带有高斯投影平面坐标的地图无法实现无缝拼接。

数据表达与组织方式空间地理几何数据的表示主要有栅格和矢量两种不同的形式。栅格形式是将地理表层空间划分为一系列网格,空间目标由这些网格的位置及其量化值来表示,这些格网本身就是连续空间信息的离散表达;矢量形式则是将地理空间的一切事物、概念进行抽象,形成点、线、面,由点、线、面来组成各类空间目标。按点、线、面来分类和按分层的思想来组织空间数据,也割裂了实体之间内在的联系。

在空间数据库组织与管理上,目前主要有文件型、文件与关系数据库混合型、全关系型以及对象关系型。传统的文件型空间数据库、文件与关系混合型空间数据库,按图幅或一定的区域范围以文件的形式来组织与存储空间几何数据,不同的图幅或区域之间存在缝隙。在文件与关系数据库混合型的空间数据库中,空间几何数据贮存在文件中,属性数据贮存在关系数据库中,属性数据和几何数据之间通过内部标识来链接,空间几何数据和属性数据之间存在缝隙。

数据处理数据处理的过程中也会引入缝隙,产生这种缝隙的原因有:

①数据处理过程的顺序不一致;

②选择的处理参数不一致;

③数字化的精度不一致。

多源异构数据共享数据属性(数学基础、比例尺、用途、时间、精度等)的不同,导致了数据的差异,这些差异是多层次和多方面的,它们集中体现了数据的异构。数据异构和多源往往是一体的,多源异构是系统内部和系统之间数据裂隙的主要原因。

数据缝隙的类别和表现数据缝隙基本可以分为物理缝隙和逻辑缝隙两类。物理缝隙是地理空间的分离存储,本来连续的实体空间被分离到不同的存储空间和存储单元中去,例如空间数据的分幅、分层存储。逻辑缝隙是指逻辑上本身连续的信息不能以逻辑连续的方式呈现,例如跨越多幅图的一条河流,在图幅内查询河流属性(例如长度)时只能获取其在本图幅内的相关信息而不是实体整体的信息。2

显然,由于空间信息本身的海量特性,要完全意义上的实现物理无缝的空间数据库目前还是不可能的,也没有必要。GIS 用户关心的不是空间数据是物理无缝,因为GIS 呈现给用户的是数据逻辑层,只需要保证用户看到的数据是逻辑无缝的。

物理有缝的数据库向逻辑无缝数据库的转换是无缝空间数据库构建的重要一环。

无缝空间数据库的含义“无缝空间数据库”问题实际上是地理空间的空间数学基础问题。GIS基本理论问题从根本上消去了“无缝空间数据库”问题,因而能在技术上妥善解决以下6个全球范围问题:3

①全球连续可视化;

②多分辨率信息的系统性、统一性;

③多维、多源信息数据的全球统一定位框架;

④长度、面积、方向和体积等全球的精密量度;

⑤空间分析的正确性;

⑥信息系统工程的优化结构,即具有易扩充、组合分解的动态性、统一的规范性、计算的优化性。

随着GIS 数据发布与共享技术的发展,无缝空间数据库逐渐分化出两个层次的含义:一是GIS 系统内部的数据无缝,一是不同GIS 实现互操作时的数据无缝。前者是通常意义的无缝,后者主要通过数据标准化与操作标准化来实现。无缝空间数据库的最终含义体现在逻辑无缝数据库。无论是多源还是单源、同构还是异构,跨越数据层呈现在用户面前的GIS空间数据库必须是逻辑无缝的。

空间数据的无缝连接是一个建立在用户与数据库接口基础上的概念,它是空间数据库中空间数据集成的结果,即在用户的接口上实现对空间数据的透明访问,即对空间数据按空间进行集成,形成地理空间上无缝连接的整体集成信息空间。

无缝数据库的关键技术数据的无缝连接包含以下几个问题:投影,坐标系统,比例尺,数据精度等。对不同投影和坐标系统的空间数据在投影和坐标系统上统一采用相同的标淮,当空间数据具有多尺度时,无缝连接寻找数据集之间连续的表达方式,它表现为不同尺度数据之间的集成。建立无缝空间数据的关键在于在合适的空间信息框架上实现多源异构空间数据的融合,框架是基础,融合是手段。

合适的空间框架的选择⑴适合多尺度信息表达

地球是一个开放的非常复杂的巨大系统,随着观察视角的变化,我们希望空间地理信息比例尺也自动增减。由于地图的自动综合受诸多因素的影响,目前比较可行的是采用多尺度空间数据支持来达到目的。所谓多尺度就是指系统内包含几种不同比例尺(或分辨率)的空间数据,其目的是为了适度地反映系统所关心区域的空间地理信息,以避免地物信息的过粗、失真或地物信息的负载量过大而无法使用。无缝空间数据库也应该符合多尺度空间数据库要求。

⑵适合大区域表达

各种自然和人文现象的空间分布,有其内在的原因和规律,这些原因和规律的获得,往往需要研究大区域多因素的综合作用;另一方面,对于全球范围的环境变异和气候变迁的研究需要基于数字地球的空间框架。大区域的表达,还涉及空间尺度问题,不应继续采用欧氏空间尺度,而应该采用大地线尺度空间。

多源异构空间数据的融合GIS 的迅速发展和广泛应用导致了多源空间数据的产生。如何实现不同的GIS 软件共享并操作不同来源的地理数据,即GIS 多源空间数据的集成,成为GIS 发展的关键。目前GIS多源空间数据的集成主要朝着三个方向发展,一是通过建立统一的数据交换标准来约束并规范已有的各类地理信息系统,采用数据交换标准来进行空间数据交换;二是建立开放式地理数据互操作规范,进行地理信息系统互操作;三是GIS 数据中间件技术。

统一数据交换标准存在很多实现上的困难。互操作是一个重要发展趋势,是在异构分布式数据库中实现信息共享的途径,它需要将GIS 技术、分布处理技术、面向对象方法、数据库设计及实时信息获取方法更有效地结合起来。所谓GIS 数据中间件技术是指能够嵌人各类GIS 系统的软件,GIS 开发者通过中间件开发商提供的接口,访问和操作特定的数据源。

在多源异构数据集成技术尚未成熟的时候,人们再次把目光投向数据本身,如果可以提供关于数据的详细描述,是否可以提高融合数据的能力呢?于是,对于“关于数据的数据”的研究,即对于元数据的研究便普遍展开。从Dublin Core 到CSDGM 与OGC,都提出了相应的元数据标准体系,有了完整而完善的元数据描述,必将提高数据的效能,从而最终促进多源异构数据库向无缝空间数据库的归化。

意义无缝是GIS 系统数据库的目的和要求。无缝不仅是一个可视化的目标,更是一个数据共享的目的和手段。消除缝隙,要从缝隙产生的地方开始。分离出数据物理层和数据逻辑层,在统一的空间框架之下,将物理层归化到逻辑层,并消除逻辑层的缝隙,从而实现用户级的逻辑无缝空间数据库

MRSID技术介绍MRSIDMRSID (Multi-Resolution Seamless Image Data base)又称为多分辨率无缝数据库,它是由美国Los Alamos国家实验室发明的新一代图像压缩、解压、存储和提取技术。它利用了离散小波转换(DWT)技术对图像进行压缩,通过局部转换,使得图像内部任何一部分都具有一致的分辨率和非常好的图像质量。它内部采用多分辨率的金字塔存储结构,是一个小型的影像数据库的概念,总结起来有以下优点。

1.有较高的压缩比。其压缩比决定于图像内容和彩色深度,对于灰度图像压缩率为15 :1 ~20 :1,对全彩色图像可以达到30 :1 ~ 50 :1,压缩后对视觉质量没有可感知的损失。压缩比可调,可以把压缩的图像设置成完全无损失至适度有损。

2.可以压缩非常大的图像,可压缩的图像大小决定于计算机可寻址的存贮器大小。目前,LizardTech公司提供3种图像压缩器,可压缩文件分别为100 MB, 500 MB和无限制。可以将多幅图像压缩为一个文件,建立大型的图像数据库。

3.以多种分辨率显示影像数据。

4.采用选择性的解压技术能够解压所需要浏览的整个压缩图像的一部分,解压速度快,可以快速地打开和浏览大的图像,内存只要2MB。

5.支持多种图像格式文件的压缩。目前,支持TIFF C Tagged Image File Fom}at,包括有和无TIFFWorld File两种),BIL (Band Interleave),BSQ CBand Se-quential),BIP CBand Interleaf Per Pixel),USGS DOQ(新旧两种格式)格式。

6.可实现即时、无缝、多分辨率的大量图像浏览,无需等待、分块处理、软件代理。可通过CD光盘、网络和Internet等媒介快速地传输图像。

影像数据库中MRSID技术的应用1.数据处理

经过正射纠正的源影像大部分以TIFF格式存放,由于影像的数据量非常大,而且随着航片和卫星影像的不断增加,影像数据量将以几何级数不断增长,所以必须要为源影像提供一种高性能的压缩方式,既使影像有较高的压缩比,又可以以不同的分辨率高效显示图像。MRSID凭借自身的诸多优点成为我院影像压缩工具的首选。NIRSm GeoSpatial Encoder是一个独立的压缩软件,操作起来非常方便,既可以对单个影像进行压缩,也可以对多个影像批处理,而且,压缩工具能自动生成源影像的宽度、高度以及大小等信息,供用户参照,选择合适的压缩倍率。由MRSm GeoSpatial Encoder工具压缩的结果,影像文件后缀为sid,记录了影像的像素信息。值得一提的是,数据处理还包括空间定位文件的生成,这个以sdw为后缀的文本文件记录了像素和空间实际坐标的对应关系,既可以手工生成,又可以编制软件快速生成。

2.影像元数据生成

元数据是解释影像数据的数据,它以纯文本文件存放,后缀为mat,存放影像数据源、数据精度、生产情况等方面的信息。影像元数据由上海市测绘院研制的影像元数据生成工具生成,这些文件和影像sid文件一一对应,和影像sid文件存放在客户机的同一文件目录下。

3.影像数据库维护

每一个影像的sid文件、元数据mat文件、空间定位sdw文件,从不同的方面来描述影像,是一个密不可分的整体。在影像数据库中,影像的像素信息,空间定位信息以sid文件、sdw文件形式存在,而元数据信息和影像的矢量范围则一起存放在ORACLE数据库中。影像数据库维护工具是一个独立的程序,基于Client/ Server模式,在FTP协议的支持下,负责将前面处理好的sid影像、空间定位sdw文件传输到服务器文件系统中,同时将影像的元数据信息和影像的矢量范围导入到ORACLE数据库中,文件和数据库相互关联。影像数据库维护软件不仅能实现服务器文件系统和数据库属性的同步和时时更新,还能实现影像和元数据的相互查询。

4.利用MRSID的解压接口实现影像数据的提取功能

上海市城市空间地理影像数据库除了对影像数据进行统一管理和维护,为GIS用户提供整个图幅的航空影像或整个飞行区的卫星影像外,还有一个非常重要的功能就是要能按照用户的需要,对用户所感兴趣的区域进行影像数据提取。影像数据的提取不仅涉及到单幅影像的提取,还涉及到2幅或4幅影像的提取,其最终结果都是要将用户感兴趣范围的影像数据提取出来,存储成另外格式的图像文件,而且操作对象既可以是卫星影像,又可以是航空影像,所以在进行程序的实现时,既要考虑用户的操作对象,又要考虑提取操作涉及到几幅影像,是否在提取影像数据后进行影像的拼接等因素。

5.影像数据发布

结合WebGIS软件,在网上直接发布sid影像和元数据信息,速度快且图像效果好,借助于网络技术,极大地拓宽了用户获取影像信息的途径,更好地满足了广大用户的需要。