简介
随着3S技术(GIS、RS、GPS)的发展和集成,针对各种应用的多种数据源使得地球空间数量迅速增加,空间数据的内容和形式的多元化也已成为地球空间数据存在的重要特征。各种空间数据的来源不同、表达形式不同,甚至语义也不相同,因此有必要将这些分散的数据源有机地整合起来以更好地发挥空间数据的作用。空间数据集成的目的就是构建一个无缝的空间数据集,表现在数据的空间、时间和属性上的无间断连续性。
空间无缝是指空间要素特征在不同数据集中的空间范围连续性;时间无缝是指地学过程允许范围内的时间不间断;属性无缝是指属性类别、层次的不间断特征。
简单讲,空间数据集成就是属性数据与空间数据的关联,它是在一致的拓扑空间框架中将不同的数据彼此兼容起来的过程,也可以说是由多个源数据层经过缓冲、叠加、获取、添加等操作获得新数据集的过程。1
集成方法空间数据集成面临的问题比传统的关系数据库集成更多。从计算机技术的角度来看,空间数据集成大致分为基于文件系统的集成、基于数据库系统的集成、基于中间件系统的集成和基于互操作的集成四种方法。总的来看,四种方法是承前启后的关系,不同的方法适用于不同的场景,其发展与主流的IT技术的发展潮流相呼应,都是空间数据共享、集成与应用的重要模式。
基于文件系统早期的GIS软件是采用文件方式来存储和管理空间数据的。因此,基于文件系统进行空间数据集成应用是一种简便易行、成熟可用的集成方式。由于数据格式的不一致性,不同的GIS平台的文件需要进行格式转换才能互用。这种格式转换一般采用预处理方式,导致这种集成方式有如下不足:
(1)数据损失;
(2)不同平台的可视化存在不一致的问题;
(3)格式转换、重复建库的效率比较低;
(4)数据更新不及时;
(5)数据安全性无法得到保障。
基于数据库在数据库技术、网络技术日益发展成熟的背景下,空间数据也被考虑利用数据库进行存储和管理。基于数据库的系统空间数据集成方式可以有效地解决基于文件格式转换时存在的数据损失、重复建库、更新困难等问题,已出现了较多成功的案例。
这种模式在应用中也出现了两个主要问题:
(1)空间数据在网络上传输需要较高的带宽和安全性,在因特网环境下难以实现;
(2)难以实现异构的GIS平台的集成应用。
基于互操作WebService技术正在成为构建跨平台应用系统的主流技术。OGC推出的OWS(OGC WebService)框架是一个开放的互操作框架,可以基于Web发布、发现、存取、集成和利用地理空间数据。OGC推出的基于OWS的地理信息服务规范包括网络地图服务规范、网络要素服务规范等。基于互操作模式的空间数据集成方法的最大优势是其开放性。
该模式存在的问题:
(1)共享空间数据的层面,OWS服务解决了很多问题,但涉及更深层次的共享,如查询、处理、分析能力的共享,OWS并没有完全解决;
(2)OWS为了保证其开放性而广泛采用XML,其传输和编译码对性能有较大的影响。
基于中间件中间件技术是一种比较成熟的技术,是处于应用软件和系统软件之间的一类基础软件,属于可复用软件的范畴。分布式应用软件可以借助中间件在不同的技术和平台之间共享资源。分布式空间数据的集成借助于中间件来屏蔽数据库系统和不同GIS系统的异构特性,能够综合考虑到不同的数据库和GIS平台的优势和不足,提供较高效的空间数据访问、处理与分析的应用功能。如果能够遵循一致的、开放的协议,也就能够满足开放性的要求。
质量检测在空间数据集成的过程中往往存在空间数据质量控制的问题。无论是统计数据还是空间特征数据都存在数据精度问题,当把各种类型的数据集成的时候,如何合理有效的控制集成的质量显得尤为重要。空间数据质量控制及其流程和操作规范的制定必须与整个数据集成工作很好地结合起来。1
影响因素影响空间数据精度的原因主要有两方面:
(1)源数据的精度;
(2)数据处理过程中精度质量的控制情况。1
控制内容空间数据质量控制内容包括:
(1)有准确定义的数据字典或元数据,以说明数据的组成,各部分的名称,表征的内容等;
(2)确保逻辑科学地集成数据,如土地利用数据库中不同属性子类的区块如何组合成更大的区域等,这要求数据按照一定逻辑关系有效的组合;
(3)有足够的说明数据来源、数据加工处理过程、数据解译的信息。1