版权归原作者所有,如有侵权,请联系我们

[科普中国]-空间数据转换

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

简介

空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它是数据的一种特殊类型,用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界。

地理信息系统(GIS)主要处理那些直接、间接与地理空间位置的分布、时间的发展相关的自然、经济与人文等方面的物体、事实、事件、现象和过程的地理空间信息数据,即地理实体的空间特征和属性特征的数字描述。地理实体的空间特征表现为地理实体的几何(定位)特征(地理实体的位置、形状、大小及其分布特征)和实体间的空间关系;地理实体的属性(定性)特征表现为实体的数量特征、质量特征和时间特征。定位是指一个已知的坐标系里空间目标都具有唯一的空间位置;定性是指有关空间目标的自然属性,它伴随着目标地理位置;时间是指空间目标是随时间的变化而变化的。根据地理实体数字描述的不同方式,空间数据可分为矢量数据和栅格数据。这些数据区别于计算机辅助设计中的其他空间数据。

随着信息技术以及GIS自身的发展,GIS已经从纯粹的地学技术系统的圈子跳了出来,正在和IT行业完全融合,人们对空间信息的需求也越来越多。目前,地理信息系统已走向完全以纯关系数据存储和管理空间数据的发展道路。由于地理信息系统处理的数据对象是空间对象,有很强的时空特性,获取数据的手段复杂多样,这就会形成多种格式的原始数据,再加上地理信息应用系统长时间处于以具体项目为中心孤立发展状态中,很多地理信息系统软件都有自己的数据格式,地理信息要作为公共基础信息广泛发布与使用,必须真正实现共享,解决地理信息数据多格式、多源数据集成等瓶颈问题1。

空间数据的特征空间数据除了具有一般数据的基本特征之外,还具有一些区别于其他数据的特性。构成空间数据的特征主要有:

(1)空间性

这是空间数据最主要的特性。空间数据描述了空间物体的位置、形态,甚至需要描述物体的空间拓扑关系。例如描述一条河流,一般数据侧重于河流的流域面积,水流量,枯水期等。而空间数据则侧重于河流的位置、长度、发源地等和空间位置有关的信息。复杂一点的还要处理河流与流域内城市间的距离、方位等空间关系。空间性是空间数据区别于其他数据的标志特征。

(2)抽象性

空间数据描述的是现实世界中的地物和地貌特征,非常复杂,必须经过抽象处理。不同主题的空间数据库,人们所关心的内容也有差别。所以空间数据的抽象性还包括人为地取舍数据。抽象性还使数据产生多语义问题。在不同的抽象中,同一自然地物的表示可能会有不同的语义。如河流既可以被表示为水系要素,如果它与境界共线还可以被表示为行政边界,如省界,县界等。

(3)多尺度与多态性

不同的观察尺度具有不同的比例尺和不同的精度,同一地物在不同的情况下就会有形态差异。最典型的例子有:就形态而言,任何城市在地理空间中都占据着一定范围的区域,因此可以认为它是面状地物,但在比例尺比较小的空间数据库中,城市是作为点状地物来处理的。

(4)多时空性

地理信息系统中的空间数据具有很强的时空特性。一个地理信息系统中的数据源既有同一时间不同空间的数据系列;也有同一空间不同时间序列的数据。不仅如此,地理信息系统会根据系统需要而采用不同尺度对地理空间进行表达。地理信息系统中的空间数据是包括不同时空和不同尺度的数据源的集成。

(5)广度性与连续性

空间数据在实际具体应用中,都是对一定区域或者一定时期内实体要素的数据采集,数据只有具有一定的分布广度和连续性,这样才具有实际应用的价值和基础。

(6)海量性与标准化

空间数据是对实体要素的数字表述,不但包括位置信息还包括属性信息,如一幢房屋的描述包括房屋的坐落(或坐标)、房屋的面积大小、房屋的层数、房屋的建造材质、房屋的隶属单位、房屋的拥有人、使用人等大量信息,若要对一个城市、一个国家甚至于全球范围内的所有房屋进行数据采集,数据量肯定很大,这些庞大的数据称为海量数据。为了有效地管理使用空间数据,将其分类通过编码科学地组织起来,也就是空间数据的标准化。

空间数据的拓扑关系在地理信息系统中,不但要描述实体的空间位置、形状、大小和其它所具有的属性,还要反映实体与实体之间的相互空间关系,即拓扑关系。拓扑关系是指满足拓扑几何学原理的各空间数据间的相互关系,是明确定义空间关系的一种数学方法。

拓扑关系主要包括:邻接关系、关联关系和包含关系。

(1)邻接关系:用以表示空间图形中同类元素之间的拓扑关系,包括结点与结点、线与线以及面与面的邻接关系,分别存在于同一弧段上相邻的结点之间、具有公共结点的弧段之间、具有公共弧段的面之间。

(2)关联关系:用以表示空间图形中不同类型元素之间的拓扑关系,包括结点与弧段、弧段与面之间的关联关系。

(3)包含关系:用以表示空间图形中面中包含其它的点、线或面的关系。不需要各实体的具体位置信息,依据拓扑关系就可以确定实体之间相对空间位置。 拓扑关系不会受到投影关系、比例尺发生变化带来的影响,总能反映实体之间的相对位置,较几何数据有更大的稳定性。

二维矢量数据模型中,点、线、面是基本要素,点、线、面之间的关系,代表了空间实体之间的位置关系,其可能存在的空间关系有:点一点,点一线,点一面,线一线,线一面,面一面等多种形式,而每一种形式的空间关系又包含更多的子形式2。

空间数据转换方法选择(1) VCT格式和Shape格式的数据模型不同,对地理实体的描述也不一致。如果采用外部数据交换的方法进行转换,转换后的数据就不能准确地表达原数据的信息,会造成数据信息丢失,还会造成空间数据精度损失等其他问题。

(2)国家空间数据交换格式标准方法刚刚出台,本身还有很多问题没有解决,而且经过验证目前用这种转换方法并不是太好。

(3)空间数据共享和互操作还处于起步阶段,通用转换工具FME转换软件价格太高,完全使用数据互操作模式和数据共享平台也是不现实的。

因此,经过考虑本文选用了直接数据转换方法来解决VCT格式到Shape格式的数据转换问题。以VCT为开发平台,采用ETL的技术方法,利用MapObjects组件将VCT文件转换为Shape文件格式,并进行了转换程序的编制。

总结通过研究,得出几点结论:

(1)要在地理信息系统建设中,能够尽可能地节约时间、人力、物力,使用有效和快捷的数据格式交换方法对目前存在的地理信息数据进行处理是必需的。

(2)两种数据在数据组织、数据结构等方面存在差异,在转换前要对VCT文件进行有效的组织和管理。也可在项目开展之前制定好一定范围内的相关标准,包括软件平台的选择和数据格式的统一,尽可能避免数据转换带来的数据误差。

(3)为尽量保持数据转换前后的一致性,要及时检查和纠正数据转换后所出现的错误,修复丢失的信息,减少数据转换造成的错误。

(4)实现不同GIS软件的不同格式数据的完全转换是复杂和困难的,而且目前的数据转换方法都有其不足之处和需要完善的地方,对于转换方法的选择要以实际的情况来决定3。