数据缝隙产生原因
空间地理数据缝隙的产生主要有数据的获取、表示与处理等方面。
(1)在数据的获取方面,传统的纸质地图是一种基本的空间数据源。地图按图幅划分,按一定的标准,人为地将连续的地表空间划分成若干相互连接的子空间,使同一地物划分成多个部分,分别落在不同的图幅中。由于纸张伸缩、数据转换误差和人工操作失误等因素,使相邻两图幅之间几何图形或逻辑属性衔接不上。
(2)在数据的表示和组织方面,不同的表示和组织方法会产生不同的缝隙。使用平面投影坐标来描述球面必然要遇到跨带投影的裂缝问题。以经纬度表示的地理坐标系可以完整的覆盖整个球面连续无缝隙。
(3)在数据处理方面,数据处理过程中的误差或处理过程的不一致会产生缝隙。其原因有:数据处理过程的顺序不一致;选择的处理参数不一致;数字化的精度不够。前两者可以通过选择适当的处理过程或处理参数来解决,而第三条原因则可以通过提高精度来解决。1
图幅接边原则由于农用地分等定级规程中还没有明确提出图幅空间接边精度问题,也没对属性接边方法做明确规定。因此实际工作中图幅接边主观随意性很强。为保证农用地分等汇总图幅接边成果的可靠性,按照土地利用分区的原则将省分为多个土地利用分区在同一土地利用分区中农用地的系数、等别指数应相差不大;同时根据制图综合要求接边过程中应遵循如下原则:
由于系统误差而使相邻两图幅边界处存在缝隙或重叠时,在1:50万地图上误差不能超过1mm,实地距离不超过500m。对于超出误差范围的成果图件应重新进行坐标转换。
相邻两图幅边界处存在缝隙或重叠时,应根据两县市与其周边县市边界的衔接情况,判断哪个县市边界应保留作为公共边界,则另一县市边界应作相应修改。
一地物被相邻两图幅分割且被分割的两部分图形衔接不上时,应以保留边界县市的地物为基准,另一县市、地物作相应图形调整。
线状地物或面状地物被相邻两图幅分割且被分割的两部分属性不匹配时,应对照现有土地利用现状图进行修改。
确定系数、等别指数需调整县市时,以同一土地利用分区的各个县市按面积加权平均的系数、等别指数作为样点数据,以样点数据两倍标准偏差为误差限,对样点数据超出误差限的县市做调整。
在农用地分等汇总工作中,图幅属性接边应能反映全省农用地等别宏观分布,对需调整县、市应检查核实其县级分等资料,对有错误的县级分等资料进行修正,并整体调整其系数、分等指数。
相邻图幅边界处局部地区系数、等别指数有可能衔接不上,此时应以面积为依据。面积较小地块的系数、等别指数根据面积较大地块属性做修改。
图幅边界有明显的、较大的、使两块土地分离的地物时,例如大江、大河、海峡等,可以保留2个图斑界线及其属性。1
图幅接边步骤分析数据缝隙来源,对不同原因造成的数据缝隙采取相应措施,逐个消除各种数据缝隙。这里只对由数据获取和表示引起的缝隙进行分析,并提出相应的解决方法,接边过程见图幅接边流程图。
空间接边1.坐标投影反算消除由数据表示引起的数据缝隙
由于跨带的原因,不同分带的图幅在平面坐标系下拼接不上,为进行图幅拼接,要对县级分等成果图层进行两方面的处理:确认地图的坐标系统和投影方式,并检查其精度;将平面坐标系下的地图数据按其投影方式,进行投影反算,变换为经纬度坐标系统下的地图数据。借助GIS软件的project命令可自动实现图层坐标投影反算,消除由数据表示引起的缝隙。
2.消除由数据获取方面带来的几何缝隙和逻辑缝隙
(1)边界匹配。经过投影反算后的数据,理论上应该是几何无缝的,由于数字化时,使用设备精度或数据采集精度的原因,使图幅在接边处或在节点处产生缝隙,这种缝隙一般通过接边来解决,具体方法有:平均法。是指将图形两边待接点的坐标均值作为接边后点的坐标。该方法简单易行,适用于接边误差在精度允许范围内的各种直线,多义线类的接边处理;强制法。是把一条待接边的待接点强制附和到另一条待接边的待接点上。该方法主要用于用户能明显判断出哪一条待接边比另一条待接边更准确、可靠、适合交互式的接边处理;优化法。就是分别找出两待接点的前一点’,连接这两点与边界线求出一个交点P,用P的坐标分别代替原来的待接点坐标。
(2)逻辑一致性处理。对相邻图幅进行逻辑一致性处理,以消除图幅间的逻辑缝隙。由数据获取带来的逻辑错误,在农用地分等省级汇总工作中主要包括:同一线状地物在相邻图幅中各部分的属性不一致:铁路,公路,单线河等;同一面状地物在相邻图幅中各部分的属性不一致:湖泊,面状河流,地类图斑等。1
属性接边综合等别反映在当前农业技术经济条件下,农用地所能实现的最大经济产量水平。由于某些人为因素的影响,各县(市)间或边界处等别衔接不上,因此,省级汇总中要进行分等成果图件属性接边。分等成果图件的属性接边应以农用地等别指数为依据,从自然等指数接边开始,逐步实现土地利用系数、利用等指数、土地经济系数、分等指数接边,需要调整系数、等别指数时应同时修改导致误差产生的县级分等资料数据,并调整等系数、等别指数计算结果。1
图形接边程序地理信息系统中许多图形信息是通过已有图形数字化而来,这样不可避免地存在图幅间图元的接边问题。图形接边是为了消除相邻图幅间的结合误差,使跨越两幅图的图元在接边处完全吻合。
接边过程中,首先要将需要拼接的两幅图的图形数据合并在一个临时的数据库中,然后再按点接、线接、弧接三种方法进行接边处理。将完成接边后生成的临时数据库进行分幅存储。
接边程序主要包括三个模块:调图模块、接边模块和分幅存储与退出模块。其程序框图如下所示:2
多图幅接边提出目前国内外的大多数具有接边功能的软件都是只对两个图层或两幅图进行接边,从而造成了一些问题:
(1)一幅图需要分别与相邻图幅进行多次接边,大大降低了接边的效率。
(2)在进行两两接边的过程中,难于在细节上同时兼顾与其他相邻图幅的关系,使得接边整体效果不好。多图幅接边正是针对以上问题的改进。一方面,用户可以在整体上同时兼顾各个图幅的接边细节;另一方面,多图幅的同时调人和接边大大减少了中间冗余数据和多余的操作,从而提高接边的效率。3
设计在设计上,多图幅接边以接边线为媒介(接边线一般为主工程的内图廓线)来确定参与接边的工程。在具体的实现过程中,用户将具有关联关系的多幅图同时调入,进行相关接边参数设置,完成后由计算机一次性地对各图幅进行两两接边处理。3
接边流程通常软件的地图图幅接边过程可以分为8个过程
(1)形成各分库的接边条;
(2)定义接边工作库;
(3)把接边条装入接边工作库;
(4)接边信息结构化;
(5)接边物体排序
(6)物体偶对匹配与误差匹配;
(7)新接边条的逆向转储;
(8)有关分库录入新接边条。3
接边设置及接边线定义接边设置中设置了接边缓冲区、接边关联域值、接边原则、属性约束、是否趋势接边、直线接边地物类等。接边线是连接各图幅的纽带,是接边点误差配赋的依据。有两种方式可以生成接边线:
(1)根据图幅号生成接边线;
(2)输人点坐标生成接边线。3
接边信息结构化在接边信息结构化过程中,抛弃了传统的封装接边物体的做法,将接边物体中参与接边的接边点作为处理对象,使接边过程大为简化并且使接边问题有了较简单的解决办法。
接边点是在定义了接边设置及接边线后生成的,利用面向对象技术,将各种信息封装在接边点类中,实现接边信息的结构化。然后根据接边设置中的接边缓冲区,将所有可能参与接边的点形成接边点,存储人接边辅助层中,再根据接边关联域值和属性约束条件匹配接边点,在系统认为可以匹配的两点间形成接边关联线段,供用户预览并检查接边匹配情况。3
接边点匹配提出了将距离、地物类、高程等属性共同考虑的匹配方法,大大提高了接边点匹配的正确性。
接边点匹配后就在两点间形成接边关联线段。接边关联线段是在接边过程中产生的新对象,用来连接、操作有接边关联的两个接边点。将接边关联线段显示出来可供用户检查匹配关系是否正确,及时进行修改,从而实现了接边预览,以保证批量接边时的准确性。3
图幅接边虚拼接算法算法提出2004至2006年,赵江洪分别从不同角度论述了多图幅自动接边算法[3-5];2007年,赵相伟提出基于索引图的大比例尺图幅自动接边方法[6];2008年戴相喜提出矢量数据任意范围接边算法及其实现[7]。这些算法具有共同特点:接边时边界处被拼接矢量需要进行坐标重组,因此被拼接矢量数据必须同时读入内存。在目前内存资源仍然有限的情况下,其进行大数据量矢量图幅的接边时,往往首先分区接边;然后对接边后大区域再接边;大区域接边时,先分别读取大区域矢量图幅,检索出需要接边的矢量,再对这些矢量单独拼接以实现整体接边。这种方法的不足在于接边效率很低。
针对此问题,提出多图幅矢量接边的“虚拼接”算法。算法不受同时接边的图幅数据量限制,适用于大范围甚至全球的海量数据图幅自动接边,并保持了较高运行效率。算法提出的依据为:在矢量集中,一般根据矢量ID区别矢量;因此,将应被拼接的多个矢量ID映射一致,从而在应用这些矢量时,可将其作为一个整体看待,实现图幅接边的效果。这种接边效果能够满足数字地图的多数应用要求。4
算法基本内容算法基本内容如下:第1步,扫描各矢量图幅,确定图幅间相对关系,获取接边所需边界信息;第2步,对图幅边界信息进行拼接判断,得到应进行拼接的矢量的拼接链;第3步;再次扫描各矢量图幅,根据拼接链,将被拼接的矢量的ID映射一致,实现虚拼接。
图幅接边必须首先确定所有图幅的接边关系。接边关系指出了图幅在上下左右各边与哪些图幅进行拼接。图幅接边还需要生成每个图幅的边界信息,边界信息指出了图幅间接边时,其间的哪些矢量需要进行拼接。上述所需信息仅与单个图幅有关,可通过1次遍历扫描各图幅获取。
进行拼接判断是确定相邻图幅间哪些矢量应两两拼接,如拼接成立,则形成形如[矢量,矢量]的拼接对,表示两个矢量应进行拼接;拼接链表示若干图幅中应依序拼接成为整体的多个矢量ID的有序集合,形如[矢量,矢量,矢量,⋯]。拼接判断的标准,主要依据切口坐标是否在合理的限差内相等;但在有多个切口坐标符合拼接的情况下,应借助类型码、矢量名称等其它判别条件判断矢量是否应进行拼接。4