符合学术规范的学术服务

湖南省矢量空间数据集成方法研究

分类:科技论文 时间:2020-05-08

  [摘要]本文针对湖南省矢量空间数据来源复杂、格式不一等问题,建立了一套多源矢量空间数据集成框架。该框架以基础地理信息数据分类分层体系为依据,从数据空间、属性、格式等方面制定数据集成规则,实现多源异构矢量空间数据集成。建立的多源矢量空间数据集成框架为湖南省地理空间数据交换共享数据库构建提供了重要支撑。

湖南省矢量空间数据集成方法研究

  [关键词]多源矢量空间数据;地理空间数据集成;地理空间信息交换共享

  0引言

  随着测绘地理信息技术的快速发展和广泛应用,当前我国各省市已经积累了大量不同来源、不同尺度、不同时相、不同格式的地理空间矢量数据,如何实现多源异构数据的集成、管理、交换共享及应用,提升测绘地理信息数据的应用价值和服务水平是政府部门面临且需亟待解决的问题[1]。

  多源地理空间矢量数据集成是把不同来源、格式、比例尺、多投影方式或大地坐标系统的地理空间数据在逻辑上或物理上的有机集中,从而实现地理信息的共享[2]。矢量空间数据的集成研究始于20世纪60年代,尤其是伴随着地理信息系统的出现,多源矢量空间数据的集成日益迫切[3]。国际上在多源矢量数据集成与共享方面研究起步较早,北美、西欧及国际组织早期开展数据管理体系、数据资源共享、数据信息规范化标准化等研究,构建了符合实践的空间数据运行体制[4]。国内学者也针对多源矢量空间数据集成的理论与方法开展了基础性的研究工作,如坐标与投影变换、数据格式转换、语义编码转换等[5-7]。近年来,我国随着信息化技术、地理信息技术、云计算技术的发展,各行业对空间地理信息的需求增强,但各行业数据格式、数据标准不统一,空间参考基准、数据资源组织不一致,信息资源共享与整合程度低,缺少统一集成的数据库,空间地理信息得不到充分挖掘,无法“盘活”空间地理信息数据库,从而无法提升空间地理信息的应用价值[8-9]。已有研究成果主要采用串行计算方法集成,串行计算方法指多个程序在同一个处理器上被执行,只有在当前的程序执行结束后,下一个程序才可以开始,所以处理过程慢,且以库级别的粒度集成,管理难度大。

  因此,本文从湖南省地理空间数据现状、特点、数据标准规范等方面进行分析,开展基于云GIS平台的湖南省地理空间数据集成研究,研究基于云GIS平台流程化动态建模技术。云GIS平台是指采用虚拟化技术、分布式存储技术、并行计算技术等技术构建的地理空间数据管理平台,平台将海量的多源异构数据进行分布式存储,在一个计算机服务器集群中采用多个节点对地理空间信息数据进行并行处理,建立空间数据、相关的文档及属性数据关联关系。在云GIS平台上搭建数据处理规则引擎,对多源多时相多尺度数据进行流程化规则化集成处理,并构建数据库资源目录组织管理体系,为湖南省地理空间信息交换共享提供数据支撑,为湖南省时空大数据的汇集打下基础[10-11]。

  1湖南省多源矢量空间数据

  目前,湖南省内管理的矢量数据具有明显的多源、多尺度、多格式、多参考系及多语义的特点:

  (1)多源性。湖南省现有测绘地理信息数据主要来源包括基础测绘成果、地理国情监测成果、数字城市成果以及交通、环保、教育等行业部门交换共享的地理空间数据。

  (2)多尺度。当前湖南省管理和存储的矢量空间数据比例尺主要包括:1∶500、1∶1000、1∶2000、1∶5000、1∶1万及1∶5万。

  (3)多格式。当前数据格式包括MDB、GDB、E00、SHP、COV、DWG、MAPGIS等。

  (4)多空间参考系。现存的各类地理空间信息数据主要采用西安80坐标系统、2000国家坐标系统,行业专题数据多采用西安80坐标系、北京54坐标系。

  (5)多语义性。不同来源属性信息、图层分类不一致,例如基础测绘矢量数据分为9大类、17个中类、39个图层,几何特征包含点、线、面,地理国情基础性监测矢量数据分为10个一级类,58个二级类,135个三级类,属性增加CC码用于地表覆盖分类。相比基础测绘矢量数据,地理国情普查数据分类较细,数据内容较为丰富,属性信息较为完整,数据分层及数据采集标准不一致。对于同一个空间单元,现实世界中其几何特征一致,但可对应多种语义。例如,地理国情数据中构筑物点、线、面层,在基础测绘中则分别表达为水系构筑物、道路构筑物。

  2多源矢量空间数据集成框架

  本文在进行多源矢量空间数据集成时,首先指定数据集成的总体原则,进而分步骤指定具体集成策略。

  2.1数据集成总体原则

  (1)空间参考要求:考虑到湖南省跨三个度带,所有地理空间数据统一转成地理坐标系,便于统一存储与管理。统一采用国家2000地理坐标系、1985国家高程基准作为数学基础。

  (2)平面位置精度要求:当需要集成的多源矢量数据平面位置精度不一致时,原则上以精度高的数据为准。

  (3)数据几何表达精细度要求:需要集成的多源矢量数据几何表达精细度不一致时,以精细度高的数据为准。

  (4)数据现势性要求:需要集成的多源矢量数据现势性不一致时,以现势性高的数据为准。

  (5)空间关系与逻辑一致性要求:集成后的成果数据要素空间关系正确,各类信息逻辑一致。

  (6)数据内容要求:集成处理时应利用不同数据源的信息进行要素增补,集成后的成果数据应尽可能完整保留数据源中的相关信息。

  2.2矢量空间数据集成方法

  通过对湖南省多源矢量空间数据对比分析,本文以2000国家大地坐标系、1985国家高程基准为数学基础,以GB/T13923-2006《基础地理信息要素分类与代码》为分类标准,以基础地理信息矢量数据分层体系为分层分类依据,其他来源的矢量空间数据根据时相、精度等对基础地理信息数据进行补充,集成不同来源、不同时相、不同尺度的矢量空间数据,具体流程如图1所示。

  (1)空间化处理

  2017年4月,湖南省出台了《湖南省地理空间数据管理办法》省政府令,要求各行业厅局将用于交换共享的数据汇集到湖南省自然资源厅共享服务机构,自然资源厅信息中心开始收集各行业厅局的数据,收集到的大部分行业专题资料格式为excel表格等文本格式(文本中含位置信息),因此,为了集成行业专题资料,丰富基础地理信息数据内容,首先将行业专题中的位置信息空间化处理。

  空间化处理主要分两个类别:①含经纬度坐标;②不含经纬度,但含地址信息;含坐标信息的表格数据根据点位分布形成空间化数据图层;不含经纬度,但含位置信息的表格数据根据已有地名地址数据进行关联处理,形成空间化数据图层。

  (2)格式转换

  为了在云GIS平台上统一管理不同格式数据,本文研究在云GIS平台中搭建数据格式转换ETL处理规则(如图2),将矢量数据转换为通用SHAPE格式(便于交换共享应用),并依据基础地理信息矢量数据分层体系分层,分类体系中缺少的图层,则根据实际做适当扩展。

  (3)空间数据匹配

  以湖南省地理空间数据基本比例尺、基本时相为依据,匹配多来源、多尺度、不同时相的地理空间数据,并进行类别划分,将相同尺度、相同时相的数据集成在一个数据库中,并根据《基础地理信息要素分类与代码》分类到对应的图层中。湖南省地理空间数据基本比例尺为:1∶500、1∶1000、1∶2000、1∶5000、1∶1万,从国家申请的小比例尺数据也要进行管理,因此,扩充尺度为:1∶5万、1∶25万。湖南省已有数据时相为:2010年-2017年。

  (4)一致性处理

  一致性处理主要针对矢量数据语义一致性处理。湖南省地理空间数据来源于国家指导生产、省级自主生产,数据生产标准不统一,数据语义存在较大不一致性。因此,本文研究抽取时相高的图层,以GB/T13923-2006《基础地理信息要素分类与代码》为语义标准,按照分类分层体系组织图层,形成相同尺度下的矢量数据层,从而构建不同尺度、不同年度的矢量数据层,如:1∶1万尺度下道路、水系、铁路层分别用字符串LRDL、HYDL、LRRL表示,有些数据相同尺度表示的要素相同但图层语义不一致则进行一致性处理等。

  (5)属性结构调整

  为便于查询、检索、空间分析等应用,按照云GIS平台建库数据标准,将经过格式转换、一致性处理后的数据作为数据输入,从中抽取相应的属性信息、空间信息录入到标准数据框架中,构建标准化地理信息矢量数据。

  (6)集成规则

  根据数据管理要求,本文设计不同集成操作的处理规则,主要有数据格式转换规则、数据抽取规则、数据检查规则等数据处理规则,这些处理规则搭载在湖南省地理信息公共交换共享平台的ETL上,形成流程化动态模型,例如数据格式转换规则设计输入任何格式的地理空间信息数据,通过分析源数据格式与目标数据格式之间的差异,建立数据转换模型,形成地理空间信息数据转换规则,在数据处理过程中搭建不同格式的数据转换规则流,批量转换地理空间信息数据,数据集成规则及详细处理流程如图2。

  数据抽取规则设计查找全部地理空间信息数据图层及元数据,对比图层的连接性、时效性、完整性,按照分层标准体系,抽取地理空间信息数据图层,并进行合并,规则处理流程见图3、图4。

  推荐阅读:测绘高工论文需要在哪些杂志上发表

  3地理空间数据组织管理

  地理空间数据集成后数据量达上百TB,为了高效管理、快速渲染海量地理空间数据,本文采用基于高性能云GIS平台构建的湖南省地理信息公共交换共享平台大数据管理中心管理集成后的地理空间数据,大数据管理中心采用在通用的虚拟化环境运行,提供海量空间数据的分布式存储,支持并行计算的空间索引,大幅提高海量空间数据的动态渲染(无须切片缓存)及空间分析的速率,并提供高性能的空间数据可视化、空间分析及地理计算等服务。

  本文设计在大数据管理中心中设置原始库、母库,原始库主要收集管理各个单位生产项目汇交的数据。母库则是从原始库中通过抽取、匹配、语义一致性处理、属性规整等操作处理,集成地理空间数据成果,集成后的数据按照矢量数据、影像数据、高程数据、地名地址数据、元数据、地图文档等分类管理,生产单位汇交的数据为全省范围分幅或分县管理的MDB格式、GDB格式、历史数据的E00格式的数据,其比例尺、格式、语义由于生产项目不同,所以生产标准不一致,造成不同比例尺、不同时相、不同格式、不同语义的多源异构地理空间矢量数据,通过本文研究的数据集成规则引擎在线处理,集成为按比例尺、时相、统一格式、统一属性结构及语义的地理空间矢量数据库数据。

  4结束语

  本文针对湖南省矢量空间数据来源复杂、格式不一、海量地理空间数据管理难等问题,通过分析湖南省地理空间数据管理的现状及数据特点,提出了基于云GIS平台的多源矢量空间数据的集成原则和方法,并将研究成果运用于湖南省地理信息公共交换共享平台数据库建设中,取得了良好的应用成效,为湖南省地理空间数据的交换共享打下了坚实基础。

全学科期刊推荐 中英文发表指导

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询