地理国情河流实体编码方法研究-期刊天空网

　　摘要：针对地理国情普查水系成果实体编码问题，进行河流流向正确性检查方法研究，提出了基于河流实体属性、流向和“唯长唯远”原则的河流实体编码方法，并通过FME平台实现了河流实体自动编码，在项目生产中得到验证，表明该解决方案是可靠、高效的，在地理国情普查水网数据优化处理中发挥巨大作用，也为实现地理国情监测水系数据深化应用和水资源相关空间分析提供了有效支撑。

地理国情河流实体编码方法研究

　　关键词：地理国情普查;河流实体编码;水系数据深化应用

　　“十二五”期间，由测绘地理信息行政主管部门主导，在全国范围内开展地理国情监测，实现地理国情信息为政府科学决策、生态环境建设、水资源相关空间分析等方面提供持续服务。2016年完成了第一次全国地理国情普查成果的数据库建库工作，数据库中的水系数据主要以水利普查成果为参考进行采集获取的，包括了河流结构线、高水界等，数据的属性同时包含了1∶5万基础地理信息数据库河流名称、河流代码和水利普查的河流代码，并以水利普查的河流代码为实体对象码建立了水网数据层。由于地理国情普查数据与水利普查数据在要素详细程度上有较大差异，普查数据库中以水利普查的河流代码为实体对象码建立的水网数据层，而该层数据仅为采集水系数据的1/10，存在大量河流未参与构网、大量河流小支流汇水不明确、少量河流流向错误、水网关系尚不完善、河流等级与汇流关系矛盾等问题[1]，一定程度上制约了地理国情普查水网成果在生态环境建设、水资源开发应用与保护等方面的深化应用，主要原因是未对每一条河流实体进行对象化编码。

　　相关期刊推荐：《地理空间信息》是经国家新闻出版总署批准于2003年6月创刊，同月28日出版第一期，它是双月刊。本刊是湖北省测绘局主管，湖北省测绘行业协会和湖北省测绘学会主办经国家新闻出版署审批的科技期刊。以刊载地理空间信息科学的理论和技术为主要内容，延伸到信息技术的广阔领域。以学术探讨、技术交流、法规与管理、信息服务为固定版块，增设产品与服务、综述、教学与研究、人才与就业等临时版块。

　　要素处理引擎(featuremanipulateengine，FME)是一种基于“语义转换”的空间数据处理平台[2]，提供了丰富的空间叠加、网络分析和统计计算的工具函数，算法严密，使用方便，海量数据处理能力强，基本满足地理国情河流实体编码的需求。

　　因此，以地理国情普查成果深化应用(水系统一编码)项目为依托，研究河流流向正确性检查方法、基于河流实体对象化属性、河流实体对象化编码方法，并通过FME平台实现了河流流向判断和河流实体自动化编码，形成地理国情监测水网数据对象化编码方案，在实际生产中得到应用，并发挥了重要的作用。

　　1河流实体编码规则

　　1)河流实体确定规则。河流有具体的名称则可被视为该名称下的一个实体，无名河流从最远端到汇入其他河流实体的部分视为一个实体，一组无名河流可按主流支流的顺序确定河流实体。

　　2)河流等级划分。地理国情水网优化将所有河流划分为1～9级，其中1～5级已参照1∶100万地形数据库中全国河流名称代码中的等级确定;6～9级参照集水区单元、河流长度等因子进行确定;6级河流在每个集水区单元内原则上只选取一条最长的，选取5000m以上主要支流河流作为7级河流;选取7级以外1000m以上河流定义为8级河流;其他的定义为9级河流。

　　3)河流实体编码规则。按照下述河流实体编码规则对河流进行编码。编码结构如下：

　　************

　　前6位为集水区单元代码，以河流所在最小集水区单元编码;第7位为已经确定的河流等级;第8～11位为顺序码，使用阿拉伯数字，按重要程度采用先由主流到支流、再由北向南、自东向西的原则编码;第12位为标识码[3-5]。

　　2河流流向判断方法研究

　　河流流向指的是河流中水体的水流方向，此方向应与河流结构线的数字化采集方向一致，是一个隐含的关系，实际生产中人工不易发现错误。河流流向关系的正确性是河流统一编码的前提条件，所以在河流统一编码之前需对河流流向正确性进行判断和改正。自然河流的抽象形态表现为树状(如图1中A树状河流所示)和环状(如图1中B环状河流所示)2种形态;辫状河流(如图1中C环状河流所示)可分解为树状和环状的组合形态，流向的判断可分解到树状和环状形态河流流线判断中，因此本文研究河流流向的判断方法基于2种河流抽象形态设计

　　自然河流的流向存在从高向低的规律，且数字化采集的河流结构线都是有向矢量线段，可通过构建有向线网络、查找源和汇的方法判断河流流向[6]。具体思路如下：

　　1)树状河流通过有向线构建网络，找到水系网络的源和汇，再根据源和汇的高程值判断河流流向的正确性，将流向错误的河流结构线添加标识，再进行改正。

　　2)环状河流通过构面找到构成环状河流的所有河流结构线要素，再单独对环状河流结构线要素构建网络，找水系网络的源和汇。如果在一个环状河流结构线构建的水系网络内不存在源和汇，则该环状水系内存在河流流向错误的结构线;如果存在源和汇，则根据源和汇的高程值判断河流流向的正确性，将流向错误的河流结构线添加标识，再进行改正。

　　3河流实体编码方法研究

　　地理国情监测水系数据中1～5级河流属性中均有河流名称、水利普查的河流代码等实体属性。故1～5级河流的编码可通过实体属性进行河流实体编码，而5级以下的河流既无河流名称也无河流水利普查的河流代码，只能依靠河流流向关系和“唯长唯远”的原则进行河流实体编码。河流流向通过流向判断和改正已经得到保证，如何找到每个相对独立的水系网络中河水流经的最长路线成为河流编码的关键，河流编码方法流程如图2所示。

　　具体思路如下：

　　1)对1～5级河流根据河流名称、河流实体编码等实体属性，按照12位河流编码规则进行河流实体编码，并标记为已编码，作为5级以下河流首次编码的骨架水系;

　　2)对5级以下河流构建网络，因为骨架水系不参与构网，构建网络后的结果是以每个支流的起点为网络源，以网络汇入骨架水系点为汇的相对独立的水系网络，并对构建的网络进行编号;

　　3)创建每个相对独立的水系网络中从所有源到所有汇的有向矢量;

　　4)根据网络和源到汇的有向矢量，生成该水系网络中从源到汇的所有可能的有向路线;

　　5)对步骤4)得到的路线计算长度，并取长度的倒数，采用查找最短路径的方法[7]，使用长度的倒数作为查找最短路径的影响因子，在相同网络编号的有向路线中因子最小的路线，即为河流流经长度最长的路线;

　　6)对步骤5)得到的最长路线经过的所有河流结构线弧段，根据河流等级划定标准，按照12位的河流编码规则进行河流等级判定和实体编码，并将河流弧段标记为已编码，作为下一次迭代编码的骨架水系。

　　7)对于未标记的河流结构线弧段，重复步骤2)～6)，直到所有河流结构线都标记为已编码，处理结束。

　　输入河流数据通过1次编码循环处理，即可得到如图3所示的结果，将最长的河流检索出来，并进行编码。

　　4河流实体编码方法实现

　　基于FME软件平台，调用函数库中丰富的函数工具，定制可视化的工作流，实现河流实体编码的自动化处理。首先从函数库中检索到相应的函数工具匹配编码方法中的每一项操作，并设置各函数工具必需的参数，关键步骤所使用的函数工具对照表如表1所示。然后将各函数工具的输入输出相连，形成河流实体编码自动化处理的工作流，最终实现河流实体编码的自动化处理程序。

　　在2017年地理国情普查水系深化应用项目中，对河流实体编码程序进行了测试对比，测试数据情况为河流弧段总数为100000条，其中1～5级河流弧段4500条，5级以下河流弧段95500条。传统人工编码方式作业，人均编码2000条/d，需10人用5d完成。程序编码方式用15～20min运行程序，再由人工补充处理编码未成功弧段、整理数据用时约5.3h。

　　5结　语

　　本文提出的地理国情水网数据编码方法已在2017年地理国情普查成果深化应用(水系统一编码)项目中进行了成功的应用，通过实际应用对比发现，本文提出的地理国情水网数据编码方法比传统的人工编码判读精度更精确、标准更统一、效率更高效，作业人员的劳动强度大大减小，项目的生产效率大大提升，生产的数据质量得到保证。