如何区分Shapefile,Coverage,Geodataba(转载)
在过去20年中,⽮量数据模型是GIS中变化最⼤的⽅⾯,例如,ESRI公司所开发每种新软件包都对应⼀种新的⽮量数据模型,Arc/Info对应Coverage,ArcView对应Shapefile,ArcGIS对应Geodataba。Coverage和Shapefile是地理关系数据模型,它利⽤分离的系统来存储空间数据和属性数据,⽽Geodataba是基于对象数据模型,它把空间数据和属性数据存储在唯⼀的系统中。
Coverage是拓扑的,Shapefile是⾮拓扑的。
Coverage⽀持三种基本拓扑关系:连接性、⾯定义、邻接性。
双鱼座性格特点女Shapefile多边形对于共享边界实际上有重复弧段且可彼此重叠,不同于Coverage所⽤的多个⽂件,它⽤⼏何学性质存储两个基本⽂件:以.shp为扩展名的⽂件存储要素⼏何学特征;以.shx为扩展名的⽂件保留要素⼏何特征的空间索引。
Shapefile:⼀种基于⽂件⽅式存储GIS数据的⽂件格式。⾄少由.shp,.dbf,.shx三个⽂件作成,分别存储空间,属性和前两者的关系。是GIS中⽐较通⽤的⼀种数据格式。
Coverage:⼀种拓扑数据结构,⼀般的GIS原理书中都有它的原理论述。数据结构复杂,属性缺省存储在Info表中。⽬前ArcGIS中仍然有⼀些分析操作只能基于这种数据格式进⾏操作。
Geodataba:ArcInfo发展到ArcGIS时候推出的⼀种数据格式,⼀种基于RDBMS存储的数据格式,其有两⼤类:1.Personal Geodatab ⽤来存储⼩数据量数据,存储在Access的mdb格式中。2.ArcSDE Geodatab 存储⼤型数据,存储在⼤型数据库中Oracle,Sql Server,DB2等。可以实现并发操作,不过需要单独的⽤户许可。迎春花几月开
Coverage数据模型
Coverage是⼀个集合,它可以包含⼀个或多个要素类。在第⼀个商业化GIS软件Arc/INFO之前,计算计划的图形表⽰源⾃通⽤的CAD软件,属性信息和⼏何要素放在⼀起,不利于空间信息的描述和分析。
Coverage的优势:
(1)空间数据与属性数据关联。空间数据存储于建⽴了索引的⼆进制⽂件中,属性数据存放在DBMS表中,⼆者以公共的标识编码关联。
(2)⽮量数据间的拓扑关系得以保存。
Shapefile数据模型
秦始皇统一哪六国Shapefile是ArcView GIS 3.x的原⽣数据格式,属于简单要素类,⽤点、线、多边形存储要素的形状,却不能存储拓扑关系,具有简单、快速显⽰的优点。⼀个shapefile是由若⼲个⽂件组成的,空间信息和属性信息分离存储,所以称之为“基于⽂件”。每个shapefile,都⾄少由三个⽂件组成,其中:*.shp存储的是⼏何要素的的空间信息,也就是XY坐标。*.shx存储的是有关*.shp存储的索引信息,它记录了在*.shp 中,空间数据是如何存储的,XY坐标的输⼊点在哪⾥,有多少XY坐标对等信息。*.dbf存储地理数据的属性信息的dBa表。这三个⽂件是⼀个shapefile的基本⽂件,shapefile还可以有其他⼀些⽂件,但所有这些⽂件都与该shapefile同名,并且存储在同⼀路径下。下⾯简要介绍⼀下其他⼀些较为常见⽂件:*.prj如果shapefile定义了坐标系统,那么它的空间参考信息将会存储在*.prj⽂件中;*.l这是对shapefile 进⾏元数据浏览后⽣成的xml元数据⽂件;*.sbn和*.sbx这两个存储的是shapefile的空间索引,它能加速空间数据的读取,这两个⽂件是在对数据进⾏操作、浏览或连接后才产⽣的,也可以通过ArcToolbox>DataManagement Tools>Indexes>Add spatial Index⼯具⽣成。
⼏种常见的shapefile⽂件:当使⽤ArcCatalog对shapefile进⾏创建、移动、删除或重命名等操作,或使⽤ArcMap对shapefile进⾏编辑时,ArcCatalog将⾃动维护数据的完整性,将所有⽂件同步改变。所以需要使⽤ArcCatalog管理shapefile。虽然Shapefile⽆法存储拓扑关系,但它并不是普通⽤于显⽰的图形⽂件,作为地理数据,它⾃⾝有拓扑的。⽐如⼀个多边形要素类,shapefile会按顺时针⽅向为它的所有顶点排序,然后按顶点顺序两两连接成的边线向量,在向量右侧的为多边形的内部,在向量左
侧的是多边形的外部。由于1990年代地理信息的迅速发展以及ArcView GIS 3.x软件在世界范围内的推⼴,shapefile格式的数据使⽤⾮常⼴泛,数据来源也较多。很多软件都提供了向shapefile转换的接⼝(eg:MapInfo、MapGIS等)。ArcGIS⽀持对shapefile的编辑操作,也⽀持shapefile向第三代数据模型geodataba 的转换。
Geodataba数据模型
Geodataba作为ArcGIS的原⽣数据格式,体现了很多第三代地理数据模型的优势。随着IT技术的发展,普通的事务型数据的管理模式,早已从传统的基于⽂件的管理转向利⽤基于⼯业标准建⽴的关系型数据库进⾏管理,这种基于数据库的管理⽅式的优点是不⾔⽽喻的。那么带有空间信息的地理数据是否也可以利⽤这种⾮常成熟的数据库技术进⾏管理呢?于是ESRI推出了geodataba数据模型,利⽤数据库技术⾼效安全地管理我们的地理数据。
Geodataba可以分为两种,⼀种是基于Microsoft Access的personal geodataba,另⼀种是基于oracle、SQL Server、Informix或者DB2的enterpri geodataba,由于它需要中间件ArcSDE进⾏连接,所以nterpri geodataba⼜称为ArcSDE geodataba。由于Microsoft Access⾃⾝容量的限制,personal geodataba的容量上限为2GB,这显然不能满⾜企业级的海量地理数据的存储需求。于是可以将geodataba扩展为ArcSDE geodataba,底层数据库可以使⽤oracle这样的⼤型关系数
据库,能够存储近乎“⽆限”的海量数据(仅受硬盘⼤⼩的限制)。虽然底层使⽤的数据库各不相同,但是geodataba给⽤户提供的是⼀个⼀致的操作环境。在geodataba中,不仅可以存储类似shapefile的简单要素类还可以存储类似coverage的要素集并且⽀持⼀系列的⾏为规则对其空间信息和属性信息进⾏验证表格、关联类、栅格、注记和尺⼨都可以作为eodataba对象存储。这些在perasonal geodataba和ArcSDE geodataba中都是⼀样的(栅格的存储有点⼩差异,但对⽤户来说都是⼀样的)。
Geodataba的模型结构:
(1)对象类(Object class)
对象类是⼀种特殊的类,没有空间特征。其实例是可关联某特定⾏为的表记录。如,某地块的主⼈,在“地块”“主⼈”间可建⽴某种关系。
(2)要素类(Feature class)悲成语>电梯厅门
要素类是同类空间要素的集合。如,河流、道路、植被、电缆等。要素类可以独⽴存在,也可以具有某种联系。当不同的要素类之间存在关系时,就将其组织到⼀个要素数据集(Feature datat)中。
(3)要素数据集(Feature datat)
应然与实然
要素数据集由⼀组具有相同空间参考(Spatial reference)的要素类组成。将不同要素类放⼊要素数据集的原因:
吉他独奏a.专题归类表⽰——当不同的要素类属于同⼀范畴。⽐如,全国范围内某种⽐例尺的⽔系数据,其点线⾯类型的要素类可组织成同⼀个要素数据集。
b.创建⼏何⽹络——在同⼀⼏何⽹络中充当连接点和边的各种要素类,须组织到同⼀要素数据集中。⽐如,配电⽹络中,有各种开关、变压器、电缆等,它们分别对应点或线类型的要素类,在配电⽹络建模时,我们要将其全部考虑到配电⽹络对应的⼏何⽹络模型中。此时这些要素类就要放在统⼀要素数据集下。
c.考虑平⾯拓扑——共享公共⼏何特征的要素类。⽐如,⽤地、⽔系、⾏政区界等。当移动其中⼀个要素时,其公共部分也要⼀起移动,并保持这种公共的⼏何关系不变。
(4)关系类(Relationship class)
定义不同要素类或对象类之间的关联关系。如我们可以定义房⼦和主⼈之间的关系、房⼦和地块之间的关系等。
(5)⼏何⽹络
在若⼲要素类的基础上建⽴起的新类。定义⼏何⽹络时,我们指定哪些要素类加⼊其中,同时指定其在⼏何⽹络中扮演什么⾓⾊。⽐如,定义⼀个供⽔⽹络,我们指定同属⼀个要素数据集的“阀门”、“泵站”、“接头”对应的要素类加⼊其中,并扮演“连接”的⾓⾊;同时,我们要指定同属⼀个要素数据集的“供⽔⼲管”、“供⽔⽀管”、“⼊户管”等对应的要素类加⼊供⽔⽹络,由其扮演“边”的⾓⾊。
(6)Domains
定义属性的有效范围,可是连续的,也可是离散数值。(7)Validation rules对要素类的⾏为和取值加以约束的规则。如不同管径的⽔管连接必须通过合适的接头,规定⼀个地块可拥有⼀到三个主⼈等。
(8)Raster datats
⽤于存放栅格数据。⽀持海量栅格数据,⽀持影像镶嵌,可通过建⽴“⾦字塔”形索引,在使⽤时指定可视范围提⾼检索和显⽰效率。
(9)TIN Datats
ARC/INFO的经典数据模型,⽤不规则分布的采样点的采样值构成不规则的三⾓集合。⽤于表达地形或其他类型的空间连续分布特征。 (10)Locators音乐节拍基本知识
定位参考和定位⽅法的组合。对于不同的参考,⽤不同的定位⽅法进⾏定位操作。所谓定位参考,不同的定位信息有不同的表达⽅法。在Geodataba中,有四种定位信息:地址编码、<X,Y>、地名及邮编、路径定位。定位参考数据放在数据库表中,定位器根据该定位参考数据在地图上⽣成空间定位点。