shp文件格式说明

更新时间:2024-04-22 19:09:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

shp文件格式说明

SHAPE 文件格式

SDE,ARC/INFO,PC ARC/INFO,Data Automation Kit(DAK)和ArcCAD软件提供了shape 到coverage的数据转换器,

ARC/INFO同样提供了coverage到shape的转换器。为了和其他数据格式交换,shape文件的格式在本报告中被出版。

其他数据流,比如来自全球定位系统(GPS)接收机的数据能同样被存为shape文件或X,Y事件表。

Shape文件技术描述计算机程序能通过使用本节的技术描述来产生,读,写shape文件。

一个ESRI的shape文件包括一个主文件,一个索引文件,和一个dBASE表。主文件是一个直接存取,变量记录长度文

件,其中每个记录描述一个有它自己的vertices列表的shape。在索引文件中,每个记录包含对应主文件记录离主

文件头开始的偏移,dBASE表包含一feature一个记录的feature的特征。几何和属性间的一一对应关系是基于记录

数目的。在dBASE文件中的属性记录必须和主文件中的记录是相同顺序的。 命名习惯所有文件名都符合8.3命名习惯。主文件,索引文件和dBASE文件有相同的前缀。前缀必须是由字符或数字

(a-Z,0-9)开始,后跟0到7个字符(a-Z,0-9,_,)主文件的后缀是.shp,索引文件的后缀是.shx,dBASE表的后

缀是.dbf。文件名中的所有字母在对文件名敏感的操作系统中都是小写的。 例子

主文件:counties.shp 索引文件:counties.shx dBASE表: ounties.dbf数字类型一个shape文件存储整数和

双精度数,本文档的余数指以下类型: 整数:有符号32位整数(4字节)

双精度:有符号64位IEEE双精度浮点数(8字节)浮点数必须是数字的值。负无穷,正无穷和非数字(NaN)值在

shape文件不被允许。然而shape文件支持'没有数据'的值这样的概念,但是目前只用于衡量。某些小于-1038被

shape文件读取程序用来代表'没有数据'的值。 下面的第一节描述shape文件的总体结构和组织。第二节描述shape文件支持的每种shape类型的记录内容。

主文件的组织

主文件(.shp)由固定长度的文件头和接着的变长度记录组成。每个变长度记录是由固定长度的记录头和接着的变

长度记录内容组成。图1图解了主文件的结构。 图 1 主文件的结构 文件头

记录头 记录内容 记录头 记录内容 记录头 记录内容 记录头 记录内容 …… ……

记录头 记录内容

Shape文件中所有的内容可以被分为二类: 与数据相关的:

。主文件记录内容

。主文件头的数据描述域(Shape 类型,边界盒等) 与文件管理相关的: 。文件和记录长度 。记录偏移等

整数和双精度整数在文件头中组成数据描述域,在主文件的记录内容是小ndian(PC或Intel)字节顺序。组成文件

的其余部分和文件管理的整数和双精度浮点数是大endian(Sun或Motorola)字节顺序。 主文件头

主文件头100字节长。表1显示带有字节位置,值,类型和字节顺序的文件头中的域。

在此表中,位置是相对于文件的开始。 表 1 主文件头的描述

位置 域 值 类型 字节顺序 0字节 文件代码 9994 整数 大 4字节 未被使用 0 整数 大 8字节 未被使用 0 整数 大 12字节 未被使用 0 整数 大 16字节 未被使用 0 整数 大 20字节 未被使用 0 整数 大 24字节 文件长度 文件长度 整数 大 28字节 版本 1000 整数 小 32字节 Shape类型 Shape类型 整数 小

36字节 边界盒 Xmin 双精度 小 44字节 边界盒 Ymin 双精度 小 52字节 边界盒 Xmax 双精度 小 60字节 边界盒 Ymax 双精度 小 68字节* 边界盒 Zmin 双精度 小 76字节* 边界盒 Zmax 双精度 小 84字节* 边界盒 Mmin 双精度 小 92字节* 边界盒 Mmax 双精度 小 *未被使用,值为0.0,若没有被衡量或是Z轴。 文件长度的值是在16位字下文件的总长度(包括组成文件头的50个16位字)。在shape文件中的所有非空shape被需

要是同种shape类型。Shape类型的值如下: 值 shape类型 0 空shape

1 点 3 多线 5 多边形 8 多点 11 点Z

13 多线Z 15 多边形Z 18 多点Z 21 点M

23 多线M 25 多边形M 28 多点M

31 多斑块

没有被定义的Shape 类型值(2,4,6等直到33)为将来可能的使用而保留。目前shape文件被局限于包含以上定义

的同种shape类型。在将来shape文件可以被允许包含多于一种shape类型。若混合shape类型被实现,文件头中的

shape类型将标识该文件。

主文件头的边界盒存储文件中shape的实际幅度。最小边界X和Y直交的(潜在的M,Z)长方形包含了所有的shape。

若shape文件是空的(没有记录),min,Ymin,Xmax,Ymax的值是未被定义的。Mmin和Mmax能包含shape文件用来衡量

不包含衡量的shape类型的'没有数据'的值(参见2页的数字类型),记录头 每个记录的头存储了记录的数目和记录内容的长度。记录头有一个固定长度8字节。表 2显示文件记录头中域的字

节位置,值,类型和字节顺序。在表中,位置是相对于记录的开始的。 表 2 主文件记录头文件的描述

位置 域 值 类型 字节顺序 0字节 记录数目 记录数目 整数 大 4字节 内容长度 内容长度 整数 大 记录数目从1开始。

一个记录的内容长度是按16位字衡量的记录内容长度。每个记录因此为文件的总长度贡献(4+内容长度)个16位 字,正如文件头是24字节一样。

主文件记录内容

Shape文件记录内容包含一个shape类型和接着的该shape的几何数据。记录内容的长度依赖于在一个shape中部分和

vertices的数目。对每种shape类型,我们首先描述该shape然后是它在磁盘上的存储镜像。在表3到16,位置是相

对于记录内容的开始。 空shape

shape类型为0指代一种不带几何数据的空shape,每种要素类型(点,线,多边形等)都支持空,在同一个shape文

件中有点和空的点是有效的。常常空shape是放东西的地方;在shape文件产生时被使用和在产生后更被广泛地使用

表 3 空shape记录内容

位置 域 值 类型 数目 字节顺序 0字节 shape类型 0 整数 1 小 在X,Y位置的Shape类型

点 一个点包括一对以X,Y顺序排列的双精度的坐标 Point {

Double X //X坐标 Double Y //Y坐标 }

表 4 点记录内容

位置 域 值 类型 数目 字节顺序 0字节 shape类型 1 整数 1 小 4字节 X X 双精度 1 小 12字节 Y Y 双精度 1 小 多点 一个多点代表一个点的集合: MultiPoint {

Double[4] Box //边界盒 Integer NumPoints //点的数目

Point[NumPoints] Points //在集合中的点 }

边界盒以Xmin,Ymin,Xmax,Ymax存储。 表 5 多点记录内容

位置 域 值 类型 数目 字节顺序 0字节 shape类型 8 整数 1 小 4字节 Box Box 双精度 4 小 36字节 NumPoints NumPoints 整数 1 小 40字节 Points Points 点 NumPoints 小 PolyLine 一条PolyLine是指一条包含一个或多个部分的有序的vertices的集合。一个部分是指二个或多个点彼此

连接的顺序。部分间彼此相连或不连。部分间彼此可能相交或不相交。

因为该定义没有禁止有确定坐标的连续点,shape文件的读程序必须掌握这样的情况。在另外,退化(degenerate)

和可能导致零长度的结果是不被允许的。 PolyLine {

Double[4] Box //边界盒

Integer NumParts //部分的数目 Integer NumPoints //点的总数目

Integer[NumParts] Parts //在部分中第一个点的索引 Point[NumPoints] Points //所有部分的点 }

PolyLine的域在以下为更详细的描述:

Box 被存储的PolyLine的边界盒,以Xmin,Ymin,Xmax,Ymax的顺序存储。

NumParts 在PolyLine中部分的数目。 NumPoints 所有部分的点的总数目。

Parts NumParts长度的数列。为每条PolyLine存储它在点数列中的第一个点的索引。数列索引是从0开始的

Points NumPoints长度的数列。在PolyLine中的每一部分的点被尾到尾存储。部分2的点跟在部分1的点之后

,如此下去。部分数列对每一部分保持开始点的数列索引。 在部分间点之间没有界限。 表 6 PolyLine记录内容

位置 域 值 类型 数目 字节顺序 0字节 shape类型 3 整数 1 小 4字节 Box Box 双精度 4 小

shp文件格式内部结构

Shape文件是ArcGIS的基础文件类型,存储了非拓扑几何和属性信息。Shape文件支持点、线、区域的几何特征,由于不需要处理拓扑数据结构文件头,在编辑等方面具有更快的处理速度。本文通过对ESR I公司发布的

原版资料ESRI Shapefile Technical Descrip tion的翻译解读,剖析Shape文件的结构,利用VB写出直接 生成Shape文件的代码。 2 Shape文件结构

2. 1 Shape文件的文件构成Shape文件由3 个文件构成: 主文件、索引文 件、数据文件。

其中主文件的后缀必须是. shp;索引文件的后缀必须是. shx;数据文件的后缀必须是. dbf,这3个

文件共同组成Shape文件。各文件中存储的数据相互联系又各有区别。主文件中是Shape的位置信

息;索引文件是对主文件的索引,指出主文件中记录在文件中的位置信息;数据文件中包括Shape的具 体位置和属性信息。 2. 2 . shp文件的结构

. shp文件由文件头和文件记录构成(图1) ,其中文件大部分结构见表1。 文件头

记录头记录内容 记录头记录内容 记录头记录内容 记录头记录内容 ··· ···

记录头记录内容

图1 . shp文件的结构

其中Shape类型是ArcGIS定义的图形类型,具体可以参考Shapefile Technical Descrip tion。

每个记录由记录头、记录内容两部分组成。记录头部分由两部分组成: 0~3字节是长整型的记录

数, 4~7字节是记录内容的长度。文件头中的文件长度与记录头中的记录长度均以字( 2 字节)为单

位。记录内容对不同的Shape类型定义不一样,但原理是相同的。因篇幅所限,这里以记录点(point)

类型为例进行说明。点( point)类型的每个记录的记录内容为: 0~3字节长整型的Shape类型、4~11

字节双精度的X坐标、12~19字节双精度的Y坐标。所以记录头中的记录长度就是2 + 4 + 4 = 10个

字长,文件头中文件长度就是50 (文件头长) +总记录数3 14。

表1 . shp文件的文件头结构

位置字段名称数据数据类型字节顺序

0 文件代码9994 32位整型big - endian 4 保留0 32位整型big - endian 8 保留0 32位整型big - endian 12 保留0 32位整型big - endian 16 保留0 32位整型big - endian 20 保留0 32位整型big - endian

24 文件长度文件长度32位整型big - endian 28 版本1000 32位整型little - endian

32 Shape类型Shape类型32位整型little - endian 36 范围框最小X值双精度little - endian 44 范围框最小Y值双精度little - endian 52 范围框最大X值双精度little - endian 60 范围框最大Y值双精度little - endian 68 范围框最小Z值双精度little - endian 76 范围框最大Z值双精度little - endian 84 范围框最小M值双精度little - endian 92 范围框最大M值双精度little - endian 2. 3 . shx文件结构 . shx文件的结构与图1所示的. shp 文件在总体结构上相同,但内容有所区别。文件头的定义与

1shp一致,但文件长度指的是. shx的文件长度,所以这一项的数值是不同的。每1 个记录没有记录

头,内容有2部分组成: 0~3字节表示记录存储位置,以离文件开始处的字数来表示,即50 +记录数

3 14;记录长度,在点(point)类型中为10。2. 4 . dbf文件结构有关描述. dbf文件是Shape文件中的数据存储文件,其

格式是dbase iv的数据文件,具体的格式说明在许多网站都有说明,但在Shape文件中的. dbf有一些特殊的规定。 ①前缀必须与. shp和. shx文件一样。 ②每1个图形特征必须在1个记录内。

③记录的顺序必须与. shp中的记录顺序一样。 ④在. dbf文件头中的年份值是以1900年为基 础的,即其数值表示年份与1900的差。

3 用VB编写直接写Shape文件的方法及代码

在编写程序时要特别注意的是在一般的机器中写文件的字节顺序是little - endian方式,即小的在

低地址,大的在高地址;而big - endian正好相反,所以对big - endian方式的要人为加以转换,本文编写

了little2big( )函来实现。下面是以点类型为例用VB写Shape文件的代 码: txt2 shape ( ) 。

Function little2big ( x1 As Long, myt1 As Byte, myt2 As Byte, myt3 As Byte, myt4 As Byte)

myt1 = Int( x1 / (2 ^ 24) )

myt2 = Int ( ( x1 - ( Int ( x1 / (2 ^24) ) ) 3 2 ^ 24) / (2 ^ 16) )

myt3 = Int ( ( x1 - myt1 3 2 ^24 - myt2 3 2 ^ 16) / (2 ^ 8) )

myt4 = x1 - myt1 3 2 ^ 24 - myt2 3 2 ^ 16 - myt3 3 2 ^ 8 End Function

Private Sub txt2 shape ( )

Dim jdattribute (0 To 100) AsDouble‘定义点位 置的x

Dim wdattribute (0 To 100) As Double‘定义点 位置的y

Dim zmattribute (0 To 100) As String‘定义点位 置名称,如站名

Dim ylattribute (0 To 100) AsDouble‘存点的属 性值,如站点雨量

Dim filelen As Long‘文件长度 Dim records As Long‘记录数 Dim xmin AsDouble‘最小x值 Dim xmax AsDouble‘最大x值 Dim ymin AsDouble‘最小y值 Dim ymax AsDouble‘最大y值

Dim zm AsVariant‘以下为临时变量 Dim temp As String Dim lin0 As Long Dim dblin0 AsDouble

Dim myt1 AsByte‘用于传递转换到big形式的 字节临时变量

Dim myt2 As Byte Dim myt3 As Byte Dim myt4 As Byte

为了减小篇幅,本文省略信息的读入过程,即认

为这些信息已经读到zmattribute ( ) 、jdattribute ( ) 、 wdattribute ( ) 、ylattribute ( ) 、records等数组、变量,直 接从写文件开始。

Open (workfile + \打 开文件,workfile为文件名前缀,下同 ′开始写文件头

filelen = records 3 14 + 50‘算出文件长度

Call little2big ( 9994, myt1, myt2, myt3, myt4) ‘将9994转换成big形式。

Put #5, , myt1′写9994的4 个字节

Put #5, , myt2 Put #5, , myt3 Put #5, , myt4 lin0 = 0

For i = 1 To 5

Put #5, , lin0′写入保留项 Next

Call little2big ( filelen, myt1, myt2, myt3, myt4) ′文件长转到big形式

Put #5, , myt1′写入文件长度转成big后 的4 个字节

Put #5, , myt2 Put #5, , myt3 Put #5, , myt4 lin0 = 1000

Put #5, , lin0′version = 1000 lin0 = 1

Put #5, , lin0′图形类型shape type

开’ 始求xmin, xmax, ymin, ymax。因比较大小比较容易实现,这里略去该部分代码,而认为xmin、

xmax、ymin、ymax已经得到,下面依次写入xmin、ym2in、xmax、ymax。 Put #5, , xmin : Put #5, , ymin : Put #5, ,xmax : Put #5, , ymax dblin0 = 0‘本例zmin、zmax、mmin、mmax为0,下面依次写入 Put #5, , dblin0 : Put #5, , dblin0: Put #5, , dblin0 : Put #5, , dblin0 ′Mmax = 0

For i = 0 To records $ 1‘记录数转换成big形式 lin0 = i + 1

Call little2big ( lin0, myt1, myt2, myt3, myt4 )‘记录数转换成big后的4个字节,下面写入

Put #5, , myt1: Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4 lin0 = 10‘记录内容长度为10

Call little2big ( lin0, myt1, myt2, myt3, myt4) ’ 记录内容长度转换成big后的4个字节

Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3: Put #5, , myt4 lin0 = 1 ’shapetype = 1 : Put #5, , lin0‘写入图形类型shapetype Put #5, , jdattribute ( i) : Put #5, , wdat2tribute ( i) ‘写入位置信息经度和纬度 Next

Close (5)

写’ . shx = = = = = =文件头

Open (workfile + \

写’ 文件头,与. shp 一样,这里略去。要区别的是文件长头长+记录数3 4 For i = 0 To records - 1

lin0 = 50 + 14 3 i ′求记录位置offset

Call little2big( lin0, myt1, myt2, myt3, myt4)

Put #5, , myt1 : Put #5, , myt2: Put #5, ,myt3 : Put #5, , myt4 lin0 = 10 ′记录内容长度

Call little2big ( lin0, myt1, myt2, myt3,myt4)

Put #5, , myt1 : Put #5, , myt2 : Put #5, ,myt3 : Put #5, , myt4 Next

Close (5)

下面开始写. dbf文件. dbf文件的写入有许多的文章均有说明,但要注意 上面2. 4中的几点。另外,. dbf也可以由安装了VF等软件后在VB 中可调用的引用对象来实现,从而减少编程量。

通过上述方法编写完成Shape文件的转换程序后,可以将其作为利用ArcGIS平台开发的基础性工具来使用。

本文来源:https://www.bwwdw.com/article/cjbp.html

Top