本标准是地震科学数据系列标准的第5.docx
- 文档编号:10217180
- 上传时间:2023-05-24
- 格式:DOCX
- 页数:39
- 大小:40.62KB
本标准是地震科学数据系列标准的第5.docx
《本标准是地震科学数据系列标准的第5.docx》由会员分享,可在线阅读,更多相关《本标准是地震科学数据系列标准的第5.docx(39页珍藏版)》请在冰点文库上搜索。
本标准是地震科学数据系列标准的第5
(征求意见稿)
(本稿完成日期:
2006年11月20日)
地震科学数据 数据交换格式
Earthquake-relatedscientificdata
-formatsfordataexchange
中国地震局发布
××××-××-××实施
××××-××-××发布
EDS/Tx—2006
目次
前言II
1范围3
2术语和定义3
3概述4
4地震数据交换基本格式4
5地震数据交换辅助格式14
前言
本标准是《地震科学数据》系列标准的第5项标准,该系列标准的预计结构为:
——地震科学数据元数据编写指南;
——地震科学数据数据模式编写指南;
——地震科学数据数据库建库指南;
——地震科学数据数据元目录
——地震科学数据数据交换格式
——地震科学数据数据分类与编码
——….
本标准起草单位:
中国地震台网中心、中国地震局地球物理研究所。
本标准主要起草人:
赵仲和周克昌黄志斌杨辉顾左文吴敏赵宇彤代光辉冯义钧纪寿文田丰
地震科学数据 数据交换格式
范围
本标准规定了在地震科学数据共享项目框架内的数据交换格式。
本标准适用于地震科学数据共享中心、分中心(节点)向用户提供数据服务(如数据下载)采用的数据格式。
地震科学数据共享中心和地震科学数据共享分中心(节点)之间的相互数据交换,地震科学数据共享中心、分中心与其他科学数据共享中心的数据交换也可采用本标准中规定的格式。
术语和定义
本标准采用下列术语和定义
11.1
数据元dataelement
通过定义、标识、表示、允许值等一系列属性描述的一个数据单元。
11.2
聚合数据元aggregatedataelement
由两个或两个以上的具有相互关联的数据元组成的数据单元,用来表达特定语境中的一个清晰的业务含义。
11.3
数据类型datatype
值域说明,允许对该值域内的值进行操作。
如:
string、decimal、integer、boolean、date和binary。
11.4
数据交换格式datainterchangeformat
一个预定义和结构化的、在功能上相互关联的聚合数据元或数据元的集合,它涵盖在科学数据共享活动中对某类交换数据的共享要求,旨在双边或多边的数据交换中确保各方对所交换数据的无歧义理解和自动处理。
11.5
XML模式XMLSchema
基于W3CXML模式语言的文档类型定义。
它可随附于一个文件,用以描述该文件的基本构成规则,如哪些元素会出现及这些元素之间的结构关系等;它还定义了哪些标记可以在文件中出现、哪些标记可以包含其他标记、标记的号码和顺序、标记的属性,需要时还给出这些属性具有的值。
11.6
纯文本文件text-onlyfile
一种使用ASCII(美国国家标准信息交换代码)格式的文档文件,其中包含各种有关的字符、空格符、标点符号、回车符,有时还包括制表符和文件结束符等,但不包含格式化信息。
11.7
位图bitmap
位映像
存储器中的一种数据结构,它以单个位的集合形式表示信息。
位图用于表示位图像(bitimage)。
用文件扩展名·bmp标识以位图(bitmap)文件格式存储的光栅图形(rastergraphics)。
11.8
位图像bitimage
位的有序集合,代表要显示在屏幕上的一个图像。
在位图像中,每一位对应于屏幕上的一个像素(点)。
在彩色显示器上,屏幕上位的描述称作像素图像,因为每个像素需要多位来表示。
黑白图像中只用一位表示(0或1)。
11.9
标记图像文件格式TaggedImageFileFormat
一种标准文件格式,常用于灰度级图形化图像的扫描、存储和交换。
缩略语为TIFF,也称TIF。
相应文件的扩展名为·tif或·tiff。
加上了图形四角地理坐标信息的TIFF文件称GeoTIFF格式。
11.10
超文本置标语言HypertextMarkupLanguage
缩略语为HTML,是万维网(WorldWideWeb)的文档中使用的语言。
它是基于标记的记法语言,用于使文档格式化,以便由因特网上浏览器去解释其中的含义和移交给其他用户。
HTML使用标记对文档中的诸如文字、图形等元素做出标志,用以指示Web浏览器如何显示这些元素以及如何响应用户的动作(如通过按键或点击鼠标来启动一个链接)。
HTML文件的扩展名是·html,最常用作为Web页文件的扩展名。
在MS—DOS与微软的Windows3.x系统中不能识别多于3个字符的扩展名,故在这种环境下·html被截成·htm。
11.11
地震前兆数据observationdataforearthquakeprecursor
本标准中专指附录A中列出的各种观测数据。
概述
地震数据交换格式分为基本格式和辅助格式两类。
基本格式是不依赖于具体观测系统、不依赖于特定计算机和操作系统的数据交换格式,而且应该是自足式的,即在用于交换的数据文件中包含了用户在使用文件中的数据时需要的全部信息。
用户或者完全不需要从其他来源获取辅助信息,或者可以根据文件中指出的参考信息方便地从指定信息源得到所需信息。
在数据共享的实际情况中,许多时候出于对使用效率、传输效率和存储效率的考虑以及其他因素,用户往往宁愿采用不具备上述基本格式条件的其他格式。
在本标准中称其为辅助格式。
辅助格式是基本格式的一种补充。
地震数据交换基本格式
11.12 空间矢量数据
格式要求
空间矢量数据由几何图形数据和属性数据组成,两者通过目标标识码(关键字)连接,即具有相同目标标识码的几何图形数据和属性数据是对同一空间对象的描述。
任一几何对象采用的属性数据结构可通过在几何对象上添加要素类型编码来说明。
空间矢量数据的交换格式遵循GB/T17798——1999《地球空间数据交换格式》(已于2005年进行了修订,但尚未见到修改后的文本)。
空间矢量数据交换文件由六部分组成:
第一部分为文件头,它包含了该文件的基本特征数据,如图幅范围、坐标维数、比例尺等;第二部分为要素类型参数;第三部分为属性数据结构;第四部分为几何图形数据;第五部分为注记;第六部分为属性数据。
根据GB/T17798——1999《地球空间数据交换格式》,所有数据写在一个文件内,第一步采用纯文本格式,待条件成熟后增加二进制格式及相关的API接口规范。
11.13 格网数据
格式要求
格网数据交换格式遵循GB/T17798——1999《地球空间数据交换格式》(已于2005年进行了修订,但尚未见到修改后的文本)。
格网的值是该格网的要素类型编码或高程。
数据文件包含两部分:
文件头和数据体。
文件头的信息分两类:
基本的且必须的信息和扩充的附加信息。
扩充部分可以省略。
格网数据的存贮采取从北到南,从西到东的顺序,并以纯文本存贮。
11.14 影像数据
格式要求
遵循GB/T17798——1999《地球空间数据交换格式》(已于2005年进行了修订,但尚未见到修改后的文本)。
影像数据的交换格式,原则上采用国际工业标准无压缩的TIFF或BMP等格式(参见附录E),但需将大地坐标在影像上的定位信息以及像素的地面分辨率等信息添加到TIFF或BMP等文件上。
附加的信息用纯文本格式另写一个文件,不应破坏原有TIFF或BMP等格式。
附加的信息分两类:
基本的且必须的信息和扩充的附加信息。
扩充部分可以省略。
11.15 等间隔时间序列
格式要求
等间隔时间序列是对一个连续变化的量按固定采样间隔采样得到的一组数据。
等间隔时间序列的数据文件通常包括两部分。
第一部分是文件头,包含关于该时间序列的信息,必须有的信息是该时间序列的起始时间、采样间隔(或采样率)、数据点数以及时间序列本身的数据格式(说明是ASCII码,还是二进制格式,以及字长等),通常以ASCII编码给出;第二部分是时间序列本身,按时间顺序排列,一般为二进制格式,如果数据量较少,也可用ASCII格式。
如果是多通道采集的数据,可有两种方式。
一是分别形成数据文件,其格式如上述。
另一种方式是构成MxN矩阵,M是通道数,N是每道的数据点数。
用于数字地震波形数据的SEED格式
数字地震波形数据是使用测震仪器在某一地点进行等时间间隔采样得到的时间序列数据。
SEED(TheStandardfortheExchangeofEarthquakeData)格式是一个针对数字地震波形数据交换的国际通用格式。
我国地震行业标准《地震波形数据交换格式》(DB/T2-2003)修改采用这一标准。
连续数字波形数据
连续数字波形数据是指按一定采样率持续采样获取的数字地震波形数据。
可根据指定的起始时间和数据长度(或终止时间)截取一段数据。
被截取的数据段以完整的SEED格式作为进行数据交换的基本格式。
可选格式包括SEED格式标准中包含的“纯数据格式(MiniSEED)”。
事件数字波形数据
事件数字波形数据是由地震台网中心认定的地震事件的波形数据,由事件前背景噪声段、事件本身波形数据以及事件后背景噪声段构成。
事件波形数据宜以该事件的标识符作为文件名的组成部分,供用户识别。
事件波形数据文件名的约定见附录A。
事件波形数据以完整的SEED格式作为进行数据交换的基本格式。
可选格式包括SEED格式标准中包含的“纯数据格式(MiniSEED)”。
用于强震观测数据的数据交换格式
原始记录加速度数据
文件内容包括两部分。
第一部分为文件头,依次给出加速度记录编号、地震编号、地震描述、台站描述、观测点描述及观测分量。
例:
1A02-003
76.001TANGSHANEARTHQUAKEJULY28,1976.03:
42M=7.9
STATIONNO.01001BEIJINGHOTEL
POINT1BASEMENTCOMP.UD
408860.1144400.368637016.8143500.0794181
第二部分是未校正的加速度记录数据。
例:
.000000-.002611.016139.003888.026226-.008460.040347.003888
.050434-.033804.068590-.023407.078677-.033804.098850-.003261
.114989.013635.131127-.000661.147266-.022107.163405.006487
.179543.039630.195682.041579.211464.089019.235128.122162
………
校正后的加速度数据
文件内容包括两部分。
第一部分为文件头,依次给出加速度记录编号、地震编号、地震描述、台站描述、仪器描述、观测点描述、观测分量、数据内容(这里指出是校正后的加速度)以及关于数据本身的说明信息(如数据的单位、数据点数、采样间隔、有效频带、峰值值及相应时刻、数据持续时间。
例:
TS01-003
76.001JULY28,1976.03:
42
TANGSHANEARTHQUAKEHEBEI,CHN
EPICENTER39.63N118.18E
DEPTH11KM
M=7.8
STATION(01001)BEIJINGHOTEL39.907N116.404E
INSTRUMENTTYPE:
RDZ1
OBSERVINGPOINT:
BASEMENT
COMP.UD
CORRECTEDACCCELERATIONUNIT:
CM/SEC/SEC
NO.OFPOINTS:
5993EQUALLYSPACEDINTERVALSOF.01SEC
EFFECTIVEFREQUENCYBAND:
.30--35.00HZ
PEAKVALUE:
34.992AT16.820SECDURATION:
59.930SEC
第二部分是校正后的加速度波形数据。
例:
-.6934-.9333-1.0898-.7773-1.5286-3.6006-4.0552-3.4690
-3.7778-2.8350-.8401-.2383-.3784-1.1326-2.6008-2.6807
-.91021.29522.70953.19704.68047.54229.610410.3765
9.68586.69733.22361.3567.6699.99341.6455.1514
校正后的速度数据
文件格式与校正后的加速度数据文件格式(见4.4.3.2)相同,只是在数据内容一项中指出是校正后的速度(标为CORRECTEDVELOCITY)。
校正后的位移数据
文件格式与校正后的加速度数据文件格式(见4.4.3.2)相同,只是在数据内容一项中指出是校正后的位移(标为CORRECEDDISPLACEMENT)。
地震测深数据交换的基本格式
地震测深数据是等间隔采样的时间序列,但需要提供完整的辅助信息,数据才能得到正确使用。
本格式是基于美国地质调查局(USGS)采用的格式(见表1),是纯文本文件。
表1USGS地震测深数据文件格式
逻辑记录号(512字节)
变量名
长度(2字节)
说明
1
TIT(J)=1,2,…,20
40
80个字符,本文件的附加说明,测线或所在地区的名字
MSAMP
1
采样点数/CH(4001)
NSRATE
1
采样间隔(ms)
MREC
1
文件包含地震记录的总道数(≤150)
MAXR
1
最大记录道数(=150)
ITMIN
1
采样起始折合时间
VREDUC
2
折合速度(公里/秒)
IHEAD(1,I)
IHEAD(2,I)
300
采样编号(ID)与测点编号(ID)I=1,2,3,……,150
2
IDB(I)
150
衰减档(I=1,2,…,150)
ICHANL(I)
150
通道号(与放大倍数有关)
3
RDIST(I)
300
测点震中距(公里)
4
AZ(I)
300
测点方位角
4
NSP
1
测线上炮点总数
ISP
1
炮点编号
NSIZE
1
炸药量(千克)
IDSHOT
1
爆破类型代号
ISITE
1
炮点岩性代号
NELEV
1
炮点高程(米)
JMONTH
1
起爆时间:
月
JDAY
1
日
JHR
1
时
JMIN
1
分
DSEC
2
秒
JYEAR
2
年
LASD
1,2
炮点经度=LASD(度)+ALASM(分)
ALASM
LASD
1,2
炮点纬度=LASD(度)+ALASM(分)
ALASM
(NONE)
14
空
6~
依次存放各记录道波形采样数据,各道数据首尾相连,无空格。
每道记录长度为4001点。
11.16 自由间隔时间序列
格式要求
自由间隔时间序列是对一个连续变化的量按不固定的采样间隔采样得到的一组数据,或者针对不等时间间隔的时间点形成的数据序列。
因此,每一个数据点必须伴随一个相应的时刻。
不等间隔时间序列的数据文件通常包括两部分。
第一部分是文件头,包含关于该时间序列的信息,必须有的信息是该时间序列的起始时间、数据点数以及时间序列本身的数据格式(说明是ASCII码,还是二进制格式,以及字长等),通常以ASCII编码给出;第二部分是时间序列本身,按时间顺序排列,构成2xN矩阵,一列是绝对时间或自起始时间算起的相对时间,另一列是对应的采样数据,一般为二进制格式,如果数据量较少,也可用ASCII格式。
如果是多通道采集的数据,可选用两种方式之一。
一是分别形成数据文件,其格式如上述。
另一种方式是构成(M+1)xN矩阵,M是通道数,N是每道的数据点数,矩阵的第1列是时间,其余M列是对应的M道数据。
等间隔时间序列是自由间隔时间序列的子集。
等间隔时间序列可以按自由间隔时间序列的格式提供数据文件,但对于数据量大的等间隔时间序列,宜采用4.4节所述格式。
用于地磁观测数据的数据交换格式
用于地磁观测数据的数据交换格式是一种自由间隔时间序列数据交换格式。
用于地磁台站观测数据的IAGA格式
地磁台站观测数据采用国际通用的IAGA2001标准格式(见附录C)。
例:
FormatIAGA2001|
SourceofDataGeomagneticStormBasicData()|
StationNameBJI|
StationCODEBJI|
GeodeticLatitude116.2°E|
GeodeticLongitude40.0°N|
Elevation69.0(m)|
ReportedHDZ|
DataTypeDefinitive(最终结果)|
DownloadforHourlyValues|
Start2004-1-1|
End2004-1-16|
#|
#TheunitofX,Y,F,HandZisnT,theunitofD(磁偏角)andI(磁倾角)isminute.|
#|
#Thesymbolof'1'formeansofseason(季均值)indicatethatthefollowing|
#databelongtoJan.,Feb.,Dec.andNov.|
#Thesymbolof'2'formeansofseasonindicatethatthefollowing|
#databelongtoMar.,Apr.,Spt.andOct.|
#Thesymbolof'3'formeansofseasonindicatethatthefollowing|
#databelongtoMay,Jun.,Jul.andAug.|
#Thesymbolof'4'formeansofseasonindicatethatthefollowing|
#databelongtothe12manthsoftheyear.(年均值)|
#|
#Thesymbolof'Q'formeansofseasonormonthindicatethatthe|
#followingdatabelongto'QuietDay'(静日)|
#Thesymbolof'D'formeansofseasonormonthindicatethatthe|
#followingdatabelongto'DisturbedDay'(扰日)|
#Thesymbolof'A'formeansofseasonormonthindicatethatthe|
#followingdatabelongto'AllDay'(通日)|
#|
DATETIMEBJIDBJIHBJIZ
01/01/200400:
00:
00-379.22914846833
01/01/200401:
00:
00-379.22913746830
01/01/200402:
00:
00-3812912146828
01/01/200403:
00:
00-382.32912546826
……
用于磁暴数据的数据交换格式
磁暴数据以ASCII编码的文本格式给出。
数据文件包含两部分。
第一部分是文件头,是对数据的注释,给出对数据内容和格式的表述。
每行以“#”号开头,以“|”结尾。
第二部分是数据内容,每行为一组数据。
每组数据中各数据项的具体格式见表2。
一行中各项以“,”号分隔,结尾是换行符。
表2磁暴数据的数据项格式
序号
名称
格式
举例
备注
1
起始日期
YYYY-MM-DD
2000-1-27
公元纪年和世界时(UT)
2
台站代码
3个字符
QGZ
3
起始时间
HH:
MM
14:
53
4
结束日期和时间
MM-DDHH
01-2900
5
起始类型
最多3个字符
SC
SC:
急始型;SC*:
带负脉冲的急始型;GC:
缓始型
6
组合磁暴标志
1个字符
N
Y:
是;N:
否
7
D分量急始变幅
数值
.1
8
H分量急始变幅
数值
32
9
Z分量急始变幅
数值
11
10
活动程度
最多3个字符
M
S:
小;M:
中;MS:
强
11
K指数表证的最大活动程度的时期
MM-DD
01-28
12
3小时时效
4个整数
1---
13
K指数
1个整数
05
14
D分量变化范围
数值
6.3
15
H分量变化范围
数值
110
16
Z分量变化范围
数值
55
17
Dst指数
3个整数
-42
例:
(文件头略)
2000-1-27,QGZ,14:
53,01-2900,SC,N,.1,32,11,M,01-28,1---,05,6.3,110,55,-42
2000-1-27,YON,14:
53,01-2900,SC,N,.2,35,1,M,01-28,1---,05,6.5,114,55,-42
2000-1-27,THJ,14:
53,01-2900,SC,N,.4,34,-4,M,01-28,1---,05,7.6,118,44,-42
2000-1-27,QZH,14:
53,01-2900,SC,N,.3,31,4,M,01-28,1---,05,5.4,108,30,-42
用于地震前兆观测数据下载的文件格式
地震前兆观测数据属于自由采样间隔时间序列,用户下载的数据文件为纯文本文件,其中使用简体中文,具体格式如下:
文件类型代码
应用保留字符串
文件内容描述
列数
台站代码1(测项分量代码1),数据起始行号,数据简要描述,采样率代码,列号,数据起始时间,数据结束时间,最大值,最小值
台站代码2(测项分量代码2),数据起始行号,数据简要描述,采样率代码,列号,数据起始时间,数据结束时间,最大值,最小值
...
数据总行数
台站代码,测点编码,测项分量代码,数据日期时间,数据值1,数据值2...
...
其中,“文件类型代码”的含义是:
1-等间隔时间序列数据;2-不等间隔时间序列数据;3-非时间序列数据;“数据起始行号”指出该台项数据从第几行开始,0表示从第一行开始;“数据简要描述”描述数据的处理情况,如“原始数据”、“3点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 标准 地震 科学 数据 系列