天津市文书类电子文件元数据方案.docx
- 文档编号:12540430
- 上传时间:2023-06-06
- 格式:DOCX
- 页数:61
- 大小:34.17KB
天津市文书类电子文件元数据方案.docx
《天津市文书类电子文件元数据方案.docx》由会员分享,可在线阅读,更多相关《天津市文书类电子文件元数据方案.docx(61页珍藏版)》请在冰点文库上搜索。
天津市文书类电子文件元数据方案
天津市文书类电子文件元数据方案
(试行)
天津市电子文件管理联席会议办公室
天津市档案局
2012年11月
一、引言
电子文件的元数据是电子文件在形成、办理、归档、移交和长期保存过程中产生的数据,为了规定文书类电子文件在形成、办理、归档、移交和长期保存过程中需要留存和补充的数据项,特制定本方案,对各单位办公自动化系统的建立和电子文件的管理起到数据规范和指导作用。
二、范围
本方案规定了以文件为单位的文书类电子文件形成、办理、归档、移交和长期保存的元数据项内容,对电子文件全过程管理的元数据设计、捕获和著录提出了一般要求。
本方案与《天津市文书类电子文件数据存储结构要求》(试行)中对元数据的规定相辅相成,互为补充,并将具有共性的元数据内容在移交说明中进行统一描述。
三、规范性引用文件
下列文件中的条款通过引用而成为本标准的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T18894-2002电子文件归档与管理规范
GB/T18793-2002信息技术可扩展置标语言(XML)1.0
DA/T46-2009文书类电子文件元数据方案
DA/T1-2000档案工作基本术语
DA/T18档案著录规则
DA/T22归档文件整理规则
国家档案局令第6号《电子公文归档管理暂行办法》
W3CXMLSchemaPart0:
PrimerXML模式第0部分:
简介
W3CXMLSchemaPart1:
StructuresXML模式第1部分:
结构
W3CXMLSchemaPart2:
DatatypesXML模式第2部分:
数据类型
W3CextensibleMarkupLanguage(XML)1.0(SecondEdition)可扩展置标语言(XML)1.0(第2版)
W3CNamespaceinXMLXML的名字空间(Namespaces)
四、电子文件元数据索引表
本标准参考ISO23081和DA/T46-2009,结合天津市电子文件管理实际,将文书类电子文件元数据从概念层次上区分为文件实体元数据、机构人员实体元数据、业务实体元数据、实体关系元数据四个域,规定了每个域包含的元数据元素及其结构,来源、内容描述、形式特征、权限管理、存储位置、电子属性、数字化属性、数字化属性、电子签名等容器型元数据,仅对元数据进行分类表述。
电子文件元数据结构如下:
电子文件元数据索引表
层次描述
编号
元素
编号
元素
备注
文件实体
M1
来源
M2
全宗名称
M3
立档单位名称
M4
电子文件号
M5
档号
M6
组织机构代码
M7
全宗号
M8
保管期限
M9
年度
M10
机构/问题
M11
盒号
M12
件号
M13
内容描述
M14
题名
M15
并列题名
M16
主题词或关键字
M17
人名
M18
摘要
M19
分类号
M20
文件编号
M21
责任者
M22
日期
M23
文种
M24
主送
M25
抄送
M26
密级
M27
保密期限
M28
附注
M29
形式特征
M30
页数
M31
语种
M32
稿本类型
M33
稿本文件名
M34
稿本文件大小
M35
权限管理
M36
控制标识
M37
存储位置
M38
脱机载体编号
M39
脱机载体存址
M40
缩微号
M41
电子属性
M42
格式信息
M43
信息系统描述
M44
数字化属性
M45
数字化对象形态
M46
扫描分辨率
M47
扫描色彩模式
M48
图像压缩方案
M49
电子签名
M50
签名规则
M51
签名时间
M52
签名人
M53
签名结果
M54
证书
M55
证书引证
M56
签名算法标识
机构人员实体
M57
机构人员类型
M58
机构人员名称
业务实体
M59
业务行为
M60
行为时间
M61
行为依据
实体关系
M62
实体标识符
M63
关联文件
五、元数据的描述方法
本标准参考ISO11179.3:
2003和DA/T46-2009,采用表2所示方法对元数据元素进行描述。
本标准所描述的中文字符集:
GB2312-1980、GB18030-2005;
表2元数据元素描述方法
编号
按一定规则排列的元数据的顺序号
中文名称
元数据元素的中文标识
英文名称
元数据元素的英文标识
定义
元数据元素含义的描述
目的
描述该地数据元素的必要性和作用
约束性
说明采用该元数据元素的强制性程度,分“必选”、“条件选”和“可选”。
“必选”表示总是强制采用;“条件选”表示在特定环境和条件下必须采用;“可选”表示可采用也可不采用,由用户根据需要确定
可重复性
元数据元素是否可以重复出现
元素类型
元数据元素所属的类型,本标准将元素分为简单型、容器型和复合型
数据类型
为表达元数据元素值而规定的具有相同数学特性和相同操作集的数据类别。
本标准数据类型包括字符型、数值型、日期时间型。
容器型元素没有数据类型
值域
可以分配给元数据元素的值
缺省值
该元数据元素的默认值
著录信息源
元数据元素值的来源
著录细则
元数据元素值的著录细则
注释
对元素的进一步说明
六、元数据描述
1.来源
编号
M1
中文名称
来源
英文名称
provenance
定义
对形成、归档、移交、保管电子文件的单位(个人)和全宗的描述
目的
提供电子文件的背景信息,利于对电子文件的理解、管理和利用
约束性
必选
可重复性
不可重复
元素类型
容器型
数据类型
—
值域
—
缺省值
—
著录信息源
—
著录细则
—
注释
—
2.全宗名称
编号
M2
中文名称
全宗名称
英文名称
fondsname
定义
档案馆(室)赋予全宗的标识
目的
区分电子文件来源,利于电子文件的管理、提供检索
约束性
条件选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
形成、处理、管理电子文件的系统中通过预定义值域列表选择著录或手工著录
著录细则
—
注释
—
3.立档单位名称
编号
M3
中文名称
立档单位名称
英文名称
fondsconstitutingunitname
定义
构成档案(电子文件)全宗的国家机构、社会组织或个人的名称
目的
记录全宗构成者名称,明确电子文件来源,利于电子文件的管理和利用
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
在形成、处理、管理电子文件的系统中通过预定义值域列表选择著录或手工著录
著录细则
—
注释
按照DA/T14-1994中5.1.1条规定著录。
推荐使用预定义值域列表选择著录
4.电子文件号
编号
M4
中文名称
电子文件号
英文名称
electronicrecordcode
定义
唯一标识电子文件的ID号
目的
为稿本提供唯一标识,在电子文件之间、电子文件与机构人员、业务时间、业务行为之间提供关联标识
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
不能为空值
著录信息源
来源于产生、处理、管理电子文件的信息管理系统
著录细则
由系统按照既定规则生成
注释
电子文件号应具备语义,一般由机构代码和系统赋予的唯一标识组成,应保证唯一性和稳定性。
原则上一条档案目录下带有多少个电子原文,就应具有多少个电子文件号,并通过电子文件号可以与稿本、机构人员、业务行为、业务时间等进行相关联系;电子文件号应随稿本文件的产生而产生,并随稿本文件进行记录,多个稿本文件时电子文件号之间用“;”(半角)分开
5.档号
编号
M5
中文名称
档号
英文名称
archivalcode
定义
以字符形式赋予档案(电子文件)的用以固定和反映档案(电子文件)排列顺序的一组代码
目的
揭示电子文件分类、排列、编目的结果,利于管理、统计和利用,在电子文件与其传统载体档案之间提供关联标识
约束性
必选
可重复性
不可重复
元素类型
复合型
数据类型
字符型
值域
—
缺省值
不能为空值
著录信息源
由形成、处理、管理电子文件的信息管理系统按照既定规则生成,应保证唯一性和稳定性
著录细则
档号编码规则:
组织机构代码-全宗号-保管期限代码-年度-机构/问题代码-盒号-件号。
档号的生成要求由各个组成项自动合成,即系统既要保留完整的档号,还要保留生成档号的各个分项。
其中全宗号、年度由系统自动或通过选择确定,保管期限代码根据保管期限的永久、定期分别表示为Y或定期时间;归档机构代码根据归档机构的编码规则产生,根据文件形成部门机构编码方案,可形成归档机构代码。
将全宗内归档机构代码表嵌入产生、处理电子文件的原始信息系统,在文件生成时由计算机自动匹配或者由用户选择归档机构代码,禁止用汉字标注。
件号则在确定的编码规则下统一编制,由系统自动生成。
各组成项的长度设定及举例:
组织机构代码:
9位阿拉伯数字或英文字母及组合,如000125356;全宗号:
5位阿拉伯数字或英文字母及组合,如X0061;保管期限代码:
2位阿拉伯数字或英文字母,永久由字母YJ表示,定期分为10年、30年,分别用10、30表示,或者其它表示时间长度的数值,如5年用05表示;年度:
4位阿拉伯数字,如2011;机构/问题代码:
3位的阿拉伯数字或字母,如001;盒号:
4位阿拉伯数字,如0012;件号:
5位阿拉伯数字,如00123。
完整的档号中应不包含汉字,用各个组成项的预设的代码组成,各个组成项中可以保存汉字描述,如组织机构代码在档号中用001表示,在分项中保留其对应的汉字,如办公室;如问题在档号中用“001”表示,在分项中对应为“党群问题”
注释
档号在系统中应具有唯一性
6.组织机构代码
编号
M6
中文名称
组织机构代码
英文名称
organizationcode
定义
由国家组织机构代码管理中心为在中华人民共和国境内依法成立的机关、企业、事业单位、社会团体和民办非企业单位等机构赋予的一个全国范围内惟一的、始终不变的法定代码标识
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理、管理电子文件的信息管理系统,在移交时由移交电子文件系统捕获
著录细则
通过预定义值域著录或手工著录,每个单位具有唯一的组织机构代码,根据机构编码方案产生
注释
组织机构代码为9位的阿拉伯数字或英文字母的组合
7.全宗号
编号
M7
中文名称
全宗号
英文名称
fondsidentifier
定义
档案馆(室)分配给全宗的代码
目的
标识全宗,利于电子文件的管理和利用
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
在形成、处理、管理电子文件的系统中通过预定义值域列表选择著录或手工著录
著录细则
—
注释
全宗号一般由接收、保管电子文件的档案馆(室)给定,当给定全宗号时,本元素必选。
推荐使用预定义值域列表选择著录;
8.保管期限
编号
M8
中文名称
保管期限
英文名称
retentionperiod
定义
经鉴定后划定的电子文件的存留年限。
目的
标识电子文件保存期限,利于电子文件的管理、鉴定和统计
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
永久、定期(短期、30年、10年、【其它】)
缺省值
—
著录信息源
在电子文件处理过程中需要初次鉴定,在捕获处理、保管处置过程中都需要进行鉴定,确认存留年限。
著录细则
定期可以分为30年、10年和其它,在档号中用字母或数字表示,永久为YJ,30年为30,10年为10,在元数据项中著录汉字描述
注释
值域中列出的是《国家档案局关于机关档案保管期限的规定》(国档发﹝1987﹞27号)和《机关文件材料归档范围和文书档案保管期限规定》(国家档案局令第8号)规定的保管期限。
值域中的“[其他]”表示值域中所列保管期限外的其他保管期限,由用户结合实际自定义形成,如有特殊规定,依规定执行
9.年度
编号
M9
中文名称
年度
英文名称
year
定义
电子文件按年度分类后标记的形成处理年度
目的
标识电子文件年度,利于电子文件的管理和利用
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
数值型
值域
—
缺省值
—
著录信息源
在形成、处理、管理电子文件的系统中通过预定义值域列表选择著录或手工著录
著录细则
4位阿拉伯数字,如2011
注释
—
10.机构或问题
编号
M10
中文名称
机构或问题
英文名称
organizationalstructureorfunction
定义
对电子文件进行实体分类整理时按部门或问题分类的结果
目的
区分电子文件类别,利于电子文件的管理、提供检索
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
在电子文件归档管理系统中,通过列表选择或手工著录
著录细则
按实体分类整理时的部门或问题进行著录,在档号中以代码的形式存在,在著录项中以文字描述的形式存在。
如档号中用“001”表示,在机构或问题元数据项中用“办公室”或“党群问题”表示。
注释
—
11.盒号
编号
M11
中文名称
盒号
英文名称
boxnumber
定义
电子文件所对应实体档案的盒顺序号
目的
标识电子文件所属档案盒,利于电子文件和实体档案的关联
约束性
条件选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
在管理电子文件的系统中手工著录
著录细则
—
注释
若档案整理模式为订卷的形式,此值可以用于记录案卷号信息
12.件号
编号
M12
中文名称
件号
英文名称
agencyitemnumber
定义
编制的文件或组合文件的排列顺序号
目的
标识电子文件排列顺序,利于电子文件的管理和利用
约束性
条件选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
在形成、处理、管理电子文件的系统中手工著录
著录细则
—
注释
—
13.内容描述
编号
M13
中文名称
内容描述
英文名称
contentdescription
定义
对电子文件题名、主题、编号等内容特征的描述
目的
提供电子文件内容描述信息,利于检索和利用
约束性
必选
可重复性
不可重复
元素类型
容量型
数据类型
—
值域
—
缺省值
—
著录信息源
—
著录细则
—
注释
—
14.题名
编号
M14
中文名称
题名
英文名称
title
定义
又称标题,文件标题,是表达归档电子文件中心内容和形式特征的名称。
目的
描述电子文件的中心内容,提供检索
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
不能为空值
著录信息源
来源于产生、处理电子文件的信息管理系统
著录细则
在文书处理过程中由创建者或处理人员手工著录
注释
—
15.并列题名
编号
M15
中文名称
并列题名
英文名称
paralleltitle
定义
解释或从属于题名和另一题名
目的
利于通过题名的解释文字或从属信息进一步了解文件
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理电子文件的信息管理系统
著录细则
在文书处理过程中由创建者或处理人员手工著录
注释
—
16.主题词或关键词
编号
M16
中文名称
主题词或关键词
英文名称
DescriptorORkeyword
定义
在标引和检索上用以表达电子文件主题的规范化的词或词组,取自电子文件题名或正文
目的
揭示电子文件主题,提供检索
约束性
可选
可重复性
可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理电子文件的信息管理系统或归档后的档案管理系统
著录细则
根据题名的内容,由系统自动进行主题词的提取
注释
主题词建议选择相关的编码体系,例如《档案主题词表》等,关键词则可以是任何词或词组组成
17.人名
编号
M17
中文名称
人名
英文名称
personalname
定义
文件内容中涉及的具有检索意义的人物姓名
目的
提供检索
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理电子文件的信息管理系统或归档后的档案管理系统
著录细则
手工著录或系统捕获
注释
当涉及到多个人名时用相关标识符分开,如空格或逗号等
18.摘要
编号
M18
中文名称
摘要
英文名称
abstract
定义
对电子文件核心内容的简短陈述。
目的
提供电子文件简要信息,利于在短时间内了解文件内容
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于形成、处理、管理电子文件的原始信息系统或档案管理系统
著录细则
需要在公文处理过程中由文件创建者或归档后由档案管理人员手工著录或系统捕获
注释
—
19.分类号
编号
M19
中文名称
分类号
英文名称
classcode
定义
采用《中国档案分类法》对电子文件进行主题分析,并依照电子文件的内容和特点分门别类后形成的类目标记符号
目的
揭示电子文件的分类结果,提供检索
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于形成、处理、管理电子文件的原始信息系统或档案管理系统
著录细则
列表选择或手工著录
注释
—
20.文件编号
编号
M20
中文名称
文件编号
英文名称
documentnumber
定义
文件制发过程中由制发机关、团体或个人赋予的文件的顺序号,也称文号
目的
提供检索
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于在形成、处理、管理电子文件的信息管理系统
著录细则
文件编号由产生、形成、处理电子文件的信息管理系统自动生成或手工著录,建议由系统按照既定规则自动生成
注释
一般发文为发文编号,其他遵照有关系统的系列编号或文件的实际编号。
21.责任者
编号
M21
中文名称
责任者
英文名称
author
定义
对电子文件内容进行创建、负有责任的团体或个人。
目的
明确电子文件的责任主体,提供检索
约束性
条件选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于形成、处理、管理电子文件的信息管理系统,发文时可取自电子文件管理系统中的印发机关一致
著录细则
发文:
电子文件主要创建者往往指本单位,可以由系统自动生成。
收文:
需要在文书处理过程中由创建者或处理人员手工著录
注释
责任者往往指文件的形成单位
22.日期
编号
M22
中文名称
日期
英文名称
date
定义
文件形成的日期
目的
明确文件形成时间,提供检索
约束性
必选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
时间项用8位阿拉伯数字表示,第1-4位数表示年,第5-6位数表示月,第7-8位数表示日
缺省值
—
著录信息源
来源于形成、处理和管理电子文件的信息管理系统
著录细则
采用YYYYMMDD的格式著录,如19850810
注释
—
23.文种
编号
M23
中文名称
文种
英文名称
documenttype
定义
按性质和用途确定的文件种类的名称
目的
揭示文件的性质、特点,反映行为方向,表达目的与要求
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
决议、决定、命令、公报、公告、通告、意见、通知、通报、报告、请示、批复、议案、函、纪要、【其它】。
缺省值
—
著录信息源
来源于产生、处理、管理电子文件的信息管理系统。
著录细则
文种由公文处理人员依据文件生成时的属性信息通过预定义值域列表选择著录或手工著录。
注释
—
24.主送
编号
M24
中文名称
主送
英文名称
principalreceiver
定义
文件的主要受理者,一般为文件内容规定任务的主要执行者。
目的
说明电子文件的发送对象,提供检索
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理、管理电子文件的信息管理系统
著录细则
产生、处理、管理电子文件的信息管理系统可以预先设置相关的文件执行者单位编码表,在文书处理过程中选择生成或手工著录
注释
—
25.抄送
编号
M25
中文名称
抄送
英文名称
Otherreceivers
定义
除主送者以外需要执行或知晓文件的其他受文者。
目的
说明电子文件的发送对象,提供检索
约束性
可选
可重复性
不可重复
元素类型
简单型
数据类型
字符型
值域
—
缺省值
—
著录信息源
来源于产生、处理、管理电子文件的信息管理系统
著录细则
产生、处理、管理电子文件的信息管理系统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 天津市 文书 电子 文件 数据 方案