DB37/T 536-2005
档案目录数据采集规范
2005-02-07发布 2005-02-10实施
山东省质量技术监督局 发布
前 言
档案目录数据采集规范是建立健全统一、高效的档案计算机检索体系的重要前提和条件。为加强档案信息资源建设,规范各级综合档案馆(室)档案目录数据库,保证我省档案信息化建设沿着正确的方向顺利推进,特制定本规范。
本标准是根据GB/T 3792.1-1983《文献著录总则》、DA/T 18-1999《档案著录规则》的原则,结合我省档案信息化建设的实际情况,按照GB/T1.1-2000《标准化工作导则 第1单元:标准的起草与表述规则 第1部分:标准的编写的基本规定》制定的。本规范具有以下特点:实现了计算机行业术语与档案行业术语的有机结合;规定了档案目录数据交换的格式、数据结构及要求;对目录数据字段采集规则做了必要的细化。
本标准由山东省档案局提出。
本标准由山东省档案局负责起草。
本标准主要起草人:王雁平 郭志敏 刘虎。
档案目录数据采集规范
范围
本标准规定了档案目录数据库结构、档案目录数据字段著录细则和档案目录数据交换格式。
本标准适用于本省综合档案馆、档案室建立档案目录数据库。对于某些内容和形式极其特殊的档案,可遵照本标准制定细则。
本标准亦可作为编制相关档案管理软件、档案全文数据库和多媒体数据库的目录管理系统的参考。
规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可适用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 1988-1989 信息处理 信息交换用7位编码字符集
GB 2312-1980 信息交换用汉字编码字符集 基本集
GB 3469-1983 文献类型与文献载体代码
GB/T 7156-2003 文献保密等级代码
GB/T 7408-1994 数据元和交换格式 信息交换 日期和时间表示法
GB/T 15418-94 档案分类标引规则
DA/T 1-2000 档案工作基本术语
DA/T 13-94 档号编制规则
DA/T 18-1999 档案著录规则
DA/T 19-1999 档案主题标引规则
DA/T 22-2000 归档文件整理规则
国家档案局 编制全国档案馆名称代码实施细则
术语和定义
下列术语和定义适用于本标准。
3.1 档案目录数据库
是将描述档案內容和形式特征的数据按一定格式存入计算机存储器所形成的数据集合。具有数据的检索、存取、修改、增删和整理等功能。
3.2 数据记录
是描述某一案卷或文件所有特征的数据集合。每条数据纪录由若干数据字段组成。
3.3 数据字段
是描述案卷或文件的某一方面特征的数据。
3.4 字段类型
是指数据字段的基本属性。本标准使用两种字段类型:字符型和数字型。
3.5 字段长度
是指字段所包容字符的最大个数。
3.6 代码
是一个或一组有序的、易于计算机和人识别与处理的数字、字母、汉字及其它符号。
3.7 档案著录
是对档案的内容和形式特征进行分析、选择和记录的过程。
3.7.1 文件级著录
是以单份文件或多份内容密切相关的文件组合为著录对象的档案著录。
3.7.2 案卷级著录
是以一个案卷或多个内容密切相关的案卷组合为著录对象的档案著录。
3.8 档案目录数据交换
是指在计算机网络上传输或以磁性介质、光盘等为载体,通过计算机进行的档案目录数据交换。
4 档案目录数据库结构
4.1 文件级.DBF目录数据库结构
文件级目录数据库中的数据记录由21个数据字段组成。字段名称、字段名、字段类型及字段长度见表1。
表1 文件级.DBF目录数据库结构
序号 |
字段名称 |
字段名 |
字段类型 |
字段长度 |
备注 |
1 |
档案馆代码 |
DAGDM |
字符型 |
6 |
|
2 |
档号 |
DH |
字符型 |
24 |
|
3 |
缩微号* |
SWH |
字符型 |
30 |
|
4 |
电子文档号* |
DZWDH |
字符型 |
24 |
|
5 |
题名 |
TM |
字符型 |
250 |
|
6 |
文件编号 |
WJBH |
字符型 |
100 |
|
7 |
责任者 |
ZRZ |
字符型 |
100 |
|
8 |
时间 |
SJ |
字符型 |
40 |
|
9 |
保管期限 |
BGQX |
字符型 |
4 |
|
10 |
密级 |
MJ |
字符型 |
4 |
|
11 |
解密划控 |
JMHK |
字符型 |
4 |
|
12 |
载体类型* |
ZTLX |
字符型 |
10 |
|
13 |
载体数量* |
ZTSL |
数字型 |
3 |
|
14 |
载体单位* |
ZTDW |
字符型 |
10 |
|
15 |
载体规格* |
ZTGG |
字符型 |
20 |
|
16 |
稿本* |
GB |
字符型 |
10 |
|
17 |
分类号 |
FLH |
字符型 |
24 |
|
18 |
档案主题词 |
DAZTC |
字符型 |
100 |
|
19 |
公文主题词* |
GWZTC |
字符型 |
100 |
档案室著录 |
20 |
文件状况* |
WJZK |
字符型 |
20 |
|
21 |
附注* |
FZ |
字符型 |
100 |
|
注:带“*”者为选择著录项目 |
4.2 案卷级.DBF目录数据库结构
案卷级目录数据库中的数据记录由16个数据字段组成。字段名称、字段名、字段类型及字段长度见表2。
表2 案卷级.DBF目录数据库结构
序号 |
字段名称 |
字段名 |
字段类型 |
字段长度 |
备注 |
1 |
档案馆代码 |
DAGDM |
字符型 |
6 |
|
2 |
档号 |
DH |
字符型 |
24 |
|
3 |
缩微号* |
SWH |
字符型 |
30 |
|
4 |
题名 |
TM |
字符型 |
250 |
|
5 |
责任者 |
ZRZ |
字符型 |
100 |
|
6 |
起始时间 |
QSSJ |
字符型 |
20 |
|
7 |
终止时间 |
ZZSJ |
字符型 |
20 |
|
8 |
保管期限 |
BGQX |
字符型 |
4 |
|
9 |
解密划控 |
JMHK |
字符型 |
4 |
|
10 |
载体类型* |
ZTLX |
字符型 |
10 |
|
11 |
载体数量* |
ZTSL |
数字型 |
3 |
|
12 |
载体单位* |
ZTDW |
字符型 |
10 |
|
13 |
载体规格* |
ZTGG |
字符型 |
20 |
|
14 |
分类号 |
FLH |
字符型 |
24 |
|
15 |
档案主题词 |
DAZTC |
字符型 |
100 |
|
16 |
附注* |
FZ |
字符型 |
100 |
|
注:带“*”者为选择著录项目 |
5 著录项目细则
5.1 著录项目的选择
分为必要项目和选择项目。
5.1.1 必要项目
必须著录的项目。
5.1.2 选择项目
除必要项目外均为选择项目。见本标准第4.1条、4.2条所列项目带“*”者。
5.2 著录要求
5.2.1 档案馆代码
根据《全国档案馆名称代码》(中国档案出版社出版)赋予的档案馆代码著录(档案室此项不著录)。
5.2.2 档号
依据DA/T 13-94《档号编制规则》编制的档号结构为:
全宗号-案卷目录号-案卷号-件号、页(张)号
文书立卷改革后,档案室按照DA/T 22-2000《归档文件整理规则》整理的档案目录,档号结构为:
全宗号-年度-保管期限-件号
或
全宗号-年度-保管期限-机构(问题)-件号
5.2.2.1 全宗号
全宗号用四位代码标识。其中第一位用汉语拼音字母标识全宗属性,后三位用阿位伯数字标识某一属类全宗的顺序号。一个档案馆(室)内全宗号不得重复。全宗号的格式是:
5.2.2.2 案卷目录号
案卷目录号应根据全宗内档案整理状况设置。可按不同时间,不同组织机构,不同保管期限,不同专题或不同载体形态设置。一个全宗内不应有重复的案卷目录号。案卷目录号以三位阿拉伯数字标识。案卷目录号的格式是:
5.2.2.3 案卷号
一个案卷目录内的案卷号按排列次序流水编号,不得重号。案卷号用四位阿拉伯数字标识。案卷号的格式是:
5.2.2.4 年度
按照DA/T 22-2000《归档文件整理规则》整理的档案,年度指文件形成年度,是一种分类方法。年度以四位阿拉伯数字标识公元纪年。如:“2003”。
5.2.2.5 件号、页(张)号
按照DA/T 13-94《档号编制规则》著录。
5.2.2.5.1 件号
件号用三位阿拉伯数字标识。案卷内文件按排列次序流水编号,同一案卷内件号不得重复,不应有空号。件号的格式是:
5.2.2.5.2 页(张)号
页(张)号用三位阿拉伯数字标识。案卷内文件各页(张)按排列次序流水编号,有字迹的页(张)均应编号,同一案卷内页(张)号不得遗漏或重复,不应有空号。页(张)号的格式是:
5.2.3 缩微号
档案缩微制品的编号。
5.2.3.1 案卷缩微号
a) 用缩微胶卷拍摄的案卷,其缩微号推荐格式由全宗号、盘号、案卷地址号组成:
其中全宗号根据DA/T 13-94《档号编制规则》编制;盘号是在一个全宗内,按拍摄先后顺序给每盘缩微品的编号,用三位数表示; 案卷地址号即案卷在缩微胶卷中的顺序号。例如,A007全宗第23卷至35卷缩微于第56盘胶卷,则第23卷在胶卷中排序为1,其地址号就是001,第24卷在胶卷中排序为2,其地址号就是002……依次类推,第35卷地址号为013。由此,第23卷缩微号为:A007-056-001。
b)
用缩微平片拍摄的案卷,其缩微号推荐格式由全宗号、平片号组成:
其中,全宗号根据DA/T 13-94《档号编制规则》编制;平片号是在一个全宗内,按拍摄先后顺序给每张缩微平片的编号,一般由五位数组成。
5.2.3.2 文件缩微号
a) 用缩微胶卷拍摄的文件,其文件的缩微号是在案卷缩微号(见5.2.3.1.a)后用连线“-”加上文件件号或所在页号,件号或页号用三位数表示。
b) 以缩微平片形式拍摄的文件,其文件缩微号是在案卷缩微号(见5.2.3.1.b)后用连线“-”加上文件件号或所在页号,件号或页号用三位数表示。
5.2.4 电子文档号
档案馆、室管理电子文件的一组符号代码。推荐使用由存储介质代码、全宗号、盘号及电子文件名称四部分组成的格式。其中,存储介质代码用字母表示, “GP”表示光盘,“CD”表示磁带,“CP”表示磁盘;全宗号根据DA/T 13-94《档号编制规则》编制;盘号用数字表示,一般为二位数;电子文件名称可根据管理方便的原则自行规定。各个部分之间用“-”号连接。
示例:CD-A007-03-LDF9002.TXT
5.2.5 题名
包括文件题名和案卷题名。
5.2.5.1 文件题名
a) 一般照原件著录,如原件没有题名,则应自拟题名,并加“[ ]”号。原题名不能反映文件主要内容时,原题名照录,并据其内容另拟题名,加“[ ]”号附后。
b) 文件除正题名外,有并列题名、副题名、说明题名文字时,应按序依次著录。其中,并列题名是以另一种语言文字书写的与正题名相对照的题名。正题名与并列题名之间加“=”号。副题名是解释或从属于正题名的另一题名。说明题名文字是指在题名前后对档案内容、范围、用途等的说明文字。副题名、说明题名文字前加“:”号。
c) 文件题名中的责任者与责任者项的内容重复时可省略不著。但如果责任者名称是题名不可缺少的组成部分时,则应将责任者名称作为题名的一部分著录。
5.2.5.2 案卷题名
一般照录原文,原题名不能揭示案卷內容或语句冗长不通时,应修改后再著录。
5.2.6 文件编号
文件制发过程中,由制发机关、团体或个人赋予文件的顺序号。包括发文字号、科研试验报告流水号、标准规范类文件的统编号、图号等。
5.2.6.1 文件编号除年度用“[ ]”号、序号用阿拉伯数字外,其余照原文字和符号抄录。
5.2.6.2 联合发文有多个文件编号的文件,一般只著录一个文件编号,但立档单位的文件编号必须著录。若著录多个文件编号,中间用“;”隔开。
5.2.7 责任者
对档案内容进行创造、负有责任的团体或个人。
5.2.7.1 个人责任者一般只著录姓名,必要时在姓名后著录与文件相应的单位、职务、职称,并加“()”号。
5.2.7.2 团体责任者必须著录全称或不发生误解的通用简称,同一团体责任者的名称前后著录应一致。
示例1:中国共产党山东省委员会或中共山东省委
示例2:山东省科学技术委员会或山东省科委
示例3:山东省妇女联合会或山东省妇联
以上不应简称为“省委”、“省科委”、“本委”、“省妇联”。
5.2.7.3 责任者有多个时,最多著录三个责任者,其中列居首位的责任者及立档单位本身是责任者的必须著录,被省略的责任者用“[等]”表示,各责任者之间以“;”号相隔。
5.2.7.4 文件所署责任者为代称、别名、笔名时,应照原文著录,另将其真实名称加“( )”附后。
示例1:沈伟(中共山东省委)
示例2:又铭(邓恩铭)
5.2.7.5 未署责任者或原责任者不完整、不准确时,应著录考证出的正确的责任者,并加“[ ]”号。
5.2.7.6 会议文件责任者应写明会议全称、举行的届次数。
示例:山东省第九届人民代表大会第二次会议
5.2.8 时间
按著录对象的不同,分为文件形成时间和卷内文件起止时间。
5.2.8.1 文件形成时间
一般公私文书、信札为发文时间,决议、决定、命令、法令、规程、规范、标准、条例等规范性文件为通过或发布时间,条约、合同、协议为签署时间,技术评审证书、技术鉴定证书、转产证书为通过时间,获奖证书、发明证书、专利证书为颁发时间,科研试验报告、学术论文为发表时间,工程施工图、产品加工图为设计时间,竣工图为绘制时间,原始试验记录、测定检修数据为记录时间。
a) 文件形成时间由8位阿拉伯数字表示,第1~4位数表示年度,第5~6位数表示月份,第7~8位数表示日期。
示例1:某文件形成时间为1956年2月18日。
应著录:19560218
示例2:某文件形成时间为1972年12月1日。
应著录:19721201
b) 文件时间凡出现农历、民国纪年或地支代月、韵目代日的,一律转换成公元纪年,不加注。
c) 原文件未署时间或所署时间有误者,应著录考证出的准确的文件时间,并加“[ ]”号。
示例1:某文件未署形成时间,经过考证为1954年1月8日。
应著录:[19540108]
示例2:某文件所署时间1960年10月6日,但文件中所述事件发生与文件形成时间明显不符,经过考证应为1964年10月6日。
应著录:19601006[19641006]
d) 文件时间不完整或部分时间字迹不清时,仍著录原时间,原时间中缺少或字迹不清部分以“0”补之,考证出的时间根据不足时,在其后加“?”字符。
示例1:某文件所署形成时间1965年10月。
应著录:19651000
示例2:某文件所署形成时间12月6日,经考证年代为1957年。
应著录:00001206[19571206]
示例3:某文件所署形成时间1955年其中月份、日期不清,经考证应为12月1日,但是根据不是很充分。
应著录:19550000[19551201?]
e) 由若干份文件为对象著录一个条目时,著录其中最早和最迟形成的文件时间,中间用“-”连接。
示例:某文件组合有1951年6月8日;1951年7月15日;1953年8月3日;1953年12月11日4份文件。
应著录为:19510608-19531211。
5.2.8.2 案卷内文件起止时间
a) 起始时间
案卷内形成最早的文件日期。著录方法同5.2.8.1。
b) 终止时间
案卷内形成最晚的文件日期。著录方法同5.2.8.1。
5.2.9 保管期限
根据档案价值确定的档案应该保存的时间。一般分为永久、长期、短期三种。保管期限一般按案卷组成时所定保管期限著录,若已更改的,应著录新的保管期限。
5.2.10 密级
密级一般按文件形成时所定密级著录,对已升、降、解密的文件,应著录新的密级,公开级、国内级可不著录。
密级按GB/T 7156-2003 文献保管等级代码表划分为六个级别,名称代码见表3。
表3 文献保密等级代码
名 称 |
数字代码 |
汉语拼音代码 |
汉字代码 |
公开级 |
0 |
GK |
公开 |
国内级 |
1 |
GN |
国内 |
内部级 |
2 |
NB |
内部 |
秘密级 |
3 |
MM |
秘密 |
机密级 |
4 |
JM |
机密 |
绝密级 |
5 |
UM |
绝密 |
5.2.11 解密划控
遵照《档案法》有关条款,根据档案文件形成时间及文件内容确定档案是向社会开放还是继续保密控制使用。档案馆已确定为开放的文件或案卷,此项不著,不开放的文件或案卷则著录“控制”或“K”字。
5.2.12 载体类型
档案载体物质形态的种类。分为甲骨、金石、简牍、缣帛、纸、唱片、胶片、胶卷、磁带、磁盘、光盘等。以纸张为载体的档案一般不予著录,其他载体类型据实著录。
5.2.13 载体数量及单位
数量为阿拉伯数字,单位用档案物质形态的统计单位,如“件”、“页”、“张”、“册”、“盒”、“盘”等。
5.2.14 载体规格
档案载体的尺寸及型号。如:16开、A4、105mm×148mm、3.5英寸。
5.2.15 稿本
文件的文稿、文本和版本。分为正本、副本、草稿、定稿、手稿、草图、原图、底图、蓝图、影印本等。稿本应据实著录。
5.2.16 分类号
根据档案分类法确定的档案所属类目的符号。
5.2.16.1 分类号应依据《中国档案分类法》(第二版)和GB/T 15418-94《档案分类标引规则》进行标引。
5.2.16.2 档案分类标引应根据档案的主题内容、价值、实际用途等因素,选定适当的标引深度,一般不超过3个分类号,各分类号之间用“+”号连接。
5.2.16.3 归类相互交叉情况的处置
a) 采取集中归类与分散归类相结合的办法。例如:机构、人事方面的档案,根据《中国档案分类法》的类目设置,应按党、政、军系统分别归类,但某些系统(如科研系统)的机构、人事档案则在本专业类相对集中。又如:计划、统计、基本建设、设备、经费方面的档案,属于综合性的分别归于“JA 计划”、“JD 统计”、“R 城乡建设、建筑业”、“NJ 机械工业”、“KA 财政”,属于各专业的则分别归入相关专业类。
b) 采取规定宜入类目的办法。例如:标准、计量方面的档案,根据《中国档案分类法》类目设置,既可归入“U 标准、计量、专利”类,也可归入各专业类下所设的“UA 标准”、“UB 计量”类。实际工作中,可根据本部门检索需要,在分类表中规定其中一个类目为实际使用类目,并在另一重复类目下注明“宜入×××类”。
5.2.17 主题词
揭示档案主题内容的规范化的词或词组。
5.2.17.1 主题词应依据《中国档案主题词表》或本专业、本单位的规范化词表及DA/T 19-1999《档案主题标引规则》进行标引。
5.2.17.2 一个案卷或文件的主题词一般控制在10个以内,各个主题词之间空一个汉字的位置。
5.2.17.3 专用名词如机构名称、人名、地名、会议名称等,已编入词表的,要选用词表中的正式主题词。例如:王尽美(王瑞俊、王灼斋)应标引为“王烬美”;未编入词表中的,则应选用统一的自然语言进行标引。
5.2.17.4 词表中若出现两个或两个以上的正式主题词表达同一概念语义时,应在词间规定用(Y)、代(D)关系,避免分散标引。例如:《中国档案主题词表》正式主题词中,有战史、劳模、国民党、政治局会议,同时也有战争史、劳动模范、中国国民党、中央政治局会议,则应分别规定其中最常用、最通用的一个词为正式主题词,另一个同义词为非正式主题词。
5.2.18 文件状况
根据档案载体的完好程度著录。著录时用字母或汉字代码标识。文件状况标识符号对照表见表4。
表4 文件状况标识符号对照表
文件状况 |
汉字代码 |
字母代码 |
载体破损 |
破损 |
A |
字迹褪变 |
褪变 |
B |
载体老化 |
老化 |
C |
其他情况 |
其他 |
D |
5.2.19 附注
对各个数据字段的补充解释与说明。依各项目的顺序依次著录,项目以外需解释和说明的列在其后。
5.2.19.1 各数据字段需要注明的事项
主要注明同一文件的不同题名或其他称谓、责任者、时间考证依据或著录来源等。
示例1:题名又称“三大方案报告”
示例2:责任者系根据统计表制发机关确定
示例3:文件时间系刊物所载时间
5.2.19.2 各数据字段以外需要注明的事项
主要注明文件附件题名、文件的特殊来源如捐赠、购买、交换、复制、寄存等、文件的真伪判断等情况。
示例1:此件复制于中央档案馆
示例2:该件由×××于××××年捐赠
6 档案目录数据交换
6.1 档案目录数据交换格式
交换档案目录数据的文件格式,本标准规定扩展名为.DBF的Xbase关系型数据库文件作为档案目录数据交换的文件格式。
6.2 档案目录数据交换要求
6.2.1
.DBF数据库文件名格式:
a) 数据级别分为文件级和案卷级。文件级用汉语拼音字母“W”标识;案卷级用汉语拼音字母“A”标识。
b) 档案馆代码著录方法同5.2.1。
c) 全宗号著录方法同5.2.2.1。
d) 数据交换年度著录方法同5.2.2.5。
e) 当库文件长度超过存贮介质容量时,分割为若干个库文件存贮,并按顺序进行编号。库文件编号从01~99顺序编制。
示例1:建库单位是中共山东省委,数据交换级别是文件级数据库,全宗号A001,数据交换年度2001年,库文件编号为2号。
库文件名著录为:WA001200102.DBF。
示例2:建库单位是济南市档案馆,数据级别是案卷级数据库,档案馆代码437002,数据交换年度2002年,库文件编号为1号。
库文件名著录为:A437002200201.DBF。
6.2.2 经过加密处理的数据,交换时必须提供解密手段。
6.2.3 经过压缩处理的数据,交换时必须提供解压缩手段。
6.2.4 档案目录数据交换建议使用光盘、可移动磁盘,不推荐使用3.5英寸软盘。网上传递仅限于没有密级的目录数据。
6.2.5 档案目录数据交换盘应带有外部标识,注明全宗名称、全宗号、相关年度及盘号,馆际之间档案目录数据交换要注明档案馆代码。
6.2.6 档案目录数据交换盘应确认为无病毒盘才能接收。
6.3 本标准涉及的各种符号,如“=”、“+”、“[ ]”、“.”等,录入时,一律用半角字符。
3671