中华人民共和国国家标准
信息处理 SGML支持设施
SGML文件交换格式(SDIF)
本标准等同采用国际标准IS0 9069—1988(信息处理SGML支持设施SGML文件交换格式
(SDIF》 .
1主题内容
本标准规定了一种称为“SGML文件交换格式(SDIF)”的数据结构.SDIF能使符合于GB/T 14814标准且可能存储在若干实体中的文件以某种方式组合到一个用于交换的数据流中,以便其接收者能够重新构造出构成该文件的各个实体.
SDIF也允许在数据流中包含相关的文件,如附两、传输方式、目录卡片、格式化过程以及文件结构需要的“文件轮廓丹.
2适用范圈
SGML文件交换格式只用于按GB/T 14814--93定义的SGML系统之间的SGML文件交换。
数据变换可以通过开放系统互连或其他环境的数据通信进行,也可以通过交换存储媒体进行.
3引用标准
GB 2311信息处理七位和八位编码字符集代码扩充技术
GB/T 14814信息处理 文本和办公系统标准通用置标语言(SGML)
本标准使用形式语法产生式精确定义SDIF.所有的语法产生式是用ASN.1表示的,ASN.1在下列国际标准中定义。
IS08824信息处理系统 开放系统互连抽象语法表记法l(ASN.1)规范
IS08825信息处理系统开放系统互连抽象语法表记法l(ASN.1)的基本编码规范
4术语
GB/T 14814中给出的术语和下列术语适用予本标准.
4.1 数据流字符集data stream character set
在SDIF数据流中的所有文件置标使用的字符集以及所有SDIF名字和SDIF标识符使用的字符集.
4.2 文件描述符 document descriptor
数据流的组成部分,该数据流包含一个SGML文件实体以及所有直接或间接引用的外部买体的实体描述符.
4.3 文件轮廓 document profile
由文件结构或应用定义的传输格式,描述了和文件管理或交换有关的符合于文件的特性。
4.4 实体描述符entity descriptor
SDIF数据流的组成部分,它表示了一个外部实体。
4.5 主文件 main document
一个SGML文件,它是一个交换的主题.
4.6 省略公用文本 omitted public text
完全不含有正文的实体描述符,它说明此公用文本是文件的一部分,但是,由予认为接受者手中拥有备份,因此它并没有被交换。
4.7相关的文件related document
用来连接一个主文件的SGML文件,但并不做为它的部分内容被引用.
注.一些例子是;
附函;
传输格式;
目录卡片;
…..格式化过程;
-文件轮廓;
4.8 SDIF
SGML文件交换格式。
4.9 SDIF标识符SDIF identifier
在SDIF数据流中赋给实体描述符的唯一标识性顺序号,
5”的外部实体表示在数据流的第五个置标声明中所标识的有外部标识符的实体.4.10 SDIF标识符引用 SDIF identifier reference
一种实体描述符,它不包含其自身的正文,但含有对其他实体描述符的SDIF标识符的引用.它表示在数据流中已出现的实体的重复声明或表示省略公用文本.
4.11 SDIF名字SDIF name
在SDIF数据流中对文件或完整数据流所指定的SGML名字。
4.12 SDIF组合程序 SDIF packer
建立SDIF数据流的程序.
滗;SDIF组合程序的参数一般包括数据流的SDIF名字、主文件和相关文件的SDIF名字、系统标识符以及文件组合的顾序.
4.13 SDIF分解程序 SDIF unpacker
将SDIF数据流分解为构成它的各个实体的程序..
注;如果必要,SDIF分解程序将修改鼍标声明的系统标识符参致以与其环境中的存储地址相一致.
4.14 SGML文件交换格式SGMI. document interchange format
一种数据结构,能够使分别存储在若干实体中的主文件及其相关文件在交换时按某种方式组合成单一数据流,以便接收者重新构造出各个实体。
5数据流描述
SDIF数据流表示一个或多个SGML文件实体,零个或多个$GML子文件实体,零个或多个
SGMI.正文实体和数据实体,它们都在GB/T 14814中定义.
注,①这些实体包含一个主文件和零个或多个相关文件,它们同时被交换.每个文件受限于它自身的SGML声叨.即它的具体语法定义,子文件嵌套限制以及其他限制.
②SGML声明中的应用规定的信息参数用于标识文件是否符合特定的文件结构.
5.1数据流的构成
数据流由标识数据流中置标所用字符集的宇段、表示生文件和相关文件的文件描述符及实体描述符组成,
注:①形式定义见第6章.
⑦SDIF仅用于标识和定界各个文件以及文件可以分解成的实体,除了标识字符集之外.SDIF中不直接表示其他信息.具体而言.SDIF没有关于文件元素结构的信息,由于这些信息出现在SGML实体中,所以实体中还包括版面格式和显示信息,文件描述符依照SDIF组合程序所指定的顺序排列.
注.①有关实体描述符的顺序见5.5条.
⑦不是SGML文件的文件,例如宇型定义和格式化过程,需要一个简单的SGML文件作为标识外壳.这种文件可以通过标识外壳作为数据实体被引用.
5.2数据流字符集
该字段包括数据流字符集的.个或多个指定的转义序列.转义序列应按GB 2311构造.
注:它通常是初始的系统字符集.
5.3 SDIF名字
当建立数据流时,对主文件、相关文件和数据流应指定SDIF名字.
注:①它们没有SGML实体名字.因为它们不会在SGML文件中被引用,
②文件的SDIF名字一般从初始系统中文件的系统标识符得到.
SDIF名字在语法上应遵守SGML具体语法的规则,并用数据流字符集编码.在同一数据流中任何两个SDIF名字都是不相同的.
注:应用或结构可以建立SDIF名字的约定,如同对SGML实体的名字一样.例如:一个结构要求SD]F名字"PRO-FILE”用于包含文件管理属性和类似主文件信息的相关文件.
SDIF名字可以附有说明性注释.
5.4文件描述符
5.4.1包含实体
文件描述符包含GB/T 14814定义的文件实体.在置标声明中出现的外部标识符,以及出现在由其直接或间接引用的实体内声明中的外部标识符,决定了其他实体.对于这些实体,其描述符包含在文件描述符中.
注:1.如果外部实体是子文件.则其中声明的外部实体的描述符也应被包含,而且对于任何嵌套的子文件也应如此.
2.尽管教据实体不包含SGML置标,但它可以(以其自己的记法)包古对其他数据实体或SGML乎文件实体的引用.仅当实体在数据流所包含的某些SGML实体中被声明时,其实体描述符才包含在致据流中.
默认实体不包含实体描述符.
注:本条目的作用在于要求包含在数据减中的每个实体郝应有一个实体声明.包括由数据实体引用的实体以及巳经缺省引用的实体.
5.4.2文件字符集
文件字符集应和数据流字符舞一致.
注:文件字符集是用于文件譬标的唯一字符集.对于数据可以使用若干字符集,且数据流中所有文件使用的不必是同一个字符集.
5.5 SDIF标识符
就唯一标识数据流中的实体而育.SGML名字悬不够充分的.因为在多个文件戏子文件中可能出现相同的名字.因此.必须按某一方式对每个声明的外部实体指定一个SDIF标识符,以保证唯一性并反映实体结挎(自璜向下.运层联序).
SDIF标识符的序号按数据流字符集编码.它们从l开始,增量为1,并且按下列方式指定。
a. 对第一个SGML文件实体建立文件描述符,并针对外部标识符检查其前导说明部分.
注:外郝标识符可出现在实体、文件类型、链接类型和记法声明中,但在默认的实体声明中将被忽略.
按照实体声明出现的顺序,对实体建立实体描述符并指定SDIF标识符.直到前导说明部分结束.
第一个标识符字段中记录前导说明部分中赋于的第一个SDIF标识符,如果没有赋于标识符字段.
注:实体结构的逐层遍历是组成数据流的有效方法.然而SDIF分解程序可能罘用左列表遍历方法以有效地指定系统标识符,通过识别给定文件或子文件实体的子女,可以在第一个标识符字段上进行这种追历.
b. 对于子文件实体,检查新建立的实体描述符。如果遇到一个,则它的前导说明部分按以上方式遇判的每个外部标识符建立实体描述符.
c 当到达子文件实体前导说明部分的尾部时,如果存在下一个子文件实体,则在其前导说明部分中继续搜寻并顺序编号.
d. 当到达数据流尾部时,如果存在F一个SGML文件实体,则在其前导说明部分中继续搜寻并顺序编号。
5.6实体描述符
实体描述符的类型按下列方式确定;
a. 对数据流中首次出现的外部标识符,如果要交换实体正文,则建立包含实际正文的实体描述符,即描述符包括一个SGML予文件实体、一个SGML正文实体或一个数据实体.
b. 对首次出现而又不交换正文的外部标识符,实体描述符不包含正文。即它是省略的公用文本描述符,这种外部标识符应是一个公用标识符.
c. 对非首次出现的外部标识符,实体描述符是对表示首次出现的外部标识符的实体描述符的交叉引用,即它是一个SDIF标识符引用。
6抽象数据流格式
GB/T 14814--SDIF定义 ;;=BEGIN
数据流 ::=SEQUENCE{
数据流字符集 字符集指定,
数据漉名 SDIF名字和描述,
相关文件组A[APPLICATION 8]IMPLICIT
SEQUENCE OF
文件描述符OPTIONAL,
主文件 [APPI。ICATION 9]IMPLICIT
文件描述符,
相关文件组B[APPLICATION I0] IMPLICIT SEQUENCE OF
文件描述符OPTIONAL
)
文件描述符 ::= [APPLICATION l l]IMPLICIT SEQUENCE{
文件名 SDIF名字和描述,
第一标识符 SDIF标识符,
文件实体SGML文件实体,
外部实体 SET OF实体描述符OPTIONAL
)
实体描述符 ::= [APPLICATION 12]IMPLICIT SEQUENCE{
实体标识符. SDIF标识符,
实体名 SGML名字,
子文件结构 CHOICE{
正文实体 子文件结构.
敬据实体 SGML正文实体,
交叉引用 外部数据实体.
省略公用文本 NULL
子文件结构 ::= [APPLICATION 13] IMPLICIT SEQUENCE{
第一标识符SGML标识符
子文件实体SGML子文件实
字符集指定 ::=[APPLICATION 0] IMPLICIT OCTET STRING
——如同GB 2311中的代码字符串t
——指定转义序列
外部数据实体 ::[APPLICATION l]IMPLICIT OCTET STRING
——与SGML实体声明指定的数据内容
——记法一致的代码字符或位串
SDIF标识符 ::=[APPLICATION 2]IMPLICIT OCTET STRING
——如同GB/T 14814中的代码字符串。数
SDIF名字和描述 ::=[APPLICATION 3]IMPLICIT OCTET STRING
——如同GB/T 14814中的代码字符串t名字
——其后可跟有一描述命名对象的选项
SGML文件实体 ::一[APPLICATION 4] IMPLICIT OCTET STRING
. ——如同GB/T 14814中的代码字符申
SGML文件实体
SGML名字 ::=[APPLICATION 5] IMPLICIT STRING
——如同GB/T 14814中的代码字符串:
——名字
SGML子文件实体 ::== [APPLICATION 6]IMPLICIT OCTET STRING
——如同GB/T 14814中的代码字符串t
SGML子文件实体
SGML正文实体 ::一[APPLICATION 7] IMPLICIT OCTET STRING
——如同GB/T 14814中的代码字符串t
SGML正文实体
END
7绾码规则
SDIF数据流应按照交换媒体或通信系统要求的方式编码。当允许多种编码时,这种选择应得到交换参与者的同意.
注:符合予本标准的系统能够对按照IS0 8825规定的ASN.1基本编码规则编码的数据流进行交换.
附录A
本标准和其他标准的关系
(参考件)
AI信息处理标准
按照本标准构造的符合SGML的文件能够用MOTIS功能传送.MOTIS功能在下列标准以及类似标准和CCITT建议中定义:
ISO/IEC 10021 信息处理系统文本通信面向文本交换系统的消息
A2办公文件体系结构(ODA)
对符合ODA文件的SGML表示的文件,SGMI。文件交换格式是与开放系统交换相一致的。ODA文件在以下标准中定义;
ISO 8613信息处理 文本和,力’公系统办公文件体系结构(ODA)和交换格式
A30Sl表示服务
A3.1对象标识符
A3. 1.1抽象语法
本标准将ASN.1.对象标识符值:
(ISO standard 9069 abstract syntax)
设赋为表示数据值集合的抽象语法名,其中每一个值都是在第6章中定义的ASN.1类型GB/T 14814--SDIF数据流”的值.对应的对象描述符值是;
"SDIF basic abstract syntax"
注:在每一种表示的散据值中,仅支持部分SDIF语义传输的抽象语法的说明巴超出本标准的范围.
A3. 1.2传输语法
ASN.1对象标识符。
fjoint-iso-ccitt asnl (1) basic-encoding (1》.
和对象描述符值;
“Basic Encoding of a single AsN.1 type”
(指定给IS08825中的信息对象)能被用作代表这种抽象语法名的传输语法名,它们标识了用lS08825中说明的基本编码规则得到的转输语法,
注:对其他转输语法的描述和命名超出本标准的范圈.
A3, 20SZ文件类型定义
本条标识了适用于在FTAM(IS08571)和JTM (IS0 8.832)传输中携带SDIF语义的OSI文件类型。
注:(I)本条使用了术语。文件类型’,该术语只与开放系统蔑连相关,而不同于GB/T 14814中定义的‘文件类型”.
②在()SI文件类毅登记管理机构建立以前,对于OSl文件类型的定义,下面小标题与在其他OSl标准中使用的相同.
A3.2.1标识符
ASN.1对象标识符值;
{iso standard 9069 document-type (2) basic ;
能用于标识本文件的类型。
A3.2.2描述符值
ASN.1对象描述符值。
SDIF basic document type一
能用于描述本文件的类型.
A3.2.3参数语法
参数不和SDIF基本文件类型一起使用.
A3.2.4范围和应用领域
SDIF基本文件类型定义了文卷内容,该文卷用于存储由FTAM存储、传输和访问以及由JTM传输的文卷内容,
注:SDIF基本文件类型既不允许通过FTAM访问部分文件,也不允许在文件传输过程中通过FTAM插入检测点,它只支持为读写访同而对整个文件的非检测点传输.
A3.2.5引用标准
IS0 8571信息处理系统开放系统互连文卷传输、访问和管理
IS0 8832信息处理系统开放系统互连作业传输和管理的基本类协议的说明
A3.2.6缩略语
FTAM 文件传输、访问和管理
JTM 作业传输和操作
A3.2.7文件语义
文件语义在本标准和GB/T 14814中详细说明.
A3.2.8抽象语法结构
SDIF信息有一种抽象语法结构,它反映了将一个或多个相关SGML文件构造成如在OB/T 14814中说明的若干实体,
注t实体可以通过SGML置标进一步结构化成为可访问的单个元索和属性,这些元素和属性在GB/T 14814中说明-这种称为。元素结构”附加的语法结构在SDIF基本文件类型中是不可见的,只有实体结构在藏体标准中是可见的.
A3.2.9传输定义
传输由一效据值构成,该数据值是ASN.1数据类型"GB/T 14814--SDIF数据流”的(完全)值.该数据流具有A3条指定的抽象语法名.建议所有实现都支持的传输语法为。
{joint-iso-ccitt asn l(1)basic-encoding (1)
但也可支持其他传输语法.
A3.2·10 ASE专用操作
FTAM专用操作和JTM专用操作不适用于本文件类型.
注:特别是没有定义文件类型与其自身的连接,
附加说明。
本标准由中华人民共和国电子工业部提出.
本标准由电子工业部标准化研究所归口,
本标准由西安交通大学、电子工业部标准化研究所负责起草.
本标准主要起草人邓良松、侯迪、陈堃銶、冯惠、邵坚.
1290