中华人民共和国国家档案局1999-05-31批准 1999-12-01实施
1 范围
本标准规定了档案主题分析方法和依据《中国档案主题词表》及各种专业档案主题词表进行档案主题词标引的方法。
本标准适用于建立档案的机读式检索工具和手工式检索工具所进行的人工标引。
2 引用标准
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。
GB/T3860-1995 文献叙词标引规则
DA/T1-1992 档案工作基本术语
DA/T18-1999 档案著录规则
3 定义
本标准采用下列定义。
3.1 档案
国家机构、社会组织和个人在社会活动中直接形成的有价值的各种历史文献。[DA/T1中1.1]
3.2 档案主题
档案具体记述的对象或问题。
3.3 主题词
又称叙词(即正式主题词)。标引与检索档案时,主题词表中规定用于表达档案主题的词语。
3.4 非正式主题词
又称非叙词。是正式主题词的同义词或准同义词,主题词表中收录但规定不能作档案标识,只起指引作用的词语。
3.5 档案主题词表
由反映档案内容的主题词及其词间关系组成的规范化词典,是将档案、标引人员或用户的自然语言转换成规范化语言的一种术语控制工具。
3.6 主题标引
对档案给予主题词标识的过程。[DA/T1中5.6.2]
3.7 主题标引深度
指赋予一个标引对象主题词数量的多少。
4 主题分析
主题分析是主题标引的基础,通过对档案的内容特征进行分析,准确提炼和选定主题概念。
4.1 审读档案
通过审读档案,了解和判断档案所反映的中心内容和其它主题因素。
4.1.1 阅读题名
文件和案卷的题名是对档案内容的概括。在题名准确反映档案中心内容的情况下,阅读题名是分析、提炼主题的一条捷径,但题名不能作为提炼主题概念唯一的依据。
4.1.2 浏览全文
在档案无题名或题名不能全面、准确地反映档案主题时应浏览全文。浏览全文应注重了解题名未能反映的主题和深层次主题,发掘隐含主题。浏览全文重点是阅读全文的开头、结束语、段落题名,必要时阅读批语、摘要、简介、目次、图表、备考表等内容。
4.2 主题类型
主题的类型可以分为单主题和多主题两种。单主题包括单元主题和复合主题(即多元主题),多主题则由几个单主题组成。
4.3 主题结构
任何主题都是由一定的主题因素构成的。构成主题的因素一般可以分解为:主体因素、通用因素、位置因素、时间因素、文种因素。
4.4 主题概念的选定
在审读档案题名或全文的基础上,提炼选定出一个或若干个表达档案主题的自然语言主题概念。选定主题概念的原则是:
a)选定的主题概念应是档案中论述的问题;
b)选定的主题概念应具有实际检索意义;
c)选定的主题概念应能全面、准确地表达档案主题。
5 选词标引
造词标引是对档案主题分析出的概念给予主题词标识的过程。
5.1 在主题分析中选出的主题概念, 应转化成档案主题词表中的主题词(正式主题词)进行标引,书写形式应与词表中的词表中的词形相一致。非正式主题词不能作为标引词使用。
5.2 标引词应选用档案主题词表中与档案主题概念直接相对应的、专指的主题词。
5.3 当词表中没有与档案主题概念直接相对应的专指主题词时,应选用两个或两个以上的主题词进行组配标引。
5.3.1 组配应是概念组配。概念组配包括以下两种类型:
a)交叉组配,即同级词组配。指用两个或两个以上具有概念交叉关系的同级主题词组配表达其相应的下位概念。
例如:《关于组建钢铁联合企业的通知》,用“钢铁企业”和“联合企业”两个具有交叉概念的主题词组配标引,来表达“钢铁联合企业”这一专指概念。
b)方面组配,即限定组配。指由一个表示事物的主题词,与另外一个或几个表示事物某个属性或某个方面的主题词组配表达相应的下位概念。
例如:《高考制度改革方案》,用“高考”和“规章”限定“教育改革”,从而表达了“高考制度改革”这一专指概念。
5.3.2 组配标引时,优先考虑交叉组配,然后考虑方面组配。
5.3.3 应选用与档案主题概念关系最密切、最临近的主题词进行组配,不能越级组配,即不能用其上位或下位主题词组配。如《高考制度改革方案》标引词中,只能用“教育改革”,而不能用其上位词“改革”或其下位词“教学改革”进行组配。
5.3.4 组配结果所表达的概念应清楚、确切,只能表达一个主题概念。
5.3.5 为避免多主题虚假组配造成误检,可以加联系符号区分每个问题。其做法是:在主题词后用数字1.2.3.……表示分组符号,数字相同的主题词是一组相关联的组配概念。数字中的“0”,称作共同联号,表示该主题词可以和该档案中标引的任何一个主题词进行组配。
例如:《关于安阳县棉花播种与玉米田间管理的情况报告》标引为:“棉花1”、“播种1”、“玉米2”、“田间管理2”、“安阳县0”。
5.3.6 当某一主题概念在词表中有组代主题词(先组复合词)时,应选用规定的组代主题词,不应另选其他主题词进行组配标引。
5.4 当某一主题概念在词表中查不到专指的主题词, 也无法通过组配标引来表达该主题概念时,可以采用靠词标引。靠词标引有以下两种:
a)用上位概念主题词进行靠词标引。依据词族索引选用最直接的上位概念主题词进行标引,不应使用越级上位主题词标引。
b)用近义词进行靠词标引。 依据范畴索引选用与主题概念含义最相近的主题词进行标引。
5.5 关键词标引又称增词标引。关键词是主题词表以外的、 未经规范化处理的自然语言词。使用关键词标引应严格控制。
5.5.1 下述情况可以采用关键词标引:
a)某些概念采用组配其结果出现多义时;
b)某些概念虽可以采用靠词标引, 但当这些概念的被标引频率较高时;
c)词表中明显漏选的词,包括词表中未收录的地名、人名、 机构名、产品名等专有名称;
d)表达新生事物的词。
5.5.2 关键词应尽可能选自其它词表或较权威的参考书、 工具书,选用的关键词应达到词形简炼、概念明确,实用性强。
5.5.3 使用关键词标引后,应有所记录, 并反馈到所用档案主题词表的管理部门。
5.6 一个标引对象,标引用词一般2~10个。
6 质量管理
6.1 为保证标引工作的质量,应充分考虑以下因素:
a)标引工作的组织管理;
b)标引人员的业务素质;
c)档案主题词表本身的质量;
d)相应的标引工作细则。
6.2 为提高标引质量,应做好审核校对工作。
6.2.1 审核校对工作是检查标引的主题词是否专指、客观。 主要检查以下几方面:
a)主题概念提炼是否准确;
b)转换成的标引词是否是词表中的正式主题词;
c)是否符合组配规则;
d)是否存在过度标引或标引不足;
e)对同类型主题所施用的标引词前后是否一致。
6.2.2 审校方法是先由标引人员自己审校, 再由专人审校或标引人员互相审校,并将审校意见反馈给原标引人员。
6.3 为保证标引工作质量,标引人员应做到:
a)熟悉《中国档案主题词表》或其他所用词表及标引规则与方法;
b)熟悉所标引档案的内容及与之相应的科学知识;
c)具有一定程度的语文水平;
d)应尽可能与利用者及利用接待人员多接触, 并通过分析检索结果,改进标引工作,提高标引质量。
附录A
(提示的附录)
使用主题词表进行档案主题标引流程图(略)