信息组织 | 信息组织主题法

本章重点与难点

重点:

  • 主题法(主要是叙词法)的信息组织原理 主题词表的编制;
    难点:
  • 分类法微观体系结构;
  • 主题词词表组配原理;

1 主题法的原理

1.1 主题检索的含义与特点

   主题检索有广义和狭义两种所指,在国外多采用其广义所指,我国则多取其狭义。
狭义的主题检索
   是指用叙词、标题词、单元词、关键词等表达信息需求而进行的检索。它既不同于用分类号或依类目进行的分类检索,也区别于依被引文献进行的引文检索。 我们所说的主题检索是指这种狭义的主题检索。

主题检索的特点

  1. 直接以事物为中心展开检索
  2. 以直观的语词表达检索要求
  3. 以特性检索为主,族性检索次之
  4. 以明确性的检索为主,模糊性的检索次之

1.2 主题法的类型

1.2.1 标题法

   标题法是最早的一种主题法,它的出现一般以克特于1876年出版的《词典式目录规则》为标志。
   标题法是用规范化的自然语言语词作标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的 一种主题法。

标题法优缺点

■标题法具有主题法的共同优点:

  • 以事物为中心集中信息,便于从事物出发的检索, 特性检索功能较强,标识直观;
  • 它还有标识含义明确
  • 易于使用等优点。

■它的主要缺点:

  • 是由于采用标题的列举方式和先组方式,概念表 达能力受限,概念难以多向成族,检索途径少;
  • 由于采用自然语词,标识的通用性较差。

1.2.2 单元词法

   单元词法又称元词法,它是以取自自然语言,经过规范化处理的单元 词作标识,通过单元词的字面组配来表达主题概念的一种主题法。
所谓单元词(Uniterm )是指用来表示文献主题的、最基本的、在概念上不能再分解 的词。
   单元词法对标题法的改进主要就是用单元词以后组方式组配表达标题语言中的那些标题。
   代表:穿孔卡系统

单元词法的优缺点

优点:

  1. 词表体积小;
  2. 不存在词序问题;
  3. 通过最基本的词汇可以表达大量专指概念和新概念;
  4. 每个单元词都是排检词,都可作为检索入口,从而提供更多 的检索途径;
  5. 可进行多因素组配检索,利用单元词的增减,可以较*地扩大,缩小或改变检索范围,检索的灵活性较大。

缺点

  1. 由于单元词法强调字面上的分拆和组配,导致单元词组配的语义失真或含糊不清,造成误检。
  2. 单元词之间较少存在词间关系,因此单元词法一般缺乏完善 的参照系统,难以满足族性检索的需要。

1.2.3 叙词法

   在我国又称主题词法,它是以规范化的自然语言语词为叙词, 作为文献主题的标识,通过叙词的概念组配表达主题概念的一 种主题法。

   所谓叙词(Descriptor)我国多称主题词,是取自自然语言,经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。

叙词法的优缺点
■优点:

  1. 具有主题法的共同优点;
  2. 因采用组配方式,可以实现多向成族,多途径检索,多因素组 配检索,灵活地扩检、缩检或改变检索范围;
  3. 能以较少的语词表达较多的概念、较专指的概念、新的概念;
  4. 因遵循概念组配原则,保证了组配语义的准确性;
  5. 因采用多种手段显示词间关系,具有较好的族性检索功能。

■缺点:

  1. 编制和使用的难度较大;
  2. 组配语义的明确性稍差。

1.2.4 关键词法

   直接以文献中能够表达主题概念的关键词作标识的一种准主 题法。或者说,关键词法是由计算机或人工从文献中抽取关键词作标识,并按字顺排列,提供主题检索途径的方法。
■所谓关键词(Keyword)是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。

■关键词法的主要特点:

  1. 首先,关键词是自然语言的语词,一般不作规范化处理。
  2. 其次,一般不编制受控词表(关键词表)进行词汇控制,不显示词间关系,只是编制禁用词表(非关键词表)来控制抽词。
  3. 比较适合于计算机检索

1.3 叙词法的原理

1.3.1 综合性原理

叙词法是多种情报检索语言的原理和方法的综合,主要表现为:

  1. 叙词法采用自然语言的语词作标识,但更严格地对自然语言语词 实施规范化处理或控制,以保证标识与概念之间的唯一对应;
  2. 叙词法适当采用标题法的预先组配,选用必要的词组,放弃单亓 词法的语词尽可能分解原则,以减少组配操作和组配误差;
  3. 叙词法采用了分面组配分类法的概念组配来取代单元词法的字直 组配,以增强组配语义的确切性;
  4. 叙词法采用并进一步完善了标题法的参照系统;
  5. 叙词法采用体系分类法的原理编制叙词分类索引(范畴索引)底 等级索引(词族索引),甚至直接引入体系分类表或分面分类表 ,实现分类主题一体化;
  6. 叙词法采用关键词法的轮排方法,编制叙词轮排索引。

1.3.2 概念组配原理(基本原理)

   在叙词语言采用的多种原理方法中,概念组配是最基 本的原理,它是决定叙词法特点和性能的根本因素。

概念组配
■操作系统接口——操作系统+软件接口
■典型安装——标准化+软件安装
■中国经济难题一一经济+问题+研究+中国

叙词概念的组配类型
■交叉组配
   即同级词组配,通常是指两个或多个表达相同性质概念的叙词。例如,参与组配的叙词所表达的都是学科,都是设备,都是动物等。
信息组织 | 信息组织主题法

■方面组配
   在一个表示某一事物的叙词与表示事物方面(部分、属性、状态、过程、条件、关系等方面)的叙词之间进行的概 念限定的逻辑推演,结果可形成一个新概念。这 个新概念表示该事物的某一方面或某一特称。
   方面组配的范围很广,使用也较*,绝大多数的叙词组配是方面组配。
信息组织 | 信息组织主题法

■联结组配
   其作 用是表示两个或多个事物之间的联系,实际上是方面组配的一种特殊类型。它往往是表达不同事物的叙词 之间用表示它们之间关系的叙词联结起来。
信息组织 | 信息组织主题法

■特称组配
   是指用一个表示事物类称的属概念叙词与表达“种差”(即待表达种概念比参与组配的那个属概念多出某种特征)的叙词进行组配。
   一般来说表示事物的序词与用来区分事物并表示事物的形状、形式、度量、材料等属性的序词之间的组配属于特称组配,至于表示事物与其所处空间、时间、所属的人物、民族所用的语言等序词的组配,当做特征组配比,当作方面组配更易于理解。

叙词组配的作用主要表现为:

  1. 可以控制词汇量。采用组配可以大大缩小词表的体积。
  2. 可以对同一项信息进行多途径检索
  3. 可以*扩大、缩小或改变检索范围
  4. 可以比较及时地反映新事物、新科学

1.4 主题法的功能

  1. 对信息内容加以标引的功能;
  2. 对主题相同及相关的信息予以集中或揭示其相关性的功能;
  3. 对大量信息加以系统化或组织化的功能;
  4. 便于将标引用语与检索用语进行相符性比较的功能。

2 叙词法的词汇控制

2.1 词汇选择

■词类控制
  可以作为叙词的主要是表示文献主题中涉及的事 物及事物特征的各学科领域名词术语,包括简单名词(单纯词和合成词)和名词性词组
   少量的形容词、数词、副词
■词组控制
   词组控制的准则应该是:若将词组分解后用于组配,会影响用户对其含义的正确理解或不符合用户的使用习惯,就不应将词组分解,而应选择词组作叙词,反之,就不应该选择词组作叙词(正式叙词)

2.2 词形控制

■词形控制
   叙词法的词形控制主要是指对同义不同形的词优选其中的一种形式作叙词(正式叙词),以避免信息分散而降低检全率,有利于字顺排列。
■同义词的控制
   在词义相同而词形不同的语词之间,只能优选其中的 一个作叙词,其余的则可以作为非正式叙词(入口词)收入词表
准同义词的控制
   准同义词,是指含义相近或不同,但在标引和检索时没必要予以区分,可以作为同义词处理的那些词。

2.3 词义控制

叙词法的词义控制
   主要是对多义词(同一词形表示的多个词义有相关性)、同形异义词(同一词形表示的多个词义之间不相关)和词义含糊而导致理解不一的词进行处理,使叙词的词义具有单一性和明确性。
■叙词词义控制主要采用以下措施:

  1. 加限定词;
    凡是一词多义,可以对本义不加限定,对转义加限定,也可以全部加限定。
  2. 用注释;
    含义注释、用法注释、历史注释
  3. 其它措施:

2.4 词间关系控制

■词间关系符号

信息组织 | 信息组织主题法

■等同关系词汇控制

  • 等同关系
    • 是指叙词与非正式叙词之间的关系;
    • 汉语叙词表的词间等同关系用字母"Y"和"D"表示。

■等级关系词汇控制
等级关系
   是指上位叙词和下位叙词之间的关系,亦称属分关系。叙词 等级关系是双向显示的。

汉语叙词表中,叙词之间的等级关系参照符号有:

  • "S"是上位叙词的指引符,用在下位叙词下,指出它所属的上位叙词;
  • "F”是下位叙词的指引符,用在上位叙词之下,指出它的 下位叙词;
  • "Z"是族首词指引符,用在依等级关系构成一族的,除族首词及族首词的直接下位词之外的其它叙词下,指出它所属 词族的族首词(一族词中最泛指的上位词)。

叙词之间的等级关系,主要包括:

  • 属种关系
  • 整体与部分关系

   ■相关关系词汇控制

   相关关系的显示是双向的,所用的参照符号只有一个,在汉语叙词 表中用"C"表示相关关系。

   相关关系的范围很广,灵活性很大,种类很多,很难严格界定。

3 叙词表的结构和编制

3.1 叙词表的宏观结构

一般宏观结构:
信息组织 | 信息组织主题法

3.1.1 字顺表(主表)

  字顺表是将众多叙词款目和非正式叙词款目按字顺排列的词汇表
  叙词包括普通叙词和专有叙词两大类

3.1.2 专有叙词表

  ■专有叙词的范围较广,如地区索引、人物索引、 机构索引、产品索引等。

  ■单独设立专有叙词表的目的主要有两个:
    1. 压缩字顺表的篇幅,方便从字顺表查词;
    2. 便于用户迅速查到所需的专有叙词,不必去词量较多的主表中查找。

3.1.3 轮排索引

  轮排索引又称轮排表,是将叙词按其词素的字顺轮流排列到检索入口,使含有相同次数的词集中在一起的。
  轮排索引的轮排方式有三种,一种是词外轮排; 二是词内轮排,三是倒置轮排。

3.1.4 双语种对照索引

  ■双语种对照索引

  是将全部或大多数叙词和非正式叙词与其外语译名相对应,按外语译名字顺排列的索引。我国的叙词表多编制英汉对照索引。

  ■双语种对照索引的功能:
    1. 提供从对照语言的语词字顺入手查词的途径;
    2. 帮助查找对照语种文献。

3.1.5 字顺索引

  ■字顺索引
  是将叙词(或包括非正式叙词)按字顺排列,而 不包含叙词款目中的其它项目的一种索引。
  ■字顺索引的功能:提高主表査词速度

3.1.6 入口词表

  ■入口词表
  是将非正式叙词按字顺排列,并指出其对应叙词 的索引。
  ■入口词表的功能:
    1. 提高查词速度;
    2. 减少选词错误

3.1.7 范畴索引

  ■范畴索引
  是按叙词表全部叙词和非正式叙词所属学科或范畴编制的词汇分类索引。

  ■范畴索引的功能:

    1. 便于从学科或专业角度查找叙词;
    2. 用于组织分类主题目录(索引)式的检索工具

3.1.8 词族索引

  ■词族索引
  是将字顺表中具有等级关系的需 成词族,并按各词族的族首词与 引。
  ■词族索引的功能:

    1. 提供从族首词出发,查找所需侖
    2. 借助上位词,下位词和同位词,
    3. 方便进行扩检和缩检

3.1.9 分类表

  ■分类表
  是指实现分类主题一体化的词表中,与字顺表相配合的分类表,它不同于叙词分类索引。
  ■分类表的功能:
  帮助从学科分类的角度查表选词

3.1.10 叙词关系图

  形象、直观但编制复杂
  环形图、箭头关系图、树形结构图

3.2 叙词表的微观结构

3.2.1 字顺表的微观结构

叙词(主题词)款目的著录项目一般包括:

  • 款目叙词项
  • 汉语拼音和对应的外语(英语)译名
  • 标注项
  • 参照项

非正式叙词(又称非正式主題词)款目包括:

  • 款目词项
  • 标注项,不包含注释项
  • 参照项,仅有"用"参照项,指出代替它的叙词

款目词的排列
一般按字顺排列

汉语叙词表:

  • 音节—音调—字形顺序排列法
  • 音节顺序—字形顺序排列
  • 逐字母排列法

西文叙词表:

  • 逐词排列法
  • 逐字母排列法

3.2.2 范畴索引的微观结构

  ■类目(范畴)的设置。一方面应以学科分类为基础,另一方面应该考虑词汇分类的需要。一级类目一般是较大的学科、专业领域,类目细分一般只到二级或三级。
  ■类目的组织。范畴索引的类目大多是按类目内容的逻辑联系加以组织,类似于等级分类体系,我国的叙词表均是如此。
  ■类目的标记符号。一般采用层累制
  ■各类下词的组织。范畴索引收入主表的全部叙词和非正式叙词,附表的词因本身具有明显的范畴划分性质,一般不再收入范畴索引。叙词和非正式叙词只放入每个类系的最下一级类,并在类下按字顺排列。

3.2.3 词族索引的微观结构

  ■收词限制。词族索引只收字顺表和附表中具有等级关系的叙词。 没有等级关系的叙词不收入,非正式叙词不收入。
  ■词族的确定。族首词应是外延较宽、内涵较浅并且有实际检索意义 的叙词。
  ■族内词的确定。各词族内的叙词先按等级关系分级排列,并且前置小圆点表示等级:族首词前不加小圆点,二级词前置一个小圆点,三级词前置两个小圆点,依此类推。
  ■词族的排列。每个词族依其族首词字顺排列,汉语词族索引一般按 族首词的汉语拼音排序。

3.2.4 双语种对照索引的微观结构

  ■译名的范围
  一般应收录全部叙词及非正式叙词的译名。但是,如果有些叙词难以找到合适的译名,也允许空缺。
  ■译名的单复数形式
  对于一般科技名词,其英译名依英文习惯,可数名词用复数,不可数或集合名词用单数;对表示学科专业领域、工艺过程以及事 物的性质、状态、特性的词,—般用单数形式。
  ■译名与叙词的对应关系
  两种语言的词或词组之间并不总是一一对应。
  ■译名的排列
  双语种对照索引按译名的字顺排列。一般采用逐词字顺排列法。

3.2.5 轮排索引的微观结构

  ■收词范围
  轮排索引最好是将叙词表的全部叙词和非正式叙词都予以编排;轮排索引也可以只收词组叙词,不收单词素叙词和非正式叙词。
  ■轮排形式
  轮排索引可以选择的轮排形式至少有三种:词内轮排、词外轮排、倒置轮排。其中,以词内轮排形式采用较多。
  ■款目包含因素
  轮排索引的款目因素,除了被轮排的词之外,可以或多或少地包含这些因素:词在字顺表中的位置、范畴号、参照项、外文译名等。

3.3 叙词表结构的变化

  叙词表又逐歩向功能增强.结构简明的方向发展。
具体表现为:

  1. 字顺表与词族索引合并
  2. 范畴索引与词族索引合并
  3. 字顺表与专有叙词表(附表)合并,许多词表不设专有叙词表。
  4. 以详细的分类表(分面分类表或等级列举式分类表)取代范畴索引和词族索引,实现分类主题一体化

3.4 叙词表的编制与维护

3.4.1 叙词表的编制程序

  —般的编表程序为:
  总体设计——>制定编制规范——>收集词汇——>整理词汇——>试标引

3.4.2 叙词表的一般收词原则

  1. 目标性原则
  2. 文献保证原则
  3. 用户保证原则
  4. 组配优先原则
  5. 基本词汇完备和精炼原则
  6. 兼容性原则

3.4.3 叙词表的修订内容

  1. 增补语词及词间关系
  2. 删除不必要的词及词间关系
  3. 修改款目词及其著录项目
  4. 微观和宏观结构的调整

3.4.5 计算机在叙词表编制管理和使用中的应用

  1. 计算机在叙词表编制过程的应用
  2. 计算机在叙词表管理中的应用
  3. 机读叙词表在计算机网络中的使用

4 参考资料

《信息组织(第三版)》,戴维*编,高等教育出版社,2014年.  
《信息组织(第四章)》PPT