信息组织学考试范围.docx
- 文档编号:8749363
- 上传时间:2023-05-14
- 格式:DOCX
- 页数:30
- 大小:35.76KB
信息组织学考试范围.docx
《信息组织学考试范围.docx》由会员分享,可在线阅读,更多相关《信息组织学考试范围.docx(30页珍藏版)》请在冰点文库上搜索。
信息组织学考试范围
信息组织学考试范围
1.信息组织概念 亦称为信息资源组织,它是根据信息资源检索的需要,以各种媒体、类型的资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的活动。
2、信息组织与信息检索的关系
(1)信息组织是依据信息资源的主题内容或特征,将无序的信息资源组织为有序集合的过程。
信息组织是信息检索的基础,通常是根据检索的需要,以信息资源的一定单元为单位,记录信息资源的特征,并根据需要对部分信息资源进行必要的相关处理,然后将这些信息资源、记录或条目,按规定的方法输入系统,组成文献资源库或信息检索系统。
(2)信息检索则是根据需要,从检索系统中检出相应信息资源的过程。
信息检索是信息组织的目的和归宿,是信息组织的反向过程。
3、文献组织的两种基本排列方式
其一,固定排列法,固定排列法通常按照文献的形式、到馆先后以及具有固有次序的号码,如专利号、标准号、报告号等排列文献资源;这类文献资源包括档案、博物馆的收藏品,此外如光盘、录音带、缩微品等。
其二,按一定意义的次序排列。
包括按照题名字顺排列、责任者排列等,但使用最多的,是按分类方式排列。
由于以分类方式组织文献资源,可以通过内容特征上的联系提供检索的途径,供用户直接对文献资源进行检索,为使用提供方便,因此一般文献单位均采用分类排列的方法。
4、按照检索工具依据的标识特征和提供的检索途径,检索工具可以分为以下两种类型:
(1)直接依据信息资源的外部特征为标识作为组织依据
(2)以表达信息资源主题内容的标识为依据。
主要有分类法和主题法。
分类法以表达信息资源内容的标记符号为标识,按照依据主题之间关系进行系统组织。
主题法直接以表达文献内容的语词为标识,依据主题字顺的方式提供检索途径。
使用主题内容检索,不必预先了解信息资源的具体特征,可以直接从所需要的主题内容入手查找。
5、传统文献单位对文献处理的基本目标主要包括:
(1)识别、确认需要处理的所有的物理媒介的文献资源;
(2)确认文献中或其部分中的著作;
(3)按照标准引文规则生成这些文献和著作的系统;
(4)提供有价值的检索点,至少包括题名,责任者和主题等;
(5)在文献单位或其他检索集合中提供某种评论资源的方式。
6、信息资源的处理,其基本做法是:
1)对信息资源进行描述
2)对信息资源的内容进行浓缩
3)提供检索点
7、检索语言概念
检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
它是根据检索系统的特点,按照使用需要和对知识关系的理解预先组织好的一种信息资源组织方法的体系,是信息组织方法的具体体现。
检索语言由词汇和语法两部分组成
信息组织的目的是为了有效地检索和利用,一般认为一个信息检索系统必须考虑的重要因素有“全、准、快、便、省。
”也是评价系统检索效率的几个重要指标.
8、检全率与检准率互逆关系
一般而言,检索系统的检全率与检准率之间是一种互逆关系.检全率高,必然会检出一些内容关联程度较低的文献,从而影响系统的检准率;反之,提高检准率,要求排除与检索提问相关程度较低的文献,从而影响检全率。
9、文献入选的标准:
应包括:
权威性、时效性、持久性、广泛性。
(1)权威性:
文献是否由图书馆、档案馆、政府机构建立或有学会的背景,著者是否有声望.
(2)时效性 现有的网址是否有编辑人员定期更新.
(3)持久性 网址的制作机构是否持久,该文献是否为新闻性、时效性较强的文献,是否为个人主页。
(4)广泛性 是否有用户推荐过此类资源,是否具有广泛使用价值,该文献是否曾为书目工具或文章引用。
10、词汇控制
指根据文献标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程.Y、D、F、S、Z、C即代、用、分、属、组、参
11、句法控制
句法控制是指根据文献标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
12、自然语言句法灵活性的特点不符合检索语言的需要。
它不利于以明确、统一的方式集中对文献进行组织,不利于明确表达组配的含义,应根据检索系统特点加以控制,通常应在一定组配方式的基础上,采用相应的句法措施实现。
常见的形式包括:
组配次序,使用辅助符号,轮排等。
13、常见的句法转换形式包括:
轮排转换 链式转换 分拆转换
①轮排转换(转动轮排)。
即依次将检索语句中每一个有检索语言语义的语词轮流在排检位置上排列,并对句子中其他语词在保持相对位置不变的情况下随着移动
②链式转换。
即通过逐次拆卸链环的方式,依次将检索语句中每一个有检索价值的语词作为检索语句的入口。
③分拆转换。
即每次抽取少量主题词组成组配标题,使所有有检索价值的词都可以成为检索入口。
14、西汉刘歆《七略》是中国历史上第一部综合性的图书分类目录
15亚里士多德将人类的知识分为:
理论科学(逻辑学、物理学、数学、形而上学)。
实践科学(伦理学、经济学、政治学)。
创造科学(诗学)。
中国古代知识分类思想分甲、乙、丙、丁四部统领。
16、文献组织应考虑的因素
⑴文献保证原则
指依据文献的特征、数量进行相应的控制。
信息检索系统处理的对象是各类文献,信息描述及主题内容标引和揭示中词汇的选择、处理以及句法措施应根据文献特点、数量和内容特征进行。
在信息描述中,不同的文献,如文本信息和图像信息各有其不同的特征,应根据其特点确定其描述项目和描述的方法。
⑵用户保证原则
所谓用户保证,即根据用户需要进行描述控制和词汇控制
⑶与设备条件相适应
信息组织中的规范控制是通过一定的设备条件发生作用的,只有与设备条件的特点保持一致,才能取得较好的实际效果
⑷应尽量取得费用和效果的平衡
检索系统的各种性能以及性能与费用效益之间的关系是相对的。
关键是在各种关系的基础上确定适合的度。
例如:
必要的信息描述会增加系统的费用,但可以增加检索的入口,方便用户对文献选择判断,节省用户的时间.
⑸重视规范控制技术方法的完善和使用
随着检索系统的变化和研究进展,词汇控制的技术方法不断完善,各种新的方法不断出现,要有效进行词汇控制,必须善于结合现有条件和使用环境,通过对各种技术方法的借鉴融合,不断改进。
17分类法的含义
类:
指一组具有某一共同属性的事物对象的集合,如计算机,汽车发动机。
分类:
是指依据事物的属性或特征加以区分和类聚,并将区分的结果按照一定的次序进行组织的活动。
18、信息资源分类,是指根据信息资源内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭示的方法。
19、分类(法)表,亦称信息资源分类表,是根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具
20信息资源分类一般具有的特征:
(一)、按照信息资源内容特征的相互关系加以组织
(二)、一般是从一定的角度出发组织信息资源
(三)、以一定标记符号作为排序工具
(四)、一般通过类目索引提供从字顺角度查找类目的途径
文献分类体系一般均以一定的标记系统表示类目的相对位置或相互关系。
如:
G25
这一标记系统通常由有序的符号如数字或字母组成,其特点是简短、明了,排序性好,利用它作为排检依据,可以按照类目体系方便地对文献和检索工具进行系统组织和揭示,从而充分发挥分类法在文献信息组织中的作用。
21标记符号的不足是直观性差,必须结合类名加以使用,从而在一定程度上影响了分类法的使用效果。
为方便用户使用,网络分类检索工具在检索界面中一般不显示标记符号。
22信息资源分类的作用:
主要用于信息资源组织和揭示,包括文献分类排架和编制分类检索工具两个方面
分类检索工具包括分类目录、索引等,其形式不仅包括卡片式、书本式等手工方式,也可以用于机检系统,是一种按照内容之间关系系统揭示信息资源的检索工具。
23分类法的类型
信息资源分类法按照其编制方式,通常可以区分为:
等级列举式;分面组配式;列举组配式三种。
24分面组配式分类法,是一种为克服等级列举式分类法的不足,适应现代信息资源标引和检索的需要发展起来的分类法类型。
《冒号分类法》
分面分类法的特点是:
①标引专指,可以通过基本概念的组配,充分揭示信息资源中的复合主题;
②标记表达性强,可以表达出主题成分所属的分面,便于根据不同需要,调整组配次序,进行多元检索,例如:
可以将上述标记轮排,提供从不同角度检索;
③对科学发展的适应性强,可以通过组配方式,表达新产生的复杂主题,有利于与科学的发展保持同步;
④类表的篇幅较小,便于管理、修订等。
25分类法结构剖析
分类法主要是通过类目体系的系统排列进行词汇控制的。
各种分类法虽然在组成方式上存在着差异,但其组成结构基本上是相同的。
对于分类法的结构组成目前大致有两种划分方法:
一种按照分类法组成部分的功能,将分类法的组成分为类目体系、标记符号、说明与注释、类目索引四部分
另一种按照分类法构成的形式,将其分为编制说明、主表、副表、类目索引。
26主表
(1)基本部类我国综合性文献分类法采用的基本部类,一般依据对知识领域整体关系的了解,将知识门类分为哲学、社会科学、自然科学三大部类;同时根据马列主义、毛泽东思想的指导作用和文献分类本身的需要,设置马列主义、毛泽东思想和综合性图书两大部类,构成五大部类。
(2)基本大类
又称为基本大纲,是分类法列出的第一级类目,也是分类法整体框架的体现。
早期的文献分类法,如《杜威法》,当时基本大类只设置了十个类目,比较概略;其后编制的分类法逐步增加了大类数量,一般均以传统学科领域为基础,将基本大类保持在20个左右。
如《国会法》21个、《布立斯书目分类法》22个、《中图法》22个、《科图法》25个等,各个基本大类的规模也比较均衡;《冒号分类法》的大类一度曾达到42个,但由于大类过多不利于用户对分类法的整体把握和标记分配,因此,第七版将其规定为26个大类。
27简表
亦称为基本类目表,是由分类表的基本类目组成的表。
通常于基本大类下展开二、三级形成,是一个承上启下的表。
简表的作用有两个:
一是可以帮助用户迅速了解整个分类法的概况,以便通过它的引导,方便地在详表相应门类中查找相应的类目;
二是可供概略分类使用,如直接作为中小型文献单位的标引依据,或供专业文献单位对非专业文献标引时使用。
28分表的定义及作用
这种将主表中按同一标准对类目划分产生的一系列相同子目抽出,单独编列,供主表有关类目共同使用的表称为复分表,亦称副表、辅助表、共性区分表。
复分表的作用:
①缩小类表的篇幅 通过使用复分表,可以使类表在较小篇幅的情况下,达到较大的细分程度。
对于已经编制复分表的共性类目,在需要进一步揭示时,不必在类表中重复设置类目,只要规定使用复分表就可以了。
②加强类表的伸缩性 可以根据实际使用的需要,通过在分类体系展开中增加或减少复分表的使用,调整细分程度,加强类表的灵活性。
③增强类表的规律性 采用统一方式编列共性子目、配置号码,有助于使类目体系的列举更加一致,增加类目的助记性。
29、所谓标记符号,亦称分类号,是分类法中用于标识类目的代号。
分类号的要求
分类号通常由数字、字母及相应的辅助符号组成。
在实际使用中,分类号一般应当符合以下4个要求:
(1)简明性
要求号码简短明了、顺序性强、易读、易写、易记、易于排检、易于输入电子计算机,适合实际使用的需要。
(2)表达性
指号码不仅能表达类目的排列次序,而且能揭示类目的结构特点。
类号的表达性大体有两类:
一、能表达类目体系的等级性,揭示类目的从属、并列关系;
二、能表达类目的分面结构,显示复合主题的组配成分。
(3)容纳性
又称扩充性,指标记系统能根据发展的需要,随时为类目体系的各种增补变动配以恰当的号码。
(4)助记性
即帮助记忆的能力。
目的是通过号码配置中的规律性,改进标记的易用性,改善检索效果。
30.号码种类
按照号码组成成分,分类标记可以分为单纯号码、混合号码两种。
(1)由一种具有固定次序的符号系统组成的号码,称为单纯号码。
(2)由两种或两种以上具有固定次序的符号系统组成的号码,称为混合号码。
31.编号制度
按照号码的组成方式,分类标记一般可以分为顺序标记制、层累标记制、顺序-层累标记制、分面标记制等基本类型。
(1)顺序标记制
按照类目在分类体系中的次序,配以顺序号码,号码只表示类目的次序,不显示类目的等级或其他关系,这种配号方式称为顺序标记制。
(2)层累标记制
按照类目划分等级配置相应位数号码,号码不仅可以反映类目次序,并可以根据标记的位数判断出类目的等级,通常一级类目用一位号码表示,二级类目用二位号码表示;同位类再顺序配以号码,这种标记方式,称为层累标记制。
层累标记制的优点是,可以揭示类目的等级结构,使用它能够在机检系统中通过标记逐级显示分类体系。
其不足是,如类目划分等级较深,会造成号码过长;其次,如同位类数量较多,超过号码的基数,就无法严格按等级编号。
(3)顺序-层累标记制
一种结合采用顺序制和层累制的标记方式。
顺序一层累标记制的典型例子是《科图法》的标记系统,该标记的前两位数字采用顺序制,用于标示基本大类和二级、三级类目;两位数字后,用小圆点隔开,其后基本使用层累标记制。
(4)分面标记制
通常以特定的符号或组配方式表示各个主题因素所属的分面,使号码不仅能够揭示类目的次序和等级,而且能够显示类目的分面结构
分面标记制的优点是其表达性及由此带来的可组配性,可以充分揭示文献主题,并进行轮排和组配检索。
其不足是号码成分复杂,标记冗长,排序性差,很难适应文献排架的需要
32。
标记技术
为了使标记系统在具有表达性的同时保持容纳性和简明性,分类标记一般还采用以下各种标记技术:
1)八分法
2)集团标记法(双位制)
3)借号法111
4)预留空号法
5)对应编号法
6)字母标记法
33.类目索引
分类表是按照类目之间的关系组织起来的一种系统组织和揭示的工具
.类目索引是一种按主题字顺方式,从主题名称指向分类号或相应类目,帮助分类人员利用类目表的工具
34.引用次序
分类标准使用的先后次序规定类目体系的展开方式,规定复合主题如何集中,是分类系统建立的中心问题之一。
在分类体系建立过程中,选择何种属性为分类标准以及按照何种次序加以引用,决定着类目体系展开方式,对分类体系的性能有直接影响。
35。
同位类概念
从同一个上位类区分出来的一组处于同等地位的子目,称为同位类。
一组同位类,称为一个类列。
36.交替类目概念
所谓交替类目,是指在为一个知识门类设置使用类目的同时,在相应门类下设置的具有同一关系的类目
交替类目是传统分类体系处理多重从属关系与类目体系单线排列这一矛盾的主要方法。
它的设置可以完整体现一事物的多方面联系,方便用户从不同角度查找该类目;同时也提供了选择使用的可能,使分类法具有一定的灵活性。
37.类名的选择:
一般认为类名的选择应具有以下4要求:
(1)科学即类名应使用能准确反映其含义,
(2)简明 即所使用的词汇应简短、明了,尽量使用精炼的术语,避免冗长、拖沓
(3)确切 即语词应能准确反映类目的内容含义,贴切揭示类目概念的内涵和外延,使用类名无法确切揭示类目范围时,应通过类目注释加以补充说明。
(4)通用 即使用的语词应符合用户使用的习惯,有较好的通用性。
特别是在通用性的分类工具中,应以多数用户的使用需求为依据,使类名易于理解,不会给信息资源的查找造成困难。
38.类目之间各种的表现形式与特点:
(1)从属关系
指类目体系中一个类与其直接区分出来的子类之间的关系。
(2)并列关系
并列关系指类目体系中同位类之间构成的关系
类目体系是按照类目之间的内在联系组织起来的,能够比较充分地显示一个学科或专业领域中知识门类及其关系的全貌,便于从一个学科或专业出发对信息资源进行浏览;
(3)交替关系
指交替类目与相应使用类目之间的关系。
学科之间的关系存在着多维性。
一些知识门类往往具有多重从属关系,同时隶属于两个或两个以上的学科。
39。
《国际十进分类法》,亦译作“通用十进分类法”,是一部著名的列举-组配式分类法。
UDC与DDC、LCC一起,号称世界三大分类法。
是目前欧洲使用最广的文献分类法
40。
分类标引的意义和要求
(一)概念:
所谓分类标引,又称为归类,是指依据一定的分类语言,对信息资源的内容特征进行分析、判断、赋予分类标识的过程。
(二)意义:
1、是对信息资源进行分类组织的基础和前提。
2、通过对信息资源赋予分类标识,信息机构就可以将各种信息资源纳入相应知识门类,建立起相应的分类检索系统。
3、是许多文献单位用来进行文献组织的依据,直接关系到文献单位各项工作的开展
(三)分类标引工作一般须遵循的要求:
1、准确
第一、归类要正确,将信息资源归入对应的学科和专业。
第二、归类要确切,要将信息资源归入分类体系中最专指、最切合其内容的类目。
一般要求标引者不仅对信息资源内容有一定的分析和判断能力,而且还要求对类目体系有比较充分的了解。
2、充分
即指能根据使用需要,充分揭示有检索价值的信息资源的主题。
一般分两种情况:
第一、对只讨论一个主题对象的信息资源,只归入一个对应的类目。
第二、对同时讨论两个或两个以上主题的信息资源,则同时对这两个或两个以上主题对象进行分类标引。
这样做,可以从不同论题出发检索出该文献,实现较高的检全率。
3、一致
即对同一主题内容信息资源标引结果应一致。
包括不同标引员对同一类型主题资源赋予的分类标识应一致,同一标引员在不同时间对同一类型主题资源赋予的标识应一致。
4、适用
应考虑系统的特点和用户的检索需要,使标引结果适合使用
41、类目辨析
要将信息资源的主题归入分类体系中相应类目,首先必须掌握类目辨析的方法,准确了解类目的含义和范围
42。
标引工作程序
分类标引,是获得分类元数据的基本手段,一般需要在主题分析的基础上进行,并需经过标识转换,是一种复杂的智力劳动。
为了保证标引工作的质量,分类标引工作必须遵一定的操作程序。
包括:
查重-主题分析-归类-给号-复核
①查重
主要查核该标引对象是否为已经处理过的信息资源
②主题分析
对文献的内容特征进行分析,确定需要揭示的主题概念
③主题概念转换——归类
即将主题分析的结果归入分类体系中相应的门类。
一般应以特定的分类表为工具,根据其特点进行。
④确定标识—给号
主题分析的结果在按照信息资源的内容特征归类以后,通常应根据确定的类目给予相应的分类号。
⑤审核
在结束文献标引前,必须对每种文献的标引结果进行审核
43分类标引规则
.要使分类标引准确、一致、充分、适用地揭示信息资源的主题,除了按照分类标引的要求弄清文献的内容特征,掌握分类表的使用方法外,还必须按照分类标引的特点和要求,制订详细的分类标引规则。
分类标引的规则一般是根据检索系统的需要,根据分类表的特点并结合信息资源的特点确定的。
按照分类标引规则的特点和涉及的内容对象范围,分类标引规则一般可以分为基本标引规则、一般标引规则、特殊标引规则三类。
44。
分类索书号
分类索书号又称分类排架号,是表示一文献在分类收藏中位置的号码。
一种文献只能有一个分类索书号。
它是文献单位中文献分类排架、用户检索和藏书清点的依据。
通常分类号和书次号组成。
45。
分类检索系统
分类检索系统是一种指按照类目之间的关系建立的检索工具,一般是依据一定的类目体系建立的。
分类检索工具存在多种类型,按照检索的单元,可以分为分类目录和分类索引;按照其设备条件,可以分为手工检索系统和计算机检索系统;按照其处理的资源象,可以分为文献检索系统、档案检索系统、专利检索系统、网络资源检索系统等。
46.种次号:
读者分类款目中的同类书的排列则不必强调与分类排架一致,可以有多种不同排列方法。
其一、按与分类排架一致的排列方法排。
采用著者号为书次号的文献单位,一般严格按著者号及其辅助区分号的次序排列。
通常应依次按著者号、种次号、译本号、版本号、卷次号的次序进行同类书排列。
种次号在采用这一排列方式时,基本上可使用上述排法中除著者号以外的排列方法排,附加分类款目、分析分类款目则可排列在主要分类款目之后,再按书名或著者字顺排列。
47所谓主题法,一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径、并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。
主题法一般都具有下述特征:
、直接以语词作为检索标识。
主题法不像分类法那样,以一种抽象的号码系统作检索标识,而是直接选用自然语言中的语词进行标引和检索。
②、以字顺作为主要检索途径。
虽然主题法往往也采用按范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。
我国的主题检索系统通常是根据汉字特点,按照拼音或笔画笔顺进行排检的;因此在使用主题法检索时,只要知道检索对象的名称,就可以按相应的排检方式进行查找。
在机检系统中,一般可以直接输入语词,由计算机进行查找,通用性好。
③、以特定的事物、问题、现象,即主题为中心集中信息资源。
分类法由于受学科体系的限制,从不同学科角度研究,同一对象的信息资源是分散在各知识门类中的,主题法则是直接从主题对象的角度揭示信息资源。
④、往往是通过详尽的参照系统等方式揭示主题词之间关系。
按照字顺排列不能必然揭示主题概念之间的联系,为了克服这一局限,主题法发展了完备的参照系统,通过在主题词下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。
主题法的类型
按照主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;
⏹1、标题法
⏹ 标题词,亦称标题,并非指文献“标题”中的词,是指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。
⏹2、元词法
⏹ 所谓元词,是指用来标引文献主题的、最基本的、字面上不能再分的语词。
⏹3、叙词法
⏹ 叙词,国内亦称主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。
48。
所谓叙词法,是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。
叙词法是在吸取元词法、标题法及分面组配式分类法等的优点的基础上发展起来的一个新的检索语言语种。
叙词法其特点如下:
①结构完备,词汇控制严格,可以根据检索系统的需要对词汇进行有效控制。
②组配准确,标引能力强,能够准确、专指地标引和揭示各种主题内容;
③检索效率高,可以通过灵活组配方式进行多途径检索,达到较好的检索效果;
④对检索系统适应能力强,既能较好适应计算机检索系统的要求,又能适应手工检索系统的需要。
叙词法的不足主要是:
①由于词汇控制要求严格,词表编制和管理的难度大,需要花费较多人力、物力;
②文献标引须在概念分析的基础上进行,标引难度大,要求高。
49.关键词法。
关键词法是随着计算机的出现,为适应索引编制自动化的需要而产生的主题法类型。
这种方法直接以自然语言中未经控制或只作少量控制的语词为文献主题标识,通过对关键词的轮排的方式揭示文献主题的主题法。
50叙词表的结构
.主题标引和检索是依据一定的主题标引工具进行的。
在各种主题标引工具中,叙词表使用最为普遍,发展最为充分、最具有典型性。
按照其显示方式,可以分为字顺显示、系统显示、图形显示三种。
51。
范畴索引
范畴索引亦称分类索引,范畴表,是一种按照词汇所属学科或专业范畴编制
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 组织学 考试 范围