复习大纲.docx
- 文档编号:11691699
- 上传时间:2023-06-02
- 格式:DOCX
- 页数:26
- 大小:212.21KB
复习大纲.docx
《复习大纲.docx》由会员分享,可在线阅读,更多相关《复习大纲.docx(26页珍藏版)》请在冰点文库上搜索。
复习大纲
信息检索重点内容:
1文献的等级划分:
一次文献、二次文献和三次文献P1
2文献的十大类型(或一次文献的十大类型)P2-4
3分类法,如中国图书馆分类法的编制规则、文献的大类类号与UDC判定P4-6
4按语言结构原理划分的检索语言类型P6
5网络信息检索的主要六种技术P7
6网络信息检索的一般程序(如何调整检索策略?
)P8-9
7专利知识:
国际专利分类表的八个部、完整的国际专利分类号的构成等P14-16
8掌握搜索引擎的检索技巧、数据库的检索词确定与检索式构建问题P10-13
9一些校验码的计算,如ISBN、专利号等上课做过
信息检索复习大纲
一 信息、知识与文献
1.文献的概念及文献等级
我国国家标准《文献著录总则》下的定义是:
“记录有知识的一切载体(供记录信息符号的物质材料,称之为载体材料)。
”
依据文献传递知识、信息的质和量的不同以及加工层次的不同,人们将文献分为三个等级,分别称为一次文献、二次文献和三次文献。
(1)一次文献
这是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也常被称为原始文献(或叫一级文献),其所记载的知识、信息比较新颖、具体、详尽。
一次文献在整个文献中是数量最大、种类最多、所包括的新鲜内容最多、使用最广、影响最大的文献,如期刊论文、专利文献、科技报告、会议录、学位论文等。
(2)二次文献
二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。
其主要类型有目录、索引、文摘等。
(3)三次文献
三次文献也称三级文献,是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。
它通常是围绕某个专题,利用二次文献检索搜集大量相关文献,对其内容进行深度加工而成。
属于这类文献的有综述、评论、评述、进展、动态等。
如:
下列文献中属于一次文献的有( )。
1)学位论文
2)文摘
3)期刊论文
4)综述
下列文献中属于二次文献的有( )。
1)期刊论文
2)学位论文
3)专利文献
4)索引
二文献的类型与文献分类法
(一次)文献大致可分为十大类型,即图书、期刊、会议文献、专利文献、科技报告、学位论文、标准文献、政府出版物、产品资料和说明书、档案。
(一次)文献的类型
1,图书,一般是对已发表的科研成果、生产技术和科技知识的概括和总结,它通常以一次文献为基本素材,经过著者的选择、分析、鉴别和融会贯通重新组织写成的。
图书的著录特点是:
有书名,有著者,有的还有编者;必有出版地、出版社名和出版年份;非第一版的图书有版次;有的图书还给出国际标准书号(ISBN)。
这四点中第2点较重要。
孙家广,杨长青.计算机图形学[M].北京:
清华大学出版社,1995.26~28
ISBN978-7-205-06683-3是:
答:
A.国际标准书号
B.国际标准刊号
C.图书分类号
D.标准号
2,期刊,一般是指连续出版物,其特点是有固定的刊名和固定的出版形式年,每年至少出版一期,每期都有连续的卷、期或年月的顺序号码,篇幅、开本和装帧也比较固定。
出版周期短,刊载论文速度快、数量大、内容新颖、丰富,能及时反映飞速发展的科技水平,许多新观点、新成果都首先在期刊上发表。
中国标准刊号(CSSN)由一个以“ISSN”为标识的国际标准刊号(Internationalstandardserialnumbering–ISSN)和一个以中国国别代码“CN”为标识的国内统一刊号两部分组成,其一般格式如下:
ISSN××××-××××
CN××-××××/YY
例如:
ISSN1000-0097
一篇论文列出的参考文献如下:
FortunatoCristobal;PaulWorley.Transforminghealthprofessionals'education[J].TheLancet,2011,377(6379):
1235-1236.其中的说法正确的是:
A.作者是3位,数字表示2011年377期1235-1236页
B.作者是2位,数字表示2011年377卷1235-1236页
C.作者是2位,数字表示2011年6379卷1235-1236页
D.作者是4位,数字表示2011年6379卷1235-1236页
♦下列号码中期刊所特有的号码是:
AISSN
BISBN
CPN
DIP
正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号(ISSN)和国内统一刊号(CN)。
()
3,科技报告,是各国政府系统或科研及生产单位关于某项研究成果的总结报告或研究过程中的阶段性进展报告,其特点是每份报告为一个专题,单独成册,有机够名称,有统一编号。
内容专深而具体,技术含量大。
4,专利文献,是专利制度的产物,一切与工业产权有关的文献统称为专利文献,这是广义上的专利文献。
而狭义专利文献就是专利说明书。
我国的专利类型有三种:
发明专利,实用新型专利、外观设计专利。
其保护期分别为:
20年、10年、10年。
如:
我国外观设计专利权有效期为自申请之日起()。
A.10年B.20年C.15年D.5年
我国专利局授予专利权的条件:
符合新颖性、创造性、实用性
新颖性(Novelty):
是指在申请日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中。
创造性(Inventiveness):
是指同申请日以前已有的技术相比,该发明有突出的实质性特点和显著的进步。
实用性(PracticalApplicability):
是指该发明或者实用新型能够制造或者使用,并且能够产生积极效果。
5,会议文献,从出版时间上可以分成:
会前文献:
预印本、论文摘要;会后文献:
会议录、汇编、论文集、会议记录、报告、会议摘要、学术论文报告等。
会议文献著录的特点是:
有表示会议的专门用词,如Conference,Symposium,Convention,Workshop,Meeting,Congress,Assembly等;有的有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。
♦ExternalstimuliresponsivegelationbylowmolecularweightgelatorsFullTextByvanHerpt,JochemT.;Stuart,MarcC.;Browne,WesleyR.;Feringa,BenL.FromAbstractsofPapers,243rdACSNationalMeeting&Exposition,SanDiego,CA,UnitedState
A会议论文B期刊C学位论文D标准
6,技术标准,是对产品质量、规格、生产过程以及检验方法等所做的技术规定,是从事制造和生产的共同依据。
标准文献著录的特点是:
通常有表示标准的词如standard,recommendation等;有标准号。
标准号每个标准一个号,并按惯例由标准颁布机构代码,顺序号和颁布年份三部分构成,如“BS6839--1987”。
7,学位论文,这是高等学校的学生在取得学士、硕士或博士学位时提交的毕业论文。
学位论文著录的特点是:
通常有表示学位论文的词,如Thesis,Dissertation等;有的有论文作者所在学校的校名。
某文章列有参考文献:
吉小燕.基于循环经济的区域产业结构优化[D].南京:
河海大学,2006.用_____检索参考文献全文。
从下面选项中选择最合适的检索工具:
答:
A.我馆馆藏书目查询系统
B.万方学位论文全文数据库
C.中国国家知识产权局专利数据库
D.我馆购买的超星电子图书库
8,政府出版物,是各国政府及其所属的各个部门发表、出版的文件,内容涉及基础科学、应用技术、政治经济、文化体育等。
9,产品技术资料,产品技术资料著录的特点是:
通常有表示产品样本一类资料的词,如Catalog,Guidebook,Masterof,Databookof等;有公司名称。
10,技术档案,技术档案一般为内部使用,不公开出版发行,有些有密级限制,因此在参考文献和检索工具中极少引用。
文献分类法
文献分类法是图书馆为了方便文献收藏和借阅而采取的一种分类方法。
目前较通用的文献分类法主要有以下几种:
1.《中国图书馆分类法》
《中国图书馆分类法》的编制规则如下:
《中国图书馆分类法》(简称《中图法》),是按照一定的思想观点,以学科分类为基础,结合图书资料的内容和特点,分门别类组成的分类表。
它将知识门类分为哲学、社会科学、自然科学、马列主义和综合类五个基本部类。
社会科学部类又展开为九大类,自然科学部类展开为十大类。
《中图法》采用汉语拼音字母与阿拉伯数字相结合的混合号码,用一个字母代表一个大类,以字母顺序反映大类的次序,在字母后用数字作标记。
为适应工业技术发展及该类文献的分类,对工业技术二级类目,采用双字母。
《中图法》部类名称如下:
●马克思主义、列宁主义、毛泽东思想、邓小平理论
A马克思主义、列宁主义、毛泽东思想、邓小平理论
●哲学
B哲学
●社会科学
C社会科学总论|D政治法律|E军事|F经济|G文化科学教育体育|H语言|I文学|J艺术|K历史地理
●自然科学
N自然科学总论|O数理科学和化学|P天文学|Q生物科学|R医药卫生|S农业科学|T工业技术|U交通运输|V航空航天|X环境科学
●综合性图书
Z综合性图书
要掌握根据中图法,会判断图书所属大类,如诺贝尔文学奖获奖作家传略、毛泽东著作及传记等。
2.《中国科学院图书馆图书分类法》
《中国科学院图书馆图书分类法》(简称《科图法》),同《中图法》一样将知识门类分为5大部类,但它在这五个基本部类序列的基础上,组成了25个基本大类。
各级类目的分类号码采用单纯的阿拉伯数字制,不附加任何基本符号,单纯简洁,易写、易记。
号码分为两部分,第一部分采用顺序制,从00-99分配二十五个大类及其主要类目。
第二部分采用小数制,以容纳细分类目:
在号码编制技术上采用双位法,借号法和交替类等方法,使号码组配灵活,伸缩性助记性强。
3.《中国人民大学图书馆图书分类法》
中国人民大学图书馆于1952年10月编出《中国人民大学图书馆图书分类法》(简称《人大法》)初稿,1954年出第一版,到1996年的第六版,每版都有较大的补充和修改。
《人大法》的出版,在我国分类法史上揭开了新的一页。
它是我国第一部力图以马列主义、毛泽东思想为指导编制的图书分类法。
它所运用的理论和立类列类原则,一直为我国后来编制的分类法所借鉴。
4.《杜威十进分类法》DeweyDecimalClassification
杜威十进分类法(DDC)是广为全球各地图书馆使用的分类法。
这个分类系统最早在1873年时MelvilDewey有此分类构想,而于1876年正式出版。
目前,负责DDC出版的是ForestPress,而它于1988年成为OCLC下的一个部门。
DDC是用传统的学科来分类,总共以10个主要的学科(mainclasses)来涵括所有的知识体系,每个大类下细分10类(divisions),接着又再分成10小类(sections)。
DDC中每个学科都会给予特定范围的数字来表示。
000Computers,information,&generalreference计算机、信息及总类
100Philosophy&psychology哲学及心理学
200Religion宗教学
300Socialsciences社会科学
400Language语言学
500Sciences科学
600Technology科技
700Arts&recreation艺术及娱乐
800Literature文学
900History&geography历史及地理学
5.《美国国会图书分类法》
美国国会图书馆图书分类法(LibraryofCongressClassification)采用26个英文字母中的21个来作分类代码。
美国国会图书馆分类法简表OutlineoftheLibraryofCongressClassification具体为:
A GeneralWorks (总类)
B Philosophy.Psychology.Religion (哲学、心理学、宗教)
C AuxiliarySciencesofHistory (历史学及相关科学)
D History:
GeneralandOldWorld (古代史及世界各国史)
E-FHistory:
America (美洲历史)
G Geography.Anthropology.Recreation. (地理学、人类学)
H SocialSciences (社会科学)
J PoliticalScience (政治学)
K Law(法律)
L Education (教育)
M MusicandBooksonMusic(音乐)
N FineArts (美术)
P PhilologyandLiterature (语言学、文学)
Q Science(科学)
R Medicine (医学)
S Agriculture (农业)
T Technology (科技)
U MilitaryScience (军事科学)
V Navalscience (海军学)
Z LibraryScience (图书馆学)
6.《国际十进分类法》(UDC)
近百年来,UDC已被世界上几十个国家的10多万个图书馆和情报机构采用。
UDC目前已成为名符其实的国际通用文献分类法。
UDC采用单纯阿拉伯数字作为标记符号。
它用个位数(0~9)标记一级类,十位数(00~99)标记二级类,百位数(000~999)标记三级类,以下每扩展(细分)一级,就加一位数。
每三位数字后加一小数点。
如:
6 应用科学、医学、技术
62 工程、技术(总论)
621 机械工程总论、核技术、电气工程、机械制造
621.3 电工程、电技术、电气工程
621.39 电信技术
621.396 无线电通讯设备和方法
621.396.9 雷达
三 网络信息检索方法与策略
一检索语言
检索语言是根据文献加工、存储与检索的需要,在自然语言的基础上规范化了的人工语言。
按语言结构原理划分
(1)分类语言
分类语言,一般称为分类法,以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。
分类检索语言通过分类表来体现。
分类语言有体系分类法、组配分类法和混合式分类法之分。
(2)主题语言
所谓主题语言,就是以自然语言中的词语或规范化的词语作为揭示文献主题的标识,并以此标识编排组织和查找文献的排检方法。
主题语言主要包括标题词语言、单元词语言、叙词语言和关键词语言。
(3)引文语言
引文索引法是一种特殊的信息组织方法,是利用文献与文献之间的相互引证关系来组织信息,即以一些文献作为标引词,来标引和检索另一些文献。
所谓引文语言,就是这种索引词的集合,也就是说,只要一篇文献引用了其它文献,或被其它文献引用了,它就有可能成为引文索引词,进入引文索引语言系统。
二网络信息检索技术
1.布尔逻辑检索
在检索实际中,检索提问涉及的概念往往不止一个,而同一个概念又往往涉及多个同义词或相关词。
为了正确地表达检索提问,系统中常常采用布尔逻辑运算符将不同的检索词组配起来。
布尔逻辑检索是目前最为成熟的检索方法,几乎每一个搜索引擎都支持布尔逻辑检索。
尽管各个搜索引擎所使用的算符各有差异,但所执行的操作基本相同。
布尔逻辑检索一般包括“与”、“或”、“非”三种运算。
检索中布尔逻辑算符的使用是最频繁的,用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。
另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。
复合逻辑检索式中,运算优先级别从高至低依次是not、and、or,同时可以使用括号改变运算次序。
如:
在一个复合逻辑检索式中,各种运算符的优先级依次为()
A.()>and>not>or
B.()>not>or>and
C.()>not>and>or
D.or>and>not>()
2.位置检索
又叫邻近检索。
文献记录中词语的相对次序或者位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。
位置算符检索就是用一些特定的算符(位置算符)来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用自由词的一种检索方法。
3.截词检索
截词检索是计算机检索系统中应用非常普遍的一种技术。
由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼写方法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。
如果检索时将这类词全部输进去,会增加检索时间和费用,采用截词法可解决这个问题。
4.字段限制检索
字段检索和限制检索常常结合使用,这是因为限制检索往往是对字段的限制,而字段检索本身是限制检索的一种。
在一般的数据库检索中,题名、叙词、标识词、文摘这四大主题字段采用后缀符限制,如“/ti”,“/de”,“/id”,“/ab”;而其他非主题字段则采用前缀符限制,如“au=”,“py=”等。
5.全文检索
全文检索是以文献全文信息作为处理与检索的对象,它不仅提供文献的外部特征信息,而且能提供文献的篇、章、词组、字等内容信息。
6.聚类检索
聚类检索即在对文献进行自动标引的基础上,构造文献的形式化表示——文献向量,然后通过一定的聚类方法,计算文献与文献之间的相似度,并把相似度较高的文献集中在一起,形成一个文献类,根据聚类水平的不同,可以形成不同层次的聚类体系。
在正规的文献情报检索系统中,对于检索方法、检索用词、检索式的列举以及其它操作都有严格的规范和限制。
以上6种检索方法,并非每一个检索系统都有所有的功能,也并非所有的数据库结构和数据都支持这些检索方法。
四网络信息检索的步骤或策略
进行网络信息检索,一般来说要经过以下基本程序:
分析检索课题,选择检索系统及数据库,确定检索词,构建检索提问式,上机检索并调整检索策略,输出检索结果。
1.分析检索课题,明确检索需求
分析检索课题、弄清课题的专业范围及所涉及的相关问题和检索过程中的进一步要求,通常可以从以下几方面考虑:
(1)明确信息需求的目的和意图。
检索目的往往是多方面的。
有的是在从事某项科研工作前对该课题进行全面普查,需要广泛收集资料,以便撰写可行性论证报告或立项方案;有的则是为了解决技术革新或试制新产品中的某个技术难题;有的则是为合资经营或外贸谈判查询外国公司的背景及经营状况;有的是为申报专利查找国外文献与专利资料;有的则是为撰写学位论文或科研论文查找国内外参考资料等。
(2)分析课题涉及的学科范围、主题概念。
弄清检索资料的学科范围与主题概念是提高检索效率的重要前提。
(3)弄清课题所需信息的类型、特征,包括文献类型、出版类型、年代范围、语种、著者、机构等。
(4)了解课题对查新、查准、查全的指标要求。
2.选择检索系统和数据库
选择数据库时必须从以下几个方面考虑:
(1)数据库收录的信息内容所涉及的学科范围;
(2)数据库收录的文献类型、数量、时间范围以及更新周期;
(3)数据库所提供的检索途径、检索功能和服务方式。
3.确定检索词和检索途径
检索词一般指文献记录中的文献特征标识,既可以是反映文献内容特征的主题词、自由词等,也可以是反映文献外表特征的作者、篇名、机构等,这些都可以通过检索系统的使用手册或指南以及主题词表等得以明确。
选择反映文献内容特征的检索词,一般有以下几种方法:
(1)选用主题词当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果;
(2)选用数据库规定的代码许多数据库的文档中使用各种代码来表示各种主题范畴,有很高的匹配性。
例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号;
(3)选用常用的专业术语在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词;
(4)选用同义词与相关词同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。
检索途径通常与数据库的正文排列方式及其倒排文档的类型相关,倒排文档是将主文档中的可检字段(如主题词,著者)抽出,按某种顺序重新排列起来所形成的一种文档。
一种倒排文档就是一种检索途径,不同的数据库,其倒排文档的种类与数量都不同。
选择检索途径与确定检索词相辅相成,在实际检索活动中,确定检索词也就意味着选择了检索途径。
如选择某公司名称为检索词,即意味着确定了公司名称为检索途径。
4.构建检索提问式
检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。
检索提问式构建得是否合理,将直接影响查全率和查准率。
构建检索提问式时,应正确运用逻辑组配运算符:
(1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高;
(2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高;
(3)使用逻辑“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。
另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。
5.实施检索并调整检索策略
构建完检索提问式后,就可以实施检索了。
检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较满意的结果。
(1)检索结果信息量过多
产生检索结果信息量过多的原因可能有以下两点:
一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。
在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。
调整检索策略的方法如下:
减少一些相关性不强的检索词或采用检索词的下位词进行检索;
增加检索限制,采用逻辑“与”连接检索词;
使用字段限定,将检索词限定在某个或某些字段范围,如限定在篇名或关键词字段中;
使用逻辑“非”算符,排除无关概念;
调整位置算符,由松变严。
(2)检索结果信息量过少
造成检索结果信息量少的原因有以下几点:
首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复习 大纲