第一节-网络信息资源及相关知识概述.ppt
- 文档编号:18696552
- 上传时间:2023-09-18
- 格式:PPT
- 页数:60
- 大小:275.50KB
第一节-网络信息资源及相关知识概述.ppt
《第一节-网络信息资源及相关知识概述.ppt》由会员分享,可在线阅读,更多相关《第一节-网络信息资源及相关知识概述.ppt(60页珍藏版)》请在冰点文库上搜索。
2023/9/18,1,网络信息检索与论文写作,2023/9/18,2,学习目标,本课程目的在于使学生具有掌握知识情报的意识,具有获取与利用文献的技能。
以此作为培养学生自学能力和独立研究能力的重要环节。
2023/9/18,3,自学能力的培养,学习首先是获取信息的过程,转变学习观念:
学习是开放学习,主动学习,个性化的学习。
学习首先要构建学习内容的信息采集系统。
这里的学习信息采集系统分层架构:
一是构建专家人脉资源,专家人脉资源采集就是逐步了解跟进与个体学习兴趣或专业研究相关的领域前沿专家,了解他们研究方向、动态、思想体系。
二是构建专业学科知识结构,专业学科知识结构构建,就是要通过学科课程、专业杂志、相关协会等构建领域的知识框架。
三是捕获泛在的网络信息资源。
网络信息资源就是通过互联网络选择自己感兴趣的社群、网站等以获取最新的信息。
在逐步构建学习内容的信息采集系统的过程中,就要形成信息采集系统的知识地图,并采用一定的形式对其进行管理,以保持动态更新。
2023/9/18,4,学习内容,本课程主要包括两大部分内容:
1信息资源检索与利用。
2学术论文的写作。
第一部分信息资源检索与利用。
着重介绍基于因特网的数据库和网上各类学术性电子资源检索利用的方法,让学生系统了解和较为熟练地掌握各类网络资源的浏览与收集的方法及技巧,并能简单地整理和分析所检索的结果。
第二部分主要帮助学生了解学术论文写作的基本知识,包括学术论文各部分的写作要求与写作方法,学术论文的选题以及学术论文写作的常见问题等等。
2023/9/18,5,学习方法,课堂讲授和上机实习相结合1.平时成绩占40%,考试成绩占60%。
2.平时成绩包括实习成绩与上课考勤情况。
2023/9/18,6,参考教材,1.王日芬等编著,网络信息资源检索与利用东南大学出版社.2.张帆等,信息存储与检索高等教育出版社3.可以借阅:
G252.7或G354情报检索类的书。
2023/9/18,7,第一章网络信息检索概述,第一节网络信息资源及相关知识概述第二节三峡大学图书馆数字资源简介第三节信息检索的基本原理第四节网络信息检索的技术第五节网络信息检索一般步骤,2023/9/18,8,第一节网络信息资源及相关知识概述,一、信息的涵义和种类二、网络信息资源概述,2023/9/18,9,一、信息的涵义和种类,1信息的涵义信息:
是物质的一种基本属性。
它是自然和人类社会中一切事物自身运动状态与方式,是事物的内在联系和含义的表征(本体论)。
信息是认识主体所感知或所表述的事物运动的状态与方式(认识论)。
这一含义告诉我们要获得信息,必须具备一定的认识能力,其中包括信息意识,信息查找技能、信息组织能力和信息分析评论能力。
2023/9/18,10,知识:
是人类实践经验的总结,是人的主观世界对客观世界的如实反映和概括,是认识的结果。
知识是信息的一部分,是由信息提炼,转化而成的是经过人类认识,挑选,系统和深化了的信息。
获取知识的途径有两种:
一是直接来源于产生信息的客观事物。
二是通过信息载体或媒介。
获得的信息能否转化为知识,转化的是否充分、完整,取决于接受主体的认知能力。
一个人要获取知识,必须阅读文献,掌握相关的思想、事实、理论和方法等信息,在此基础上进一步分析、综合和分析,才能有所创新,2023/9/18,11,信息素质指从各种信息源中检索、评价和使用信息的能力。
信息素质的内涵具体包括能意识到准确和完整的信息是决策的基础;了解信息需求及问题所在;制定信息检索策略;掌握信息检索技术;能评价信息;能根据实际用途组织信息;使用信息,将新信息融会到现有知识结构中。
美国图书馆协会信息素质教育委员会在1989年年终报告中指出,具有信息素质的人也是具备终生学习的能力,应为他们不管碰到什么问题或做什么样的决定,都能够发现必要的信息。
2023/9/18,12,2信息的种类,
(1)按信息所依附的载体,可分为文献信息、口头信息和电子信息。
(2)按信息产生的客体性质来分类,信息还可分为自然信息、社会信息等。
2023/9/18,13,网络信息资源,是指通过计算机网络可以利用的各种信息资源的总和。
目前世界上最大的现代化信息网络是Internet,随着Internet的普及,因特网上的信息资源成为被广泛存取与利用的资源,因此,我们也可以将网络信息资源理解为“通过因特网可以利用的各种信息资源”。
因特网信息资源的特点:
信息资源丰富多样;利用不受时空限制;信息传递快捷;查询信息方便;平等性;交互性;共享性;能获取最新资料;稳定性差,变化频繁;局部有序性与整体无序性;信息质量参差不齐,价值不一。
二、网络信息资源概述,2023/9/18,14,2、网络信息资源的类型,
(1)根据网络传输协议不同,可分为:
Web信息资源、Telnet信息资源、FTP信息资源、Gopher信息资源、用户服务组信息资源等。
(2)根据人类信息交流方式不同,可分为:
非正式出版信息、半正式出版信息、正式出版信息。
(3)按信息发布方式不同可分为:
邮件型、电话型、揭示板型(公告牌型)、广播型、图书馆型、书目、型、交互型信息资源。
(4)按正式出版物类型可分为:
电子图书、电子期刊、电子报纸。
2023/9/18,15,第二节三峡大学图书馆数字资源简介,访问图书馆的几个途径1、http:
/2、http:
/3、http:
/210.42.38.354、http:
/192.168.52.5,2023/9/18,16,第三节信息检索的基本原理,信息检索是信息资源利用的重要环节。
信息检索(InformationRetrieval)是用户根据特定的需求,借助某种检索工具,采用一定的检索策略和方法,从待检的信息源或信息集合中查找所需信息的过程。
2023/9/18,17,信息检索的类型,由于用户的需求不同,信息检索的发展呈现多种不同的类型:
(1)按检索的信息类型划分:
文献检索(例如查找2005年我国关于环境保护研究方面的文献)、数据检索(例如查找2005上半年年我国GDP增长率)、事实检索(核酸在人体代谢中的作用)
(2)按检索系统中信息的组织方式划分:
全文检索、多媒体检索、超媒体检索(含有超文本的多媒体文献检索)(3)按信息检索方式划分:
手工检索、计算机检索,2023/9/18,18,计算机检索的发展阶段,1.脱机信息检索的阶段(1954-60年代中期)2.联机信息检索的阶段(20世纪60年代中期至今)3.光盘信息检索的阶段(80年代中期至今)4.网络信息检索的新阶段(20世纪90年代至今)以网络为平台的计算机检索。
2023/9/18,19,信息检索的基本原理,信息检索就是将特定的用户需求进行主题分析,使这形成能代表用户需求的概念,并通过信息检索语言的规范进行概念转换,然后与检索系统或检索工具中的信息资源线索进行异同的比较与匹配,选取两者相同或部分相符的信息资源予以输出。
2023/9/18,20,信息检索的原理图,2023/9/18,21,计算机检索的工作过程,计算机检索工作过程:
输入检索提问标识倒排文档(与数据库标引标识进行比较匹配)顺排文档(根据记录号)输出结果。
(结果不理想时要进一步修改检索提问标识),2023/9/18,22,顺排文档、倒排文档,顺排档(LinearFile),它也称为主文档(MainFile)、引文文档(CitationFile),它是按记录存取号的大小顺序排列记录而成的文档。
倒排档(InvertedFile)倒排档是按记录中的可检字段的某种顺序排列的文档。
倒排文档的编制方法:
将文献记录中的特征标识(如主题词、作者、自由词、出版年等)抽出来作为款目词,如以“电子商务”为主题的倒排文档为:
电子商务1002,3378,4421(所有主题词字段包含电子商务的文献记录在顺排文档中的记录号),2023/9/18,23,2.信息检索语言,检索语言就是把信息存储与检索,把信息检索人员与用户之间进行交流的媒介。
目前检索语言按表述信息内容特征划分为分类语言和主题语言。
常用的分类语言如等级体系分类法(简称分类法)。
主题语言是直接用代表信息主题概念的主题词作为信息的标识的一种检索语言,为那些不懂人工语言的网络用户提供了极大的便利。
常用的主题语言有标题词语言、关键词语言和叙词语言。
2023/9/18,24,信息检索系统一般有两种使用分类法的做法:
一是采用国内外常用的分类法,如中国图书馆分类法、中国科学院图书馆分类法、美国国会图书馆分类法(LC分类法)、杜威十进分类法(DC分类法)、国际十进分类法(UDC分类法)等。
二是根据信息检索系统的特点自行编制的分类法,如搜索引擎Yahoo!
就是采用自身编制的等级式主题指南分类法。
2023/9/18,25,第四节网络信息检索的技术,信息检索技术是应用于用户提问与所收集的文献集合之间的匹配比较的技术。
信息检索经历了手工检索、脱机检索、联机检索、光盘检索基于Internet的网络检索,从开始的基于关键词检索,发展到基于概念的检索,再到基于内容的检索。
当然目前绝大多数中文检索仍停留在关键词检索阶段,运用的是关键字匹配算法,效率低检索精度差。
2023/9/18,26,概念匹配与文字匹配,概念匹配:
计算机微机计算机电脑PC机文字匹配:
计算机计算机PC机PC机,电脑电脑,2023/9/18,27,1布尔逻辑检索技术,布尔逻辑检索是一种比较成熟、流行的检索技术,布尔逻辑检索的基础是逻辑运算,规定检索词之间的逻辑关系.主要的逻辑算符有三种,分别是逻辑或(OR)、逻辑与(AND)、逻辑非(NOT),2023/9/18,28,
(1)逻辑“或”OR或+,表示方法:
AORB或A+B,表示要检索含有A、B词之一或同时包含AB两词的文献,如下图阴影部份为检中文献适用场合:
主要用于并列关系的概念组配,扩大检索范围,防止漏检。
2023/9/18,29,布尔逻辑算符逻辑“或”例如:
查找有关“计算机”的相关文献检索策略:
分析:
计算机电脑逻辑关系:
逻辑或中文库:
计算机OR电脑,2023/9/18,30,
(2)逻辑“与”AND或*,表示方法:
AANDB或者A*B,表示要找出同时含有这两个词的文献集合,如下图阴影部分为命中文献。
适用场合:
主要用于交叉概念或限定关系概念之间的组配,可以缩小检索范围,提高检准率。
2023/9/18,31,布尔逻辑算符逻辑“与”例如:
查找有关“计算机文献检索”的相关文献检索策略:
分析:
计算机文献检索逻辑关系:
逻辑与中文库:
文献检索and计算机,2023/9/18,32,(3)逻辑“非”NOT或-,表示方法:
ANOTB或A-B,表示要找出含有检索词A而不含检索词B的文献适用场合:
用于排斥与选择关系的组配,也是缩小检索范围的措施,2023/9/18,33,布尔逻辑算符逻辑“非”例如:
查找有关“硬件”而非“软件”方面相关文献检索策略:
分析:
硬件软件逻辑关系:
逻辑非中文库:
硬件NOT软件,2023/9/18,34,注意1.布尔逻辑算符执行的优先顺序为NOT、AND、OR,当然有括号时,括号最优先,括号又称为优先符。
2.大多数的检索系统都支持布尔逻辑检索,但表现形式不尽相同,有的用大写,有的用小写,有的大小写均可,有的以符号代替,有的直接把布尔逻辑算符隐含在菜单中。
2023/9/18,35,2截词检索,截词检索是指在检索标识中保留相同的部分,用相应的截词符代替可以变化的部分。
截词符为“?
”或“*”。
截词法有前截断、中截断或后截断。
前截断后方一致检索:
例如键入检索词“?
computer”,那么计算机进行匹配时,索引词“minicomputer,microcomputer等均算命中。
2023/9/18,36,后截断前方一致检索例如键入检索词“computer?
”,可以检索出含有computer开头的文献,如computers,computerize,computing,computerization等。
中截断中间一致检索例如键入“?
computer?
”可以命中包含该字根所有索引词,如minicomputer,microcomputer,computers,minicomputers等。
2023/9/18,37,截词检索适用于自由词检索,特别是那些具有单、复数不同表现形式,有美、英拼写差异或词尾变化形式的检索词,减少检索词的输入量,扩大检索范围,提高查全率。
需要注意的是,截词检索可能检索出大量无关资料,针对这种情况,有些计算机检索系统规定了右截断的限度。
2023/9/18,38,3字段限制检索,字段限定检索是一种将检索词限定在某一特定的字段范围内的检索方法。
字段分为两种:
主题字段(题名、主题词、文摘等)、非主题字段(作者、文献类型、语种、出版年份等)例如:
在DIALOG系统中,“TI”代表题名,“AU”代表作者,用字段加代码实现检索。
利用后缀符对主题字段进行限制:
Laser/ti,de,ab利用前缀符对非主题字段进行限制:
AU=peter;DT=periodical;PY=200?
等。
2023/9/18,39,基本字段:
字段名称字段代码文摘(Abstracts)AB题目(TitleWord)TI主题词(Descriptor)DE标识词(Identifier)ID,2023/9/18,40,常见的前缀代码及其所限定的字段名称,前缀代码所限定的字段名称AU=author(著者)CS=corporatesource(著者所属机构)DT=documenttype(文献类型)JN=journalname(期刊名称)CO=company(公司)CC=classificationcode(分类号)SO=sourcepublication(来源出版物)LA=language(语种)PY=publicationyear(出版年)UD=update(更新日期)SP=conferencesponsor(主持单位),2023/9/18,41,4位置检索,位置运算符:
用于指明检索项在记录中的位置关系的符号。
在实际检索中,为提高查全率和查准率,往往需对检索词之问的位置关系加以限定,因为用不用位置逻辑算符和用什么样的位置逻辑算符,所得出的检索结果、查准率都各不相同,2023/9/18,42,常用的位置逻辑算符:
(W)与(nW)、(N)与(nN)以及(X)与(nX)三类。
(W)要求检索词A紧挨着检索词B,之间除可以有一个空格或有一个标点符号,或一个连接号外,不得夹有任何其他单饲或字,并且顺序不得颠倒。
(nW)由(W)引申出来,其唯一区别是词A与词B间最多嵌入几个词。
(N)要求检索词A与检索词B必须紧密相连,其间不允许插入任何单词或字母,但词序可以倾倒。
(nN)和(N)的唯一区别是在词A和词B间最多可以插入n个单词。
(X)要求其两侧的检索词完全一致,并以特定的顺序相邻,中间不允许插入任何单词或字母。
(nX)和(X)的唯一区别是两检索词之间最多可以插入n个单元词。
2023/9/18,43,例如building(w)construction可命中buildingconstruction;building-constructioninformation(1n)retrieval可命informationretrieval;informationandretrieval;retrievalofinformation,2023/9/18,44,5.全文检索,全文检索,也称为任意词检索。
在全文数据库中,任意字、词和字串都有检索意义,都可以用来对整个数据库进行全面匹配查找。
对全文数据库检索的结果可以是信息全文,也可以是信息中的某个词,某个字串的出处,或所在句,段的上下文。
2023/9/18,45,第五节信息检索一般步骤,第一步:
分析检索课题第二步:
选择数据库或网络检索工具第三步:
提炼检索词,制定检索式第四步:
检索策略构成和调整第五步:
检索结果输出,2023/9/18,46,第一步:
分析检索课题,明确检索目的,从而确定检索需求。
检索目标:
解决技术疑难需较高查准率;开题调研、成果查新需较高查全率;探索性查准率和查全率不一定很高要求检索要求:
学科、文献类型及语种、年代、篇数和检索费用,2023/9/18,47,1对于大学生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。
2023/9/18,48,2Internet网上虽然有一些较好的资源,但是与专业的网络数据库来比,无论是质量还是数量上都有很大的差距,检索文献目前来说最主要的来源还应是专业数据库,即正规的出版物上发表的文献。
仅用搜索引擎来查找文章是非常不可取的。
2023/9/18,49,3不要忽略摘要数据库,虽然检索摘要数据库不能马上得到全文,但是摘要数据库的数据量大,范围广,是查找文章线索极好的检索工具。
就目前的情况而言,不可能全部都能得到电子版的全文,先找到文章线索再根据线索查找印刷版的全文是一项不错的组合。
2023/9/18,50,第二步:
选择数据库或网络检索工具,选择合适检索工具的前提是对网络资源有一个较全面的、清晰的了解,具体地说要对检索工具的类型、内容特点、时间范围、学科范围、甚至出版商的大体情况都要有一个了解。
方法:
1、注重平时的积累2、不要盲目检索,应养成检索前了解一下数据库的习惯3、注重与他人的交流4、重视图书馆主页的资源,2023/9/18,51,第三步:
提炼检索词,制定检索式,检索词是用来描述检索课题的简洁、概括性词语。
注意事项:
1.要提炼关键的、核心的词作为检索词,去掉意义太泛或“无所谓有”的词。
例如检索:
“从更宽阔的视野观察和思考冶金反应工程学的问题。
”去掉不具有检索意义的虚词及无专业所属的通用概念检索词:
冶金反应工程学,2023/9/18,52,2.检索词尽可能使用词或词组,然后用布尔逻辑运算符将检索词连接起来,切忌将整个题名输入到检索框中。
3.有时不需要死抠文字,意思匹配即可例如检索:
智能机器人控制系统的研究控制控制系统控制理论控制方法控制器所以将“控制”作为检索词即可,2023/9/18,53,4.有时要注意隐含主题的揭示.隐含主题需经过分析,推理得到.如:
“人力泵”这个课题。
人力泵是题目中已有的词,称显性主题。
表达人力泵的概念,还有手摇泵、脚踏泵等,手摇泵、脚踏泵就是隐含主题词,检索词应包括隐含主题。
因此,要弄清课题实质及用户的真实需求。
2023/9/18,54,5.要避免漏检如:
忽略了同义词,或同一个词的多种表达,有可能造成漏检。
同义词:
自行车单车脚踏车airplaneaircraftplane专有名词的固定表达:
SPS(sparkplasmasintering)放电等离子NC(numericalcontrol)数字控制中英文混用:
网络数据库web数据库代理技术agent技术,2023/9/18,55,避免漏检的方法:
1)将同义词等列出来,然后用布尔逻辑运算符or将其连接起来2)使用规范词还要注意字段限定检索功能,以免误检和漏检。
如检索作者王明发表的文章,检索时要将王明限定在作者字段。
2023/9/18,56,编写检索式,编写检索式主要用布尔逻辑算符、位置算符及截词算符,根据检索词之间的关系把若干个检索词连接起来。
根据印度图书馆学家阮岗纳赞有关“分面分析,分面组配”的基本原理,检索策略的构成可以分成三步的
(1)将检索主题划分为若干分面。
(2)将若干分面析出若干主题因素(3)将不同分面进行逻辑组配。
2023/9/18,57,例如:
检索“基于代理技术的网络入侵检测”,关键词1:
(网络)入侵检测但入侵检测一般即指网络中的入侵检测,意义重复,网络可不要关键词2:
代理(技术)在入侵检测中使用“代理”,“代理”本身就是指的一项技术,因而也可不要。
用维普数据库进行检索(检索范围:
字段为题名,时间范围:
2000-2004年)结果:
代理*入侵检测45条记录代理*入侵检测*网络2条记录代理技术*入侵检测10条记录代理技术*入侵检测*网络0条记录,2023/9/18,58,第四步:
检索策略构成和调整,在检索过程中需不断地调整检索策略
(1)根据实际扩大、缩小检索范围
(2)从已找到的文章中查找新的检索线索(3)考虑多种检索途径,不要一条道跑到黑,2023/9/18,59,扩大检索范围,提高信息查全率的措施,1.降低检索式的专指度,换用一些上位词或相关词,重新组成检索式。
2.采用一组近义词、同义词或相关词用逻辑和连接在检索式中。
3.增加检索途径。
如可通过分类、著者等途径检索,扩检。
4.截词检索,选用各种截词法增加被检索词量,扩大检索范围。
5.减少限制条件,可适当删去检索项,从纵向扩大检索范围。
2023/9/18,60,第五步:
检索结果输出,将构造好的检索提问式输入计算机检索系统,使用检索系统认可的检索方式进行匹配运算,并输出检索结果.检索结果输出后要通过粗读进行人工判断,对检索结果进行筛选,也可以进行二次检索或高级检索,直到得到满意的检索结果.,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一节 网络 信息资源 相关 知识 概述