信息检索复习讲解Word文档下载推荐.docx
- 文档编号:3110462
- 上传时间:2023-05-01
- 格式:DOCX
- 页数:18
- 大小:128.78KB
信息检索复习讲解Word文档下载推荐.docx
《信息检索复习讲解Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《信息检索复习讲解Word文档下载推荐.docx(18页珍藏版)》请在冰点文库上搜索。
P6目录检索可了解某一单位或数据库是否收藏有所需的图书或期刊等出版物;
题录检索是以出版物中的单篇文献为检索结果。
9.信息检索语言的定义和类型。
P7—P9信息检索语言是为建立信息检索系统而创建的专门用来描述文献特征(内容特征或外表特征)和表达检索提问的一种人工语言,又称为信息存储与检索语言、标引语言、索引语言等。
类型:
1.分类检索语言(中图分类号属于中国最普遍);
2.主题词检索语言(主题词法;
关键词法两者最多)。
10.我国使用最普遍的分类检索语言是什么?
《中国图书馆分类法》P7
11.《中图法》有几个基本大类?
医药卫生类的分类号是什么?
P822个基本大类“R医药、卫生”类下分17个二级类目。
12.医药卫生二级类目有哪些?
P8中药学、护理学、肾脏疾病分别归入哪个二级类目?
R2;
R4;
R6(CNKI首页→跨库高级检索→左侧总目录→医药卫生→R2中国医学R4临床医学:
诊断学、治疗学、护理学、临终关怀学、康复医学R6外科学:
外科病理学、解剖学、泌尿科学等。
)
13.主题词和关键词的区别。
P9主题词又称叙词,是以规范化为基础,以揭示事物对象及其特征为出发点的信息检索语言。
关键词是指出现在文献的题名、摘要或全文中,能够反映文献主题内容的专业名词或术语。
关键词直接取自原文,不做规范化处理,可以提供更多的检索入口,适合计算机系统自动编制索引的需要,但由于词语没有规范化,不能进行选择和控制,容易造成漏检和误检。
14.美国国立医学图书馆《医学主题词表》的英文全称和简称。
P9MedicalSubjectHeadings,Mesh
15.文献的内容特征和外表特征。
P12—P13内容特征:
指文献所论述的主题、观点、见解、结论及文献内容所属的学科范围,通常使用主题词、关键词或分类号等形式来表达文献的主题概念,揭示文献的内容特征,并建立严格有序的排检序列,为检索者提供重要的检索途径;
外表特征:
包括题名、作者、出版者以及某些特种文献自身的特征标识,如专利号、标准号、报告号等。
要求会判断某一检索途径是属于内容特征,还是外表特征?
CNKI内容特征:
主题、摘要、关键词、全文、参考文献;
题名、作者、第一作者、作者单位、来源、基金。
16.掌ISBN号各数据段的含义。
ISBN国际标准书号,P14
第二部分网络基础和搜索引擎
1.局域网、广域网和城域网的地理范围。
P21分别是几十米到几千米、几十到几千公里、介于局域网和广域网之间。
2.我国七大主干网络的名称。
P24中国科技网CSTNET,中国教育科研网CERNET;
中国公用计算机互联网(ChinaNET);
中国金桥信息网(CHINAGBN);
中国移动互联网(CMNET);
中国联通互联网(UNINET);
中国网通(CNC)
3.统一资源定位器的含义和组成。
P31统一资源定位器URL用来定位信息资源所在位置,描述了浏览器检索资源所用的协议、资源所在的计算机的主机名以及资源的路径和文件名。
Web中每一个页,以及每页中的每个元素也都有自己唯一的URL。
标准的URL由访问的协议类型、主机名、端口号、文件目录、文件名组成。
4.什么是万维网?
P31WWW简称3W或万维网,是一个基于超级文本方式的信息查询工具,它将位于全世界Internet网上不同网址的相关数据信息有机地编织在一起,并通过浏览器提供一种友好生动的图形查询界面。
浏览器是利用WWW的工具,代表性的有美国微软公司的InternetExplorer和美国网景公司的NetscapeNavigator。
5.搜索引擎的类型及其工作原理。
P61—P63类型:
根据检索内容:
综合性、专业性;
根据检索功能:
目录式、全文式(网页级)、智能式(FAQFinder);
根据搜索范围:
独立、元搜索引擎。
原理:
P60通过自动索引程序或人工广泛搜集网络……
6.雅虎是最早的搜索引擎;
Google是目前影响最大的综合性搜索引擎。
⏹检索网页数量达80亿,搜索引擎中排名第一;
⏹支持多达132种语言,包括简体中文和繁体中文;
⏹网站只提供搜索引擎功能,没有花里胡哨的累赘;
⏹速度极快,有100000多台服务器,T3级(每秒能传输1400页文本信息)宽带传输信息;
⏹Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;
⏹Google智能化的“手气不错”功能,提供可能最符合要求的网站;
⏹Google的“网页快照”功能,能从Google服务器里直接取出缓存的网页。
Google检索技巧
⏹表示逻辑关系与、或、非的符号为:
空格、OR、-
⏹当逻辑运算符混合使用时,按从左往右的顺序读取操作符号。
⏹对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
⏹当对句子进行检索时,须加双引号。
⏹GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
如:
"
+who+am+i"
⏹查询某一类文件(往往带有同一扩展名)用filetype:
⏹最重要的文档搜索是PDF搜索。
PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
⏹例如:
搜索关于电子商务(ecommerce)的PDF文档。
检索式为:
ecommercefiletype:
⏹“filetype”的另一个强大用处则在图片搜索。
姚明filetype:
jpg
⏹搜索所有对某个URL地址做了链接的网页。
例:
搜索所有含指向华军软件园链接的网页,检索式为:
link:
⏹查找与某个页面结构内容相似的页面
例:
搜索所有与中文新浪网主页相似的页面,检索式为:
related:
检索结果内容介绍
⏹论文题目链接:
点击题目进入该条目详细信息界面。
⏹被引用次数链接:
点击显示引用本文的所有文献。
⏹网页搜索链接:
以本文作者和题目为检索词在google网页搜索中进行检索。
⏹图书馆搜索链接:
提供论文所在期刊的馆藏信息。
XX搜索技巧
⏹逻辑“与”关系用空格连接多个关键词。
⏹逻辑“非”关系用减号连接关键词。
注意,减号前关键词,和减号之间必须有空格,减号后的关键词与减号之间,有无空格均可。
⏹书名号是XX独有的一个特殊查询语法。
加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;
二是被书名号扩起来的内容,不会被拆分。
比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。
⏹双引号检索确保不拆分检索词,
如“南通大学”
⏹货币换算,如:
100美元等于多少人民币
⏹英汉互译词典,随便输入一个英语单词,或者输入一个汉字词语,留意一下结果显示页面的搜索框上方多出来的词典提示。
⏹计算器,只需简单的在搜索框内输入计算式,回车即可。
如:
log((sin(5))^2)-3+pi
⏹度量衡转换,输入格式:
换算数量换算前单位=?
换算后单位,如:
-5摄氏度=?
华氏度
很多有价值的资料,在互联网上并非是普通的网页,而是以Word、PPT、PDF等格式存在。
XX支持对Office文档(包括Word、Excel、PPT)、PDF文档、RTF文档进行了全文搜索。
要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:
”文档类型限定。
“filetype:
”后可以跟以下文件格式:
DOC、XLS、PPT、PDF、RTF、ALL。
其中,ALL表示搜索所有这些文件类型。
例如,查找关于医院信息系统的Word文档。
医院信息系统filetype:
doc
7.了解MedicalMatrix:
P76MedicalMatrix由美国医学信息学会主办,其收集的内容专业、全面,是目前最重要的医学专业搜索引擎。
只需在首次访问时注册,即可免费使用,提供了关键词搜索和分类目录,非常适合临床医师使用。
分类目录搜索是它的主要特色。
对链接的网址按一到五个星进行分级,并且附有简明扼要的评论,便于使用者事先决定是否进入其网页进一步阅读,以节省时间。
另外还提供免费的mailinglist,定期发布网上医学资源变化情况的通知。
MedicalMatrix大类:
按各种医学信息分为:
专业(Specialties)、疾病种类(Diseases)、临床实践(ClinicalPractice)、文献(Literature)、教育(Education)、健康和职业(HealthcareandProfessionals)、医学计算机和Internet技术(MedicalComputing,InternetandTechnology)、市场(Marketplace)等8大类。
MedicalMatrix亚类:
每一大类下再根据内容的性质分为:
新闻(News)、全文和多媒体(FullText/Multi-Media)、摘要(Abstracts)、参考书(Textbooks)、主要网址(MajorSites/HomePages)、操作手册(Procedures)、实用指南(PracticeGuidelines/FAQS)、病例(Cases)、影像学和病理切片(Images、Path/Clinical)、患者教育(PatientEducation)、教育资源(EducationalMaterials)等亚类。
关键词检索界面:
Searchfor后输入检索词;
Using后的下拉菜单选择各检索词之间的关系。
“exactphrase”要求所有检索词以词组形式出现;
“allwords”说明检索词之间是AND关系;
“anywords”说明检索词之间是OR关系。
Search后的下拉菜单选择检索哪类站点,如新闻、患者教育等等。
8.北大中国医学生物信息网的主要栏目及其功能。
医学新闻栏目来源:
“NatureNews”、“ScienceNow”、“EurekAlert!
”、“Doctor’sGuide”、“MSNHealth”、“USAtoday-Health”、“Yahoo-Health”、“NewsRxTop-news”
第三部分中国知网CNKI
一、学校镜像站点
1.CNKI期刊库分类导航区域有哪两个功能?
提供分类检索的途径;
设置检索的学科范围
2.CNKI期刊库可供选择的检索字段有16个,掌握选择每个字段所达到的效果。
主题、篇名、关键词、摘要、作者、第一责任人、单位、刊名、参考文献、全文、年、期、基金、中图分类号、ISSN、统一刊号(CN)。
主题包括后面三个:
篇名、关键词、摘要,是“或”的关系
刊名千万不要加书名号,摘要的查准率最低,篇名查准率最高,ISSN是连续标准出版物编号。
⏹3.CNKI期刊库的期刊范围选项中有EI来源刊、SCI来源刊和核心期刊,了解它们的含义。
Ei是全世界最早的工程文摘来源。
Ei数据库每年新增的50万条文摘索引信息分别来自5100种工程期刊、会议文集和技术报告。
Ei收录的文献涵盖了所有的工程领域,其中大约22%为会议文献,90%的文献语种是英文。
Ei公司在1992年开始收录中国期刊。
1998年Ei在清华大学图书馆建立了Ei中国镜像站。
SCI数据库是美国科学情报研究所出版的世界著名的期刊文献检索工具,SCI收录全世界出版的数理化农林医、生命科学、天文地理、环境、材料、工程技术等自然科学各学科的核心期刊约3500种。
该数据库精心挑选有代表性的权威的科技期刊作为数据源,声称这些数据源包括了世界上90%以上的重要的科技文献,所以被它收录的论文具有较高的质量,代表了当时有关领域的先进水平。
该数据库的一个重要特点就是它不但收入每篇论文的作者姓名,单位,篇名,内容摘要,以及出版信息等,而且还收录每篇论文引用文献的信息,建立了引文索引。
这种引文索引的方法由费城科学情报所所长加菲尔德发明。
该数据库约有1600条记录。
所以SCI不仅作为一部文献检索工具使用,而且成为科研评价和的一种依据。
科研机构被SCI收录的论文总量,反映整个机构的科研、尤其是基础研究的水平;
个人的论文被SCI收录的数量及被引用次数,反映他的研究能力与学术水平。
《中文核心期刊要目总览》由北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版,收编包括社会科学和自然科学等各种学科类别的中文期刊,其中对核心期刊的认定通过五项指标综合评估,是国内比较权威的核心期刊认定版本。
4.介绍CNKI期刊库的词频功能。
P108指检索词在相应检索项中出现的频次。
词频为空表示至少出现一次,如果为数字3,则表示至少出现3次。
。
5.掌握出版时间和更新时间的区别。
从。
到。
——出版时间;
更新时间——论文被数据库收录的时间范围
6.结果排序方式的选项。
P109时间:
按文献入库时间逆序输出;
无:
按文献入库时间顺序输出;
相关度:
按词频、位置的相关程度从高到低顺序输出。
7.CNKI期刊库的详细结果显示页面可提供关于某篇论文的哪些信息?
题名、摘要、作者及单位、刊名、年期、相似文献等
了解“相似文献”栏目的功能
⏹链接“相似文献”,与文章主题相近或内容相似的文献。
较全面反映文章研究方向的动态信息。
“相似文献”中可按期刊、博硕士论文、会议论文和报纸等类型分别显示。
⏹链接相关研究机构、相关文献作者、相关期刊。
相似文献栏目可获得与本篇论文内容相似的期刊论文、学位论文、会议论文、专刊文献、标准文献、科技成果和德国springer期刊数据库中的外文文献。
8.CNKI期刊库可提供的全文格式是什么?
CAJ、PDF。
对应的全文浏览器是什么?
CAJ(中国学术期刊)浏览器,CAJ全文浏览器是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件.
;
AdobeReader
二、CNKI网站
1.掌握CNKI网站期刊库的标准检索界面的使用方法。
检索条件设置区域(默认为“标准检索”)
最简单的“快速检索”
专业检索界面:
可检索字段:
SU=主题,TI=题名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一作者,AF=作者单位,JN=期刊名称,RF=参考文献,RT=更新时间,PT=发表时间,YE=期刊年,FU=基金,CLC=中图分类号,SN=ISSN,CN=CN号,CF=被引频次,SI=SCI收录刊,EI=EI收录刊,HX=核心期刊
示例:
1)TI='
生态'
andKY='
生态文明'
and(AU%'
陈'
+'
王'
)可以检索到篇名包括“生态”并且关键词包括“生态文明”并且作者为“陈”姓和“王”姓的所有文章;
2)SU='
北京'
*'
奥运'
andFT='
环境保护'
可以检索到主题包括“北京”及“奥运”并且全文中包括“环境保护”的信息;
3)SU=('
经济发展'
可持续发展'
)*'
转变'
-'
泡沫'
可检索“经济发展”或“可持续发展”有关“转变”的信息,并且可以去除与“泡沫”有关的部分内容。
作者发文检索
科研基金检索:
点击“…”选择准确的基金名称
2.期刊库检索结果显示页面的功能,重点是文献分组浏览和排序方式的使用。
文献显示:
摘要显示和列表显示(两个按钮)
查看单篇文献的详细信息:
点击列表中的论文题目获取论文的详细信息。
文献分组浏览(分组分析方法):
学科类别期刊名称研究资助基金研究层次文献作者作者单位中文关键词来源数据库发表年度不分组
按学科类别查看检索结果(通过点击不同的类名获取不同学科的论文)
文献排序浏览:
相关度,发表时间,被引频次,下载频次浏览频次(共5个)。
点击“被引频次”,按被引频次的高低将…篇论文排序
单篇论文信息界面:
⏹可获得论文的中英文题名、关键词和摘要,作者姓名和工作单位,所发表的刊物和年期。
不足的是不能获得卷和页码的信息,必须下载全文后才能看到相关信息。
⏹“相似文献”栏目可获得与本篇论文内容相似的期刊论文、学位论文、会议论文、专利文献、标准文献、科技成果和德国Springer期刊数据库中的外文文献。
这些资源来自于CNKI平台中的其他数据库。
⏹全文下载(CAJ、PDF
默认显示来自于期刊库的相似文献
第四部分重庆维普期刊库P137
1.掌握重庆维普期刊库的传统检索界面的使用方法。
⏹南通大学→图书馆主页→常用数字资源→“维普中文科技期刊数据库”镜像站
中文科技期刊数据库的检索方式:
快速检索、传统检索、高级检索、期刊导航、分类检索
⏹通过首页正中的输入框,输入简单检索条件,选择字段进行查询,进入结果显示页面,可实现题录文摘的查看或下载,及全文下载功能,同时,也可进行检索条件的再限制检索或重新检索。
2.重点掌握维普期刊库中检索式的表达方式,包括检索途径代码、逻辑关系标示符,能写出该库可用检索式。
检索式输入框:
⏹可输入单个检索词
⏹可输入两个及两个以上检索词的复合检索式。
检索式由字段代码、检索词和逻辑运算符构成。
⏹字段代码:
见检索入口下拉菜单。
⏹逻辑运算符:
*(AND)、+(OR)、-(NOT)
复合检索式的两种情况
⏹不同检索词使用相同检索途径,在检索入口选择途径,检索式中可省区字段代码。
⏹不同检索词用不同检索途径,不用检索入口下拉菜单,直接构造完整的检索式。
二次检索是在一次检索的检索结果中运用“与、或、非”进行再限制检索,其目的是缩小或扩大检索范围,最终得到期望的检索结果,即完成多个词的分步检索。
例如检索南通大学顾晓松教授撰写的论文。
第五部分PubMed检索系统
1.美国国立医学图书馆的英文简称。
NLM
2.PubMed检索系统收录范围中四个数据库的名称和标识符号,了解这些数据库中记录的特点。
Medline:
PubMed-indexedforMEDLINE;
OLDMEDLINE:
PreMedline:
PubMed-inprocess;
PublisherSuppliedCitation:
PubMed-assuppliedbypublisher.特点:
1Medline是NLM最重要的书目文摘数据库,内容涉及临床医学、基础医学、护理学、牙科学、兽医学、药理学、环境和公共卫生等专业。
收录自1966年以来全世界包括美国在内的70多个国家和地区的5000多种生物医学期刊。
现有书目文摘条目1500多万条。
2收录1966年之前世界上重要的生物医学期刊文献150多篇。
主要为1948-1965年的文献。
3PreMedline是一个临时性医学文献数据库,1996年8月创立。
它每天收录未经标引的生物医学期刊中的新记录,但只提供基本的书目信息,如题名、著者、文摘等,没有MeSH词、出版类型和其他的索引等深度标引信息。
每星期经MeSH标引后,转入MEDLINE。
标识为[PubMed-inprocess]。
4出版商直接向PubMed提供的文献数据。
标识为[PubMed-asSuppliedbyPublisher]
3.掌握作者、题名、作者单位、语种、文献类型、摘要、主题词、副主题词和人名主题词的字段标识,掌握文本词[TextWord]的含义。
P175.TextWord含义:
作者(AU)、题名(TI)、作者单位(AD)、语种(LA)、文献类型(PT)、摘要(AB)、主题词(MeSH)、副主题词(SH)人名主题词(PS)等字段中进行检索,是复合检索途径。
截词检索功能
⏹使用“*”作为通配符进行检索,“*”代替单词词尾的一串字符,如“bacter*”。
截词功能只对单词有效。
⏹最多检索600个词。
⏹使用截词检索功能时,自动关闭词汇转换功能。
强制检索功能
⏹使用双引号将输入的词组作为一个不可分割的整体在数据库的全部字段中进行检索。
⏹使用强制检索功能时,自动关闭词汇转换功能。
为检索词确定检索途径的方法
⏹第一种方法:
直接在检索词输入框中输入检索词及检索途径。
⏹
⏹第二种方法:
在检索词输入框中输入检索词,在Fields下拉菜单选检索途径。
4.掌握基本检索和高级检索的使用方法。
高级检索(AdvancedSearch)高级检索界面提供的功能:
*检索词输入框
*构造检索式(SearchBuilder)
*检索史(searchhistory)
*检索条件限制区(Limits)
*查看检索策略(Details)
构造检索式的方法
(1):
直接在输入框中输入检索词及检索途径
构造检索式的方法
(2):
利用“SearchBuilder”构造检索式。
选择检索途径,输入检索词
点击“AddtoSerachBox”,添加到输入框,输入第二个词,确定检索途径和逻辑关系,点击添加按钮。
完成构造检索式
查看检索策略的Details键(P177)
⏹在输入框中输入检索词,点击“Preview”预览按钮。
检索历史栏目出现相应的检索策
⏹点击“Details”键查看PubMed的检索策略,即词汇自动转换结果。
可修改检索策略,进行新的检索。
检索词vitaminc的词汇转换结果
⏹"
ascor
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 复习 讲解