信息存储实验报告要点.docx
- 文档编号:18093788
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:24
- 大小:853.75KB
信息存储实验报告要点.docx
《信息存储实验报告要点.docx》由会员分享,可在线阅读,更多相关《信息存储实验报告要点.docx(24页珍藏版)》请在冰点文库上搜索。
信息存储实验报告要点
徐州工程学院
管理学院实验报告
实验课程名称:
信息存储与检索
实验地点:
南主楼经济管理实验中心C710
年月至年月
专业信息管理与信息系统
班级
学生姓名
学号
指导老师
实验报告
实验项目:
信息获取技术试验
实验学时:
2学时
实验日期:
2013-11-7
实验要求:
(1)熟悉扫描仪、智能手机、数字摄录、条形码、触摸屏、手写技术、音频处理、网络信息才进等各种常用信息获取技术的有关知识及应用技能。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便及进行实务操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
(1)使用任一款扫描仪设备扫描任意书籍、报刊、票据等,并用配备的OCR软件进行文字识别及图像编辑,最终将选定的信息资料转化成硬盘中的电子文档。
(确无设备的,可查阅相关资料,将简要的文字叙述及软件窗口粘到报告中。
)
(1)扫描文稿。
为了利用OCR软件进行文字识别,可直接在OCR软件中扫描文稿。
运行OCR软仆后,会出现OCR软件界面。
将要扫描的文稿放在扫描仪的玻璃面上,使要扫描的一面朝向扫描仪的玻璃面并让文稿的卜端朝下,与标尺边缘对齐,再将扫描仪盖上,即町准备扫描。
点击视窗中的“扫描”键,即可进入扫描驱动软件进行扫描,其操作方法与扫描图片类似。
扫描后的文档图像出现在OCR软件视窗中。
(2)适当缩放画面。
文稿扫描后,刚开始出现在视窗中的要识别的文字画面很小,首先选择“放大”工具,对画面进行适当放大,以使画面看得更清楚。
必要时还可以选择“缩小”工具,将画面适当缩小。
(3)调正画面。
各类OCR软件都提供了旋转功能,使画面能够进行任意角度的旋转。
如果文字画面倾斜,可选择“倾斜校正”工具或旋转工具,将画面调正。
(4)选择识别区域。
识别时选择“设定识别区域”工具,在文字画面上框出要识别的区域,这时也可根据画面情况框出多个区域。
如果全文识别则不需设定识别区域。
(5)识别文字。
单击“识别”命令,则OCR会先进行文字切分,然后进行识别,识别的文字将逐步显示出来。
一般识别完成后,会再转入“文稿校对”窗口。
(6)文稿校对。
各类OCR软件都提供了文稿校对修改功能被识别出可能有错误的文字,用比较鲜明
的颜色显示出来,并且可以进行修改。
有些软件的文字校对工具可以提供出字形相似的若干字以供
挑选。
(7)保存文件。
用户可以将识别后的文件存储成文本 (TXT)文件或Word的RTF文件。
(2)使用数字照相机(或具有近似功能的设备,如摄像功能手机)获取本人实验用的计算机显示器上显示的任一屏幕图像,保存成JPG格式图片,粘贴到实验报告上,并用文字简要叙述你所使用设备的工作原理。
(实验目的不同,请不要用计算机本身的屏幕抓图功能)。
工作原理:
首先通过镜头接收光线,然后被称为CCD(电耦合元件)的摄影元件(或者使用CMOS传感器)将所接收的光线转换成电信号,最后将电信号作为数据记录到内置手机内存或者存储卡中。
(3)能够读取条形码的设备有哪些?
任意选取一种,并将其图片粘到实验报告中,并在图片下方给出设备名称信息。
条码光笔、条码卡槽、扫描枪、激光全向扫描台、二维码阅读器、智能手机、平板电脑、带摄像头且安装了相应软件的电脑、条码数据采集器等。
扫描枪
(4)叙述一下本人触摸屏手机(没有用的可以借用同学的)触摸屏类型(电容式、电阻式…)及工作原理。
并用图文说明。
触摸屏类型:
电容屏,多点触摸。
工作原理:
电容式触摸屏是利用人体的电流感应进行工作的。
电容式触摸屏的感应屏是一块四层复合玻璃屏,玻璃屏的内表面和夹层各涂有一层导电层,最外层是一薄层矽土玻璃保护层。
当我们用手指触摸在感应屏上的时候,人体的电场让手指和和触摸屏表面形成一个耦合电容,对于高频电流来说,电容是直接导体,于是手指从接触点吸走一个很小的电流。
这个电流分从触摸屏的四角上的电极中流出,并且流经这四个电极的电流与手指到四角的距离成正比,控制器通过对这四个电流比例的精确计算,得出触摸点的位置。
(5)叙述一下本人手写板手机(没有的可以借用同学的)的手写板类型及其工作原理。
并用图片说明。
手写板类型:
电磁板手写板
电磁板手写板工作原理:
这是目前最为先进和流行的技术,这种手写板的表面有一块电路板,当电路通电之后便回在手写板的上方产生一定范围内的磁场,同时,手写笔的笔尖也有一相应的磁场,由于电磁波的传导非接触性,致使我们使用时即使笔尖没接触得手写板也可借由磁场的相互感应来定位,当笔尖接触得手写板的表面就会自动进行软件识别,从而达得手写输进的效果。
(6)将本人任意一句话进行话音获取及处理,生成音频格式的文件保存在硬盘上。
并用几张图片对采样、量化、编码等过程进行示意说明。
(7)选取任一种互联网信息采集软件,叙述其工作原理。
乐思网络信息采集系统
工作原理:
根据用户自定义的任务配置,批量而精确地抽取因特网目标网页中的半结构化与非结构化数据,转化为结构化的记录,保存在本地数据库中,用于内部使用或外网发布,快速实现外部信息的获取。
特点:
采集方法的灵活性与采集数据的准确性
灵活性:
任何复杂的查询与页面布局都可以灵活处理
准确性:
结果数据高度准确(99%-100%)
对目标网站进行信息自动抓取,支持HTML页面内各种数据的采集,如文本信息,URL,数字,日期,图片等
用户对每类信息自定义来源与分类
可以下载图片与各类文件
支持用户名与密码自动登录
支持命令行格式,可以Windows任务计划器配合,定期抽取目标网站
支持记录唯一索引,避免相同信息重复入库
支持智能替换功能,可以将内容中嵌入的所有的无关部分如广告去除
支持多页面文章内容自动抽取与合并
支持下一页自动浏览功能
支持直接提交表单
支持模拟提交表单
支持动作脚本
支持从一个页面中抽取多个数据表
支持数据的多种后期处理方式
数据直接进入数据库而不是文件中,因此与利用这些数据的网站程序或者桌面程序之间没有任何耦合
支持数据库表结构完全自定义,充分利用现有系统
支持多个栏目的信息采集可用同一配置一对多处理
保证信息的完整性与准确性,绝不会出现乱码
支持所有主流数据库:
MSSQLServer,Oracle,DB2,MySQL,Sybase,Interbase,MSAccess等
(8)利用我校图书馆网站提供的“书目检索”功能,查找书名中含“信息检索”的图书,点击检索结果中任一书名,注意新页面右侧“手机二维码”的相关信息。
要求:
用手机摄像头读取该二维码(需要的软件需自行下载,或直接利用微信、UC浏览器、QQ浏览器中的功能)。
在实验报告中将该二维码图片粘贴到报告中,并把读取出的二维码信息中的书名附在图片下方。
信息检索:
理论与创新
实验项目:
信息存储技术实验
实验学时:
2学时
实验日期:
2013-11-14
实验要求:
(1)熟悉信息的印制存储、缩微存储、磁介质存储、激光存储、电子纸电子书、等各种信息存储技术以及计算机信息的存储结构、存储系统相关知识。
掌握一定的信息存储技能。
通过搜集资料了解NAS、SAN等的基本知识。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
(1)CTP印刷技术的四种含义(即包含的具体四种印刷技术)?
并且请分别找到计算机直接制版机与数字打样机的任意图片各一张粘贴到实习报告中。
CTP印刷技术的四种含义:
1.Computertoplate:
从计算机直接到制版,即“脱机直接制版”,这是对CTP通常的理解。
2.Computertopress:
从计算机直接到印刷机,即“在机直接制版”。
3.ComputertoPaper/Print:
计算机直接到纸张或印品,即直接印刷技术。
4.ComputertoProof:
计算机直接出样张,即彩色数字打样。
计算机直接制板机数字打样机
(2)缩微胶片主要有哪几种?
分别任选一幅缩微胶片及缩微阅读机的图片粘贴到实习报告中。
·卷片
卷片缩微品是卷线在片盘或片盒内进行管理和使用的缩微品。
·按胶片宽度分类
①16mm卷式缩微品
16mm卷式缩微品是用16mm宽的缩微胶片拍摄制成的。
②35mm卷式缩微品
35mm卷式缩微品是用35mm宽的缩微胶片拍摄制成的。
③70mm卷式缩微品
70mm卷式缩微品是用70mm宽的缩微胶片拍摄制成的。
④105mm卷式缩微品
105mm卷式缩微品是用105mm宽的缩微胶片拍摄制成的。
·按装片方式分类
①片盘式缩微品
片盘式缩微品是将卷式缩微胶片缠绕在片盘上,并以盘为单位进行管理和使用的缩微品。
②单轴盒式缩微品
单轴盒式缩微品是将16mm卷式缩微胶片缠绕在密闭的单轴片盒中进行管理和使用的缩微品。
③双轴盒式缩微品
双轴盒式缩微品是将16mm卷式缩微胶片缠绕在具有两个轴的密闭片盒中进行管理和使用的缩微品。
④片夹式缩微品
片夹式缩微品是将16mm片盘式缩微品装在特制的片夹内组成的。
·片式
片式缩微品是指以单张胶片为单位进行管理和使用的散页式缩微品。
①条片
条片是条形缩微胶片的简称。
条片一般是由16mm或35mm卷式片裁切制成的。
②封套片
封套片是封套缩微胶片的简称,它是把条形缩微胶片摄影机拍摄的条片或由16mm、35mm卷式片裁切成的条片装入封套中制成的。
将卷式片裁切成条片而制成的封套片,是由卷式缩微品转换为片式缩微品的一种形式。
③开窗缩微卡片
开窗卡片是"带有一个或多个矩形窗口的卡片,用于装插未摄影或经摄影和成像处理的缩微胶片",它是将带有缩微影像的一个或几个画幅的胶片固定在开窗卡片窗口处而制成的缩微品。
④缩微平片
缩微平片是由一个或多个画幅组成的矩形单页胶片。
常用的缩微平片其画幅按网格形式排列,因此,缩微平片中的画幅也称格;上端有标题区,在标题区内有可供直接阅读的标题和其他检索内容。
(3)选择自己认为比较有学习价值的移动硬盘内部结构图及磁带机结构图粘贴到实习报告中。
U盘内部结构图
磁带机结构图
(4)搜集至少6个含“RAM”并且含义与“随机存储器”相关的缩略词(如DRAM),并选择任一种的实物图片粘贴到报告中。
SRAM(静态随机存储器)DRAM(动态随机存储器)
SDRAM(同步动态随机存储器)CD-RAM(CD随机存储器)
FPMDRAM(快速页面模式内存)DDRSDRAM(双倍速率同步动态随机存储器)
(5)通过网络了解“全息光存储”的相关知识。
选择一幅有关“全息光存储”技术的图片粘贴到实习报告中。
全息光存储实际上还是一种光盘存储技术,采用复用技术,可大幅度地提高存储容量和系统性能。
主要有全息光存储的复用技术和全息光存储的编码技术
(6)通过网络了解“电子纸”和“电子书”的最新技术进展。
选择一幅“电子纸”的图片粘贴到实习报告中。
(7)绘制或复制计算机硬盘的逻辑结构图到实习报告中。
(8)用一幅图来表示计算机存储系统的多层次存储体系。
实验项目:
文本、多媒体信息编码压缩实验
实验学时:
2学时
实验日期:
2013-11-21
实验要求:
(1)熟悉字符编码、汉字编码的各种常用编码方案。
了解霍夫曼编码方法。
(2)熟悉图书、期刊等信息源的机读目录(MARC)格式。
(3)熟悉及掌握常用的文本压缩技术、音频、视频压缩技术。
实验内容:
(1)常见的字符编码除了7位ASCII编码,还有哪几种?
1.Unicode(UTF-8、UTF-16、UTF-32)
2.GB2312
3.GBK
4.GB18030
(2)常用的汉字编码除了GB2312外还有哪些?
“信”、“管”两字的区位码各是多少?
GB12345GBKGB18030Big5CNS11643
“信”4837“管”2560
(3)选择自己比较熟悉的两种汉字输入/输出编码,分别给出“信”、“管”两字的输入编码。
(例如“检”字的全拼编码是jian,五笔编码是swgi)。
“信”的全拼编码是xin五笔编码是wyg
“管”的全拼编码是guan五笔编码是tpnn(f)
(4)自举任意一个霍夫曼(Huffman)编码的小例子,并将其粘贴到报告中。
霍夫曼编码过程:
(5)访问我校图书馆网站下“馆藏资源”-“书目查询”栏目,任意设置条件检索出一批中文图书或期刊,任选其中一条记录阅读其“书目信息”及“机读格式”,并将“机读格式”中包含“200”字段在内的任意10个字段的内容(若全部粘贴则内容太多)粘贴到实习报告中。
(参阅教材P58-62)
机读格式显示(MARC)
100__|a20110923d2011ekmy0chiy50ea
1010_|achi
102__|aCN|b110000
105__|aaka000yy
106__|ar
2001_|a信息检索|AXinXiJianSuo|f主编陈明兵
210__|a北京|c中国水利水电出版社|d2011
215__|a251页|c图|d26cm
2252_|a21世纪高等院校创新精品规划教材|A21ShiJiGaoDengYuanXiaoChuangXinJingPinGuiHuaJiaoCai
300__|a高等院校创新精品规划教材
(6)从以下四种文本信息压缩技术中任选两种技术并各举一例来说明:
①空格压缩技术②位图压缩技术③游程编码技术④前端/后端压缩编码技术
空格压缩(Null Compression)将一串空格用一个压缩码代替,压缩码后面的数值代表空格的个数。
游程编码又称“运行长度编码”或“行程编码”,是一种统计编码,该编码属于无损压缩编码,是栅格数据压缩的重要编码方法。
对于二值图有效。
行程编码的基本原理是:
用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”。
行程编码因此而得名),使符号长度少于原始数据的长度。
只在各行或者各列数据的代码发生变化时,一次记录该代码及相同代码重复的个数,从而实现数据的压缩。
例如:
5555557777733322221111111行程编码为:
(5,6)(7,5)(3,3)(2,4)(1,7)。
可见,行程编码的位数远远少于原始字符串的位数。
(7)JPEG的有损压缩编码分为哪几步?
MPEG视频压缩算法的两个基础技术是什么?
JPEG压缩是有损压缩,它利用了人的视角系统的特性,使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。
JPEG算法框图如图5-13所示,压缩编码大致分成三个步骤:
1.使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。
2.使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。
3.使用霍夫曼可变字长编码器对量化系数进行编码。
MPEG标准的视频压缩算法中的两个技术基础是基于DCT变换的ADCT技术和基于块的方式的运动补偿.
(8)列举出至少三种音频信息的压缩技术。
时域压缩(或称为波形编码)技术
子带压缩技术
变换压缩技术
(9)比较WinRAR与WinZip最新版本的优劣势(不写在报告上)。
总结提高WinRAR压缩率的一些技巧。
让WINRAR成倍提高压缩率
1、选中并右击要压缩的文件,选择“添加到压缩文件”,在“常规”标志符下选择“创建固实压缩文件”(选择“锁定压缩文件”可使其不能修改其压缩的内容),并在“压缩方式”下选择“最好”。
2、点击“高级”标签下的“压缩”按钮,这时会打开“高级压缩参数”窗口。
进行如下操作:
(1)一般程序或文档
将“文本压缩”下的“预测顺序”设置为“30”,“内存使用”,“MB”设置为“30”,这两项值越高,压缩率越高。
(2)未压缩过的音频文件
比如WAV文件,将“音频压缩”下的“声道”设置为“4”(0为自动)。
(3)未压缩过的图片文件
比如BMP、TIF等,可将“真彩压缩”下设置为“强制”。
有可能会压缩得比JPG文件还小。
3、从“常规压缩”下的“字典大小KB”下拉菜单中选择“4096”项(如果内存高于64MB的话)。
最后点击“确定”开始压缩。
4、将一个任意较小的文本文件,与压缩后的压缩包重新压缩,具体方法请参照1~3步,只是在设置“字典大小KB”时,选择“2048”即可。
(10)辨析“压缩率”与“压缩比”两个概念。
(选做题)
压缩率描述压缩文件的效果名,是文件压缩后的大小与压缩前的大小之比。
压缩比是发动机中一个非常重要的概念,压缩比表示了气体的压缩程度,它是气体压缩前的容积与气体压缩后的容积之比,即气缸总容积与燃烧室容积之比称为压缩比。
实验项目:
文本、多媒体、Web信息检索技术实验
实验学时:
4学时
实验日期:
2013-11-28
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC元数据等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相关文献或数据信息。
熟练使用中外文著名搜索引擎检索Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
以下题目不使用跨库检索,使用单库检索。
未涉及的项目均采用默认选项。
(1)访问“中国期刊全文数据库”,利用其“高级检索”功能,试检索2008年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“信息存储与检索”的文章有多少篇,要求匹配方式为“精确”。
请将屏幕中自检索项设置界面向下至检索结果的前两条记录这部分内容截图粘贴到实验报告中。
(2)任意选择
(1)中的一条记录打开阅读全文,复制全文中的任意连续语句(不少于100汉字)到实验报告中,并注明该篇文章的篇名、刊名、年(卷)期、起讫页码等信息。
信息管理与信息系统专业是多学科交叉的边缘性学科,涉及管理科学、计算机科学、经济学、行为科学、运筹学、社会学等多学科的内容。
在教育部1998年的专业目录中,对信息管理与信息系统专业的培养目标是这样确定的:
“培养具备现代管理学理论基础、计算机科学技术知识及应用能力,掌握系统思想和信息系统分析与设计方法以及信息管理等方面的知识与能力,能在国家各级管理部门、工商企业、金融机构、科研单位等部门从事信息管理以及信息系统分析、设计、实施管理和评价等方面工作的高级专门人才。
”根据教育部的培养目标《信息存储与检索》课程设置为专业核心课。
篇名:
关于信息管理与信息系统专业《信息存储与检索》课程的研究
作者:
张继燕,欧莹元
刊名:
软件
年(卷)期:
软件2013年第34卷第5期
起讫页码:
155——156
(3)利用“维普中文科技期刊全文数据库”的“高级检索”功能,采用“直接输入检索式”方式,试检索2006年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“实验”的文章有多少篇。
要求将检索结果界面中自“检索结果**篇;您的检索式…”至第一条结果相关信息这部分内容截图粘贴到实验报告中。
(4)访问“中文社会科学引文索引(CSSCI)”数据库,点“包库用户入口”进入。
1998――2013年全部选中,点击“被引文献”进入被引文献检索界面。
在“被引文献期刊”后输入“徐州工程学院学报”,“排除自引”复选框选中,点击“检索”。
试查找1998――2013年《徐州工程学院学报》中文献被其它期刊文献引用的有几篇?
选择所有,显示,选择任意一对“被引文献”与“来源文献”,将两者的篇名、作者、刊载期刊名、卷期号、起讫页码等信息粘贴到实验报告中。
命中结果47篇,总计被引48篇次
实验项目:
文本、多媒体、Web信息检索技术实验
实验学时:
4学时
实验日期:
2013-12-5
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC 元数据 等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相 关文献或数据信息。
熟练使用中外文著名搜索引擎检索 Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
(5)使用谷歌(
.hk)检索“信息管理与信息系统”相关的信息,要求将“信息管理与信息系统”作为固定词组进行完全匹配,并且搜索到的结果均为 PDF 文件格式,并且限定在.edu 类型网站中检索。
请将标准搜索界面(默认首页)中输入的检索式通过截图粘贴到实验报告中。
(6)使用谷歌,从本地或网络上任选一幅有水印或尺寸较小(如网民头像等)的图片,检索出相应的无水印或尺寸较大的图片。
将检索图及检索出的任一满意结果图粘到实验报告中。
(7)使用XX识图(
)完成“ (6) ”中任务(要求用与“ (6) ” 中相同的图片进行检索,若检索结果为零也须将实际情况写在报告中)。
(8)①列举出反向图片搜索引擎Tineye(
)在日常工作生活中的至少三种用途写在实验报告中。
②试用 Tineye 完成类似“ (6) ”中的任务(②选做,可不写在报告中)。
它的功能就是允许你通过某张图片的一部分或者全部来搜索这张图片的完整版或者高清版等相似图片。
1你可以传一张照片,让Tineye去搜索,或者你也可以直接输入某一个图片的URL地址,TinEye照样可以将这个图片搜出来。
2手上有小图片或有水印,想找到更大更清晰的图
3、只有图片的局部,想找到该图的完整版
4、对某图片感兴趣,想知道它的来源和更多信息
5、你是站长、摄影师、设计师,想知道哪些网站使用(转载)了你的图片
6、你想找找看有没其他网站使用了你自己的照片
7.你拿到一张图片但是分辨率很低,那么你可以使用他来寻找较高分辨率的(前提是网上存在和被tineye收录了)。
实验项目:
信息检索系统设计实验
实验学时:
2学时
实验日期:
2013-12-12
实验要求:
通过设计及开发一个微型的检索系统,能够做到对信息检索系统的物理构成与逻辑构成、检索系统提供的检索功能、使用的检索技术等有更加充分的认识和深刻的体验。
为学生今后毕业设计及工作后进行信息管理系统的开发打下良好基础。
实验内容:
自行设计实验方案,任选熟悉的编程语言及数据库管理系统,进行微型检索系统的设计与开发。
实验要求:
1、对所开发检索系统的基本功能的要求
(1)主文档中至少包含 20 条数据记录(可以是书目、员工、学生等,由你设计的 系统应用领域决定) ,其中英文记录数不低于20%。
(2)检索系统支持至少3种检索途径(比如题名、作者、关键词或其它常用检索入 口) ,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 存储 实验 报告 要点