大数据时代下的图书馆的发展资料.docx
- 文档编号:14063730
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:12
- 大小:25.09KB
大数据时代下的图书馆的发展资料.docx
《大数据时代下的图书馆的发展资料.docx》由会员分享,可在线阅读,更多相关《大数据时代下的图书馆的发展资料.docx(12页珍藏版)》请在冰点文库上搜索。
大数据时代下的图书馆的发展资料
大数据时代下的图书馆的发展
[内容摘要]随着云计算、移动互联网、互联网+等网络信息技术的迅猛发展,大数据已经成为国内外各行业研究的热点,从此看来大数据时代的到来是信息化社会高速发展的必然结果,同时作为当今社会知识信息服务中心的图书馆,不可避免地受到大数据信息技术应用潮流的影响,图书馆中的大数据量呈现爆炸式增长。
本文基于大数据的概念,简要介绍了大数据特征及大数据对图书馆的意义,从个性化服务、数据管理及隐私安全等三个方面分析了大数据给图书馆带来的影响,并提出了改进措施和建议。
以便提高图书馆在大数据时代下的核心竞争力,有效提高图书馆的服务质量,促进图书馆事业取得更好的发展。
[关键词]大数据时代;图书馆;个性化服务;数据资源管理;隐私安全
现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。
阿里巴巴创办人马云曾在演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是DataTechnology数据科技。
对于已经进入大数据时代的图书馆,用户对图书馆的个性化服务、数据管理能力、隐私安全能力等提出更高层次的要求。
因此如何利用大数据资源使图书馆提高海量文献的数据处理能力,挖掘数据信息深层内涵,及时发现用户需求,对数据资源进行管理及完善隐私安全保障是图书馆界进行学术研究的重点。
1、大数据简介
(1)大数据概述
最早提出“大数据”时代已经到来这个概念的机构是全球有名的咨询公司麦肯锡。
学术界虽然并未对大数据形成一个统一的定义,但是普遍认为大数据作为结构化数据、半结构化数据与非结构化数据的总和,是一种在种类繁多、数量庞大的多样数据中进行的快速信息获取。
我们可以这样理解,大数据时代的生产原材料是数据,生产工具则是大数据技术,其对信息时代所产生的海量数据进行挖掘和分析,从而快速获取有价值的信息,产生信息累计捕获。
所以“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[1]。
(2)特点
大数据定义各家有不同看法,但无外乎3V、4V之争。
文献中最多提到的,认为大数据特性被归纳为4V+1C。
1.数据量巨大(Volume),从TB级别跃升到PB级别(1PB=1024TB)。
举例说明,全球46亿移动电话客户有20亿人访问互联网。
谷歌导航每天需要提供的数据超过1.5PB,这些数据如果用A4纸打印出来将超过5千亿张纸。
人类制造纸张的数据量仅仅为200PB的能力。
2.处理速度快(Velocity),大数据要求快速及时,处理数据处理遵循1秒钟定律原则,可从各种类型的数据中高速度的获取高价值的信息,这也是和传统的数据处理技术有着本质的不同。
3.数据种类繁多(Variety),大数据一般包括结构化数据如普通事务;半结构化数据如网络日志;非结构化数据如视频、音频、图片、地理位置信息等。
个性化的数据占有量非常大,它们的分析和处理方式有很大的区分,以非结构化数据为主。
4.价值密度低(Value),价值密度的高低与数据总量的大小成反比。
大数据的内涵不是对数据量大小的固定的描述,而是一种在品种繁多、数量巨大的各种各样数据中进行的快速的信息截取。
5.数据复杂(Complexity),数据具有复杂性,类型多样而造成。
(3)图书馆使用大数据分析的重要意义
1.图书馆在跨界竞争中需大数据的支持
大数据时代,图书馆与同类业界间的竞争,将不仅仅局限在馆藏资源、馆舍空间、服务质量等方面,大数据的获取与储存量及对各类海量数据的分析能力和隐私安全,将成为大数据时代图书馆界在竞争中获得优势的重要指标。
对大数据的分析与利用将对图书馆在制定发展策略时产生重要影响。
2.图书馆用户服务模式的调整与创新需大数据的支持
大数据将成为图书馆的核心资源。
随着大数据技术的日趋成熟,大数据的价值逐渐被各界所了解,能为图书馆规划未来、调整服务模式、进行服务创新的趋势分析与发展预估提供数据支撑,所以这样的大数据都将成为图书馆的核心资源。
3.大数据技术的发展也为图书馆界带来了更多的机会与挑战。
大数据时代要求图书馆不仅要通过结构化数据了解用户目前对图书馆服务的满意度,也更需利用大量的非结构化、半结构化数据在图书馆的用户服务系统中去了解正在发生的,预测和分析将会发生的,以便找到更好的用户服务模式,以应对未知的挑战。
2、大数据时代下的图书馆现状
(1)服务个性化
伴随云计算技术、大数据存储技术、无线通信技术的快速发展,用户已摆脱了阅读时间、地域、服务对象、阅读内容和终端类型的束缚,实现了以用户为中心的个性化阅读服务。
有效采集用户阅读行为、身份特征、个人爱好与习惯和社会关系等信息,并将所收集到的数据进行整合、分析与挖掘,实现对用户阅读需求和阅读行为分析和预测,成为图书馆根据用户需求转变服务模式和定制个性化服务内容,提高服务有效性、用户满意度和市场竞争力的关键[2]。
1.从获取信息方式来看,需要从用户信息、资源信息以及用户历史访问信息中,通过运用数据挖掘和联机分析技术来识别信息资源之间的关联、用户之间的关联以及用户的兴趣等模式,来了解用户的个性化需求,满足用户个性化服务。
但目前大部分图书馆,仅仅借助用户借阅排行、图书借阅排行、数据库点击率等数据来判断用户的信息需求,数据挖掘方式比较单一。
2.从检索书籍期刊的技术方面方面来看,个性化服务系统中应该建立用户的个人档案,可依据用户档案及历史访问信息等识别用户兴趣,了解用户需求并完成分类。
将其感兴趣的内容提供给检索者,过滤无关的信息,返回给用户更加符合实际需求的信息分类定制结果集合。
现大多图书馆只能够凭借用户了解书籍名称、作者、关键词等方面来检索想要的内容。
3.虚拟咨询服务方式简单。
目前,大多数图书馆都开展了虚拟咨询服务,图书馆依靠网络作为传输手段,通过电子邮件、留言板和实时聊天等形式为用户提供咨询服务,虽然用户可以不受时空限制向图书馆馆员进行咨询,用户也可从领域专家、历史咨询信息和知识库等那里得到答案。
但从历史咨询信息查看,问题覆盖面小,且仅限于浅层次的交流。
4.信息服务方面,想做到专、深、精,必须通过汇聚网上某一特定专题信息资源并对其进行挖掘及加工,以满足用户基于专业深入的信息需求。
图书馆目前对于服务对象所需的信息,综合性及广泛性服务较多,信息方面没有特色[3]。
(2)数据管理
在大数据时代,海量的、多样性数据的产生,存储、分析等方面的数据管理将对社会形态的产生巨大深远影响,如何利用大数据来发现、识别、组织与分析图书馆数据,对读者行为中所产生的各类数据信息进行储存分析方面的管理,以发现读者的隐性诉求进而拓展与改进图书馆数据管理,并且规划建设图书馆的各类资源,完善并发展图书馆服务工作,已成为大数据时代图书馆研究的热点。
1.资源结构重复部分过多。
数据是数字图书馆的核心资源,图书馆虽然构建了各种数据库,实现了信息资源、馆藏的数字化,然而基于很多图书馆没有科学合理的组织管理方法,网络数据多数存在不规范和重叠的现象。
例如知网、维普等很多数据库中的文献资料是一样的,购买的数据或者博硕文献、影像也是有雷同的,形成了资源的极大浪费。
与实体图书馆资源也有同质化现象,数据重复建设问题严重,建设结构不是很合理[4]。
2.数据技术管理
(1)大数据时代的数据类型多种多样,图书馆所购数据库又差异较大,这就需要图书馆在处理数据时利用不同的硬件去存储数据及不同的软件去访问数据,或者出现一些研究者在共享自己的数据后,由于一些技术原因,使得数据难以访问。
因此,数据进行维护和改变数据格式很重要。
(2)好的管理系统应使数据更易访问和使用,但目前绝大多数图书馆的数据管理和处理系统已经形成,如果进行改变,则需要耗费巨大的人力和物力成本,这项工作对专业能力的要求非常高、工作难度大且复杂,图书馆缺乏对数字化技术和数据库设计的能力,缺乏现代科技专业人才,阻碍了图书馆数字化进程因为图书馆数字资源建设。
同时在人员管理方面,图书馆也没有建立良好的学习和自我提高氛围,致使很多工作人员没有学习专业知识的积极性,影响建设成果,这使得图书馆缺乏改变自己目前的数据管理系统的动力。
3.数据安全管理上,部分图书馆的一些数据可能涉及保密,如牵扯到国家安全有关军事方面的数据、政府文件等,在这种情况下,数据共享一般很难实现;也有部分研究者认为,一旦数据离开自己的实验室可能会遭到滥用或者曲解;还有不少学者认为个人研究论文成果怕别人窃取后署上自己的名字。
有人进行过在一项针对1300名科学家的调查中,75%的回答者赞成数据共享,但33%的回答者不确定自己是否会共享数据,有46%的回答者明确表示自己的数据不会公布在公开的网站上。
4.资金问题方面,信息基础设施决定了图书馆的存储和计算能力。
为了适应数据量及非结构化数据的快速增长,存储及计算规模在不断增大,这就对图书馆软硬件设施提出了更高的要求,同时对计算机集群的维护也带来了挑战,由于图书馆经费有限,加之很多数据库的价格一直在增长,CNKI的价格增长较原来提高了1/10左右[5]。
在各种成本急剧上升的情况下,图书馆在资金方面将面临巨大的压力。
(3)隐私安全保障
大数据时代是个“透明的社会”,个人对其数据的管控能力快速下降。
随着获取和分析能力的提高,零散数据中有价值的信息很容易被发现和利用,隐私受到威胁与侵害的机率明显增加,信息安全变为不可控安全管理,隐私和信息安全将成为挑战性问题。
1.基于管理活动造成泄露。
大数据时代,用户隐私安全保护成为图书馆的主要业务活动。
但是,图书馆对数据搜集、分析和利用中任何环节的漏洞与疏忽,都可能造成用户隐私的泄露。
特别是某些类型的数据处于受到保护的“灰色地带”,而图书馆和用户对其管理权、控制权又模糊不清时,更易发生侵权问题。
图书馆的管理权与用户的隐私权冲突时,隐私泄露的机会将明显增加。
比如,有的图书馆出于催还书的目的,将未按时还书的用户信息在网上公布出来就是非常值得商榷的做法。
2.技术更替升级方面造成泄露。
当用户个人数据从图书馆服务器向云服务器迁移时,如何保障隐私不被泄露就是非常值得思考的问题。
比如,当某人不再是图书馆的用户,图书馆已无必要保留其个人数据,但是在大数据背景下很难通过单纯的技术措施彻底删除和销毁个人信息,这样对用户隐私潜在的负面影响将是一个长期的过程。
3.基于阅读方式的泄露。
3G、4G等移动通信技术的发展,使个人数据交流量大且互动频繁,增加了隐私泄露的源头和风险。
据报告显示,2013年超过5.52亿条身份信息被泄露,并将2013年定义为“大规模数据泄露年”[6]在图书馆,读者通过各种移动终端可以随时随地获得移动阅读、移动位置、移动参考、移动视听、移动特色资源等服务,以及同步、在线、可视化的全媒体服务,但是移动设备的复杂性、数据的非结构性、移动通讯的即时性加大了图书馆对用户隐私安全保证的难度,部分敏感数据很容易被第三方监测、跟踪、盗取。
3、面对大数据图书馆的措施
(1)个性化服务策略
1.充分利用大数据分析用户需求信息,形成个性化服务方案
大数据超大容量的信息量,为分析用户服务需求创造了条件。
图书馆可以通过对图书馆信息服务内涵与特征的分析,根据蕴含其中的信息内涵,深入掌握用户阅读兴趣、专业需求,提供针对性的个性化服务。
2.构建个性化服务模型,打造智能化服务平台
个性化服务模型的构建是为用户提供个性化服务的前提,可从用户数据信息、馆藏文献信息等方面入手构建,通过构建个性化服务模式,打造智能化服务平台。
工作人员通过智能化系统对读者的信息除姓名、性别、年龄、职业、爱好、教育程度进行分门别类统计外,还要利用自动捕捉Web日志记录的用户行为特征,如对知识点的点击率、停留时间、访问次数下载次数、搜索关键词及模式等信息,主动搜索可能引起用户兴趣的信息,为读者提供更精确、更恰当的信息服务[7]。
(2)数据管理措施
1.图书馆应建立数据协作网
在大数据时代,图书馆对数据的采集、分析、利用应借助于包括其他类型图书馆、商业机构、社会服务中心、互联网络企业等在内的信息中心的数据支持。
尤其是各图书馆间应形成有机的协作网络体系,实现数据共知共享,最大程度地满足用户需求,图书馆应成为社会公共数据服务网络的重要节点。
2.培养一支大数据分析专业人员队伍
大数据分析的每个环节都需要依靠懂技术的专业人员完成,因此,必须要培养一支技术过硬、懂管理、听指挥的大数据分析专业人员队伍。
大数据时代下图书馆传统的工作内容、管理方法、工作方式都发生了根本的改变。
图书馆要紧紧抓住这个时机,开展数据管理服务模式,扩大支持研究的服务内容和服务能力,使图书馆馆员成为数据管理服务模式的执行者。
研究数据管理服务必将成为新一代图书馆馆员的必修课。
当前的任务是如何在现有基础上,拓宽图书馆馆员的知识面。
3.建立图书馆数据共享的保障机制
(1)图书馆应该加强相互的联盟合作,特别是发展数字图书馆联盟或发展跨领域合作与国际合作,这会大大提高图书馆的数据分析与数据整合能力。
(2)提供一站式服务。
信息资源包括实体资源和虚拟资源,它们来自于不同的数据库和知识库,图书馆不可能收集到所有的信息资源,这就需要利用大数据技术,对数据进行快速搜集、整理、分析,以便实现不同数据的整合,可以设置自身的数据库代码和网站、时间数据库之间的互链,实现用户对数据的管理,从而为用户提供一站式服务。
(3)数据共享资金。
由于数据共享需要较高的资金成本,而资金问题在很大程度上限制了数据共享。
因此要想实现图书馆之间数据共享,国家或地方政府应设立相应的数据共享基金,为数据共享提供资金支持。
4.完善相关法律体系
目前,许多国家已出台针对数据共享方面的法律法规,如2012年印度制定了《印度国家数据共享和存取政策》[8],该政策明确了数据的获取范围、目标、共享技术、共享方式等,并规定印度政府部门需要将高质量的数据集传到制定的数据门户网站上。
从我国来看,除对中国社科院、国家气象局等一些实施数据共享的单位制定一些宏观的数据共享政策外,目前我国并没有专门针对数据共享的法律法规,这一方面会导致数据共享中产生的利益纠纷很难得到解决,另一方面也不利于知识产权的保护。
因此,应加快制定和完善我国有关数据共享的相关法律政策。
(3)用户隐私保护策略
1.完善对个人数据利用行为的立法规制
隐私安全威胁和隐私保护在大数据时代的新发展表明,对个人数据管理应以立法为基础,制定一部统一的个人信息保护法是必要的。
应从国家战略和维护人民利益的角度出发制定法律。
法律制定的原则应坚持保障国家和人民利益不受侵害的前提下,在数据的采集、使用、分析和决策过程中,充分尊重公民的个人利益和隐私权。
同时,还可通过参加“用户隐私权利联盟”和发表相关《用户隐私数据保护自律宣言》的方式,自觉规范自己的行为并接受社会和用户监督[9]。
2.加强保护用户隐私和信息安全管理
大数据时代各种信息、隐私很容易被泄露。
我们必须加大对网络安全的投入,建立信息安全风险评估模型,对潜在的各种风险进行预测,同时也要加大对用户信息的保护。
只有具备良好的职业道德、完善的服务保障体系、熟练的业务能力、合理合法的数据利用和传播,才能达到既发挥大数据的技术优势,又不侵犯用户隐私的双赢目的。
3.提高保护用户隐私安全技术
技术是维护人格和法律尊严不可缺失的手段。
要求采取技术措施保护信息安全,防止泄露、损毁、丢失公民个人信息。
在大数据时代,图书馆应围绕数据产生、收集、传输、储存、处理、分析、发布的生命周期制定和实施隐私管理技术战略,除了研发有针对性的防火墙、入侵检测、系统认证、病毒防范、安全审计、网络隔离、数据加密等技术外,还应采取更加主动和灵活的隐私保护策略。
如划分用户个人数据的密级,将密级较高的敏感数据存储在图书馆私有云中,而将其他数据存储在云服务商提供的服务器中。
又或者可以采取措施实施用户个人数据与其他类型图书馆数据的物理隔离。
4、总结
综上所述,图书馆要对数据进行重新的收集、整理、存储、分析、服务,通过分析大数据找到大数据背后的深刻含义,才使大数据能够合理地在图书馆工作中得以广泛的应用。
从个性化服务来看,大数据时代高校图书馆个性化服务是面向用户需求的深层次服务。
随着大数据个性化服务深入和用户服务需求的增长,图书馆大数据环境和用户行为分析过程将更加复杂多变。
因此,图书馆应保证用户行为数据的产生与采集、数据的获取和管理、用户的行为分析、服务系统管理与服务的过程,符合用户阅读行为和服务质量保障的生命周期发展规律,实现统一平台、统一系统、统一管理和统一决策,这样才能为基于大数据的图书馆读者个性化大数据服务提供更可靠的数据支持。
从数据管理方面来看,大数据时代下的图书馆要从结构资源、人才技术方面建立好特色资源库和共享机制;此外,还应从法律体系、服务管理和大数据应用等多个层面出发,制定基于大数据支持的安全管理与风险防控策略,才能保证图书馆系统管理与运营、用户大数据服务和用户保密资源安全,才能为用户提供安全、高效、经济和可靠的大数据阅读服务。
最后图书馆用户隐私安全问题方面,图书馆的系统管理与配置数据、用户服务数据、用户帐户和密码、用户服务需求数据、用户特征与行为数据、用户服务模式和内容数据等,都是容易被截获、窃取和篡改的重要目标。
因此,图书馆必须依据大数据时代面临的安全威胁和安全需求,从数据中心基础设施的安全保障、大数据资源的安全管理与存储、安全防御平台系统的可用性管理、大数据应用的安全性建设出发,构建高效、公平、透明、可控的图书馆大数据服务安全管理平台。
数据在给各个行业带来挑战的同时也带来机遇,作为信息存储、收集和知识服务机构的图书馆,要把握机遇,利用大数据的潜在价值,不断的与时俱进、更新理念、创新服务模式、提高服务质量,这样才能促进图书馆事业的更好发展。
参考文献
[1]张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012,(6),15-21.
[2]杨海燕.大数据时代的图书馆服务浅析[J].图书情报报,2012,(4),120-122.
[3]谭磊.NewInternet:
大数据挖掘[M].北京:
电子工业出版社,2013,82-103.
[4]刘磊,高海燕,邵伟波等.社会网络环境下用户参与图书馆数字资源组织与整合的需求调查:
以部分高校为例[J].图书馆理论与实践,2014,4(9),114-118.
[5]胡钦文.大数据时代图书馆荐购数字资源模式的转向[J].黑龙江科技信息,2014,11(34),168-179.
[6]窦海霓.新技术带来隐性威胁运营商应承担更多责任[J].通信世界,2014(13),32.
[7]宋婷婷.WEB搜索引擎设计原理与发展方向探究[EB/OL].
[8]唐义,张晓蒙,郑燃.国际科学数据共享政策法规系:
LinkedScience制度基础[J].图书情报杂志,2013(3),68-72.
[9]王艳,乐嘉锦,孙捷等.网络用户行为的隐私保护数据挖掘方法[J].计算机工程与应用,2012,48(13),138-143.
《管理信息系统》课程论文成绩评定表
等级
成绩
组成
优秀
良好
中等
及格
不及格
报
告
文
档
1.文档很规范。
2.排版很清晰。
3.内容很全面。
4.设计很合理。
1.文档规范。
2.排版清晰。
3.内容全面。
4.设计合理。
1.文档较规范。
2.排版较清晰。
3.内容较全面。
4.设计较合理。
1.文档欠规范。
2.排版欠清晰。
3.内容欠全面。
4.设计欠合理。
1.文档不规范。
2.排版不清晰。
3.内容不全面。
4.设计不合理。
问
题
描
述
1.问题描述正确。
2.问题描述分析很全面。
3.问题描述很清晰。
1.问题描述正确。
2.问题描述全面。
3.问题描述清晰。
1.问题描述正确。
2.问题描述较全面。
3.问题描述较清晰。
1.问题描述基本正确。
2.问题描述分析欠全面。
3.问题描述欠清晰。
1.问题描述不正确。
2.问题描述分析不全面。
3.问题描述不清晰。
问
题
分
析
1.问题分析思路很清晰。
2.问题分析步骤很完整。
3.问题分析正确。
1.问题分析思路清晰。
2.问题分析步骤完整。
3.问题分析正确。
1.问题分析思路较清晰。
2.问题分析步骤较完整。
3.问题分析正确。
1.问题分析思路欠清晰。
2.问题分析步骤欠完整。
3.问题分析基本正确。
1.问题分析思路不清晰。
2.问题分析步骤不完整。
3.问题分析不正确。
问
题
解
决
1.有问题解决的措施或对策。
2.措施或对策描述很清晰、很完整。
3.提出的措施或对策具有较大的实际意义。
1.有问题解决的措施或对策。
2.措施或对策描述清晰、完整。
3.提出的措施或对策具有一定的实际意义。
1.有问题解决的措施或对策。
2.措施或对策描述较清晰、较完整。
3.提出的措施或对策具有一定的实际意义。
1.有问题解决的措施或对策。
2.措施或对策描述欠清晰、欠完整。
3.提出的措施或对策具有的实际意义不大。
1.无问题解决的措施或对策。
2.措施或对策描述不清晰、不完整。
3.提出的措施或对策不具有实际意义。
课
程
总
结
1.有课程总结。
2.课程总结很全面、很深入。
1.有课程总结。
2.课程总结全面、深入。
1.有课程总结。
2.课程总结较全面、较深入。
1.有课程总结。
2.课程总结欠全面、欠深入。
1.无课程总结。
2.课程总结不全面、不深入。
综合成绩评定:
评阅老师(签章):
年月日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 时代 图书馆 发展 资料