新一代OPAC开源软件的兴起及未来发展.docx
- 文档编号:11036568
- 上传时间:2023-05-28
- 格式:DOCX
- 页数:14
- 大小:28.61KB
新一代OPAC开源软件的兴起及未来发展.docx
《新一代OPAC开源软件的兴起及未来发展.docx》由会员分享,可在线阅读,更多相关《新一代OPAC开源软件的兴起及未来发展.docx(14页珍藏版)》请在冰点文库上搜索。
新一代OPAC开源软件的兴起及未来发展
新一代OPAC开源软件的兴起及未来发展
韩志萍
2013-2-2715:
37:
53 来源:
《大学图书馆学报》(京)2009年6期
【英文标题】TheEmergenceandDevelopmentoftheOpenSourceSoftwareoftheNewGenerationOPAC
【作者简介】韩志萍,中央财经大学图书馆,北京100081
【内容提要】详细分析了网络2.0环境下传统OPAC发生变革的必要性,指出当前涌现的开源OPAC应用对推动新一代OPAC的发展具有重要作用,并介绍了美国图书馆同行为此而实现的不同层次的开源OPAC案例,在此基础上进一步探讨了开源OPAC在功能方面存在的不足、如何可持续发展以及今后需要注意的问题。
ThepaperexploresthemainproblemsbroughtbytheWeb2.0environmenttothetraditionalOPACsandindicatesthatdifferentkindsofopensourcesoftwaredevelopedbysomeinnovativeAmericanlibrariescouldbealternativesolutionsfornewgenerationOPACapplications.Attheend,futureimprovementanddevelopmentoftheopensourceOPACsarediscussed.
【关键词】OPAC/开源软件/可持续发展NewgenerationOPAC/Opensourcesoftware/Sustainability
对图书馆信息资源的检索和获取主要通过OPAC(OnlinePublicAccessCatalogue)实现,因此OPAC也被称为资源发现平台或者前端,是图书馆资源体系与读者发生互动的主要阵地。
近年来,web2.0对图书馆传统的自动化管理模式带来了巨大冲击,图书馆员们开始反思网络环境下的图书馆应该向读者提供怎样的资源发现平台才能充分发挥图书馆资源的价值。
在此背景下,一直饱受非议的OPAC成为最活跃的开源软件试验对象,特别是在颇具开源传统的美国,图书馆同行推出了不少新一代OPAC开源前端软件。
这些全新的OPAC在一定程度上起到了带头示范作用,使越来越多的图书馆开始关注OPAC的更新换代问题。
1传统OPAC为什么需要变革
长期以来馆员和读者对OPAC的检索效率有更高的期待,比如检索结果相关性不强、不能像浏览卡片目录那样浏览机读目录、没有分面组配检索帮助等。
这些特点使OPAC更适合查找读者已知条目而不便于探寻未知资源。
对此非议,集成系统供应商反应淡漠,自OPAC诞生以来20年间没有对其进行实质性改进。
进入网络2.0时代,信息搜索空间无限扩大,读者们开始依赖OPAC之外的信息发现路径,图书馆的社会功能面临拓展升级压力,这些都对传统的OPAC提出了新的要求,其变革迫在眉睫。
1.1信息环境发生变化,资源在他处
传统的OPAC用来检索馆藏印本图书的排架号等有关信息,便于读者确定本馆是否有这本藏书,如果有,到哪里可以找到。
那时OPAC面对的是固定存放于本地、数量增长有限的印本书刊,编目数据一旦完成,基本不用维护修改,可供OPAC永远使用。
图书馆OPAC作为图书信息检索领域唯一的供应方,满足于自己具有独占地位的检索界面和检索效率,多年如一日,少有改进。
进入新千年以来,信息环境发生巨变,数字信息呈指数扩张,网络搜索引擎纷纷出现,搜索内容无所不包,其中也包括传统上由图书馆独家提供信息检索的学术资源。
这些商业性搜索引擎的检索性能远远优于图书馆传统的OPAC,主要体现在检索界面简单、信息源丰富、检索结果相关性强、能够直接得到全文等方面。
与此同时,图书馆收藏的资源迅速由印本资源独占演变到与数字资源二分天下的局面。
现在已经无法想象一个研究型图书馆离开数字资源该如何为读者提供有效的信息服务。
通常来说,图书馆订购的多种电子资源的检索一般不在OPAC的范畴之内,而是单独拥有一个电子资源跨库检索界面,或者更简陋一些,直接到各数据库主页分别检索。
这种印本资源和电子资源分别检索的安排给那些习惯了一站检索的读者带来操作上的困惑和不便。
图书馆资源中非印本部分起到越来越重要的作用,但是读者通过OPAC却得不到这部分资源,此时图书馆的资源还在别处,即便OPAC的检索系统性能再好,也不能适应那些已经开始依赖全文环境的读者的需求。
由此可见,当前的目录体系首先要转变观点,将电子资源纳入检索体系中来。
在此情形下,如何将印本资源和数字资源以简明、有效的方式揭示并送达给读者,是OPAC面临的最大挑战。
数字资源与印本资源最大的不同在于保存地址有可能发生变化;同时,即便原地址依然存在,信息内容可能已经发生变化。
这为OPAC的元数据编目带来了困难,也为建立包含多种资源的资源发现平台提出了挑战。
沿用现有的编目模式,可能很难适应馆藏数字信息的检索实现。
1.2读者群体多样化,读者在别处
OPAC的中文含义是“联机公共检索目录”,所谓联机的参照物是图书馆环境以外的整体脱机环境。
这个称谓诞生于上个世纪的七、八十年代,那是个没有社会网络的时代,要想进入图书馆局域网,只能来到图书馆大楼里查询图书馆检索机的OPAC。
图书馆拥有的OPAC属于信息检索领域领导科技潮流的技术,曾为图书馆披上现代化面纱立下汗马功劳,也为读者查询本地馆藏提供了极大方便。
随着网络日益普及,联机环境已无处不在,各种信息搜索工具风起云涌,读者脱离了OPAC依然可以有效地搜索到图书信息甚至学术性期刊文献全文。
此时,OPAC检索界面所服务的图书馆的既定用户已经开始分流,越来越少地留在本地,也就是说我们的读者已经到了无限网络空间的他处。
图书馆如果依然坐等读者访问实体图书馆或者数字图书馆目录体系来查询、获取信息,将面临读者越来越少的尴尬局面。
尽管网络信息极大丰富,但是图书馆的资源优势依然显著而独特,这些花费巨资购买的信息资源在很多公共网站内是无法得到的。
由于Google等搜索引擎简单易用,认知度高,在校大学生在搜索资源时最先想到的是公共搜索引擎,而不是图书馆OPAC[1]。
这种习惯使他们忽视了图书馆信息资源,由此削弱了图书馆信息资源的使用价值。
在此情形下,OPAC及其所属的图书馆集成管理系统应当走出图书馆大楼、走出数字图书馆虚拟空间以适应无限延伸的网络信息世界,想方设法提高OPAC的吸引力和读者的忠诚度。
如何走出去?
首先需要研究读者群体的不同特征,根据不同年龄段读者的不同网络利用习惯,推出个性化的可定制的检索界面,并推送到读者经常造访的网络空间。
对高校图书馆来说,学生读者是非常重要的用户群体,应当重视学生读者的需求,提高读者对OPAC的黏度和忠诚度,从而提高图书馆资源的利用率。
其次应当实现图书馆集成管理系统功能模块化,建立面向服务的基础架构,使不同服务之间能够互相对话而互不影响,并通过共同应用的标准实现与图书馆之外的信息交换。
1.3图书馆功能外延,社会性增强
传统上图书馆的功能定位是资源中心和学习中心,图书馆员满足于为读者提供经过严格分类的井然有序的书刊资源和安静的学习空间。
自从上世纪90年代有学者提出知识管理的概念之后,图书馆领域掀起有关的学术讨论热,越来越多的图书馆员认识到,在知识创新环境巨变、知识快速增长的今天,图书馆应兼具知识中心的功能,为用户掌握和创造知识提供便利条件。
根据AL-Hawamdeh[2]的看法,以文本形式表达的信息并不一定能转化成现实有用的知识,除非这些信息被阅读、掌握并与其他人进行有效沟通。
换句话说,只有存在于人脑中的信息才是知识,只要它脱离了人类的大脑,就又还原为信息。
由此看来,成功的知识管理过程应当将知识看做一种行为,而不仅仅是静态的文本。
传统的信息管理系统更擅长管理书本等物体,而不擅长管理创造知识的行为,这是图书馆在特定历史时期的功能定位导致的。
进入网络社会,知识创新能力成为国与国、组织与组织之间竞争的首要要素,图书馆应当充分支持读者的知识消化和创新能力,由信息中心扩展为知识中心。
图书馆一直具有社会性,这种社会性主要体现在其信息中心和学习中心的定位上,也就是说图书馆的信息资源和物理空间是大众共享的,传统图书馆的社会性仅限于此,无论图书在读者之间的传递借阅的机制还是大众分享学习空间的机制,都是单向的信息流动,缺乏读者之间发生知识互动的机制。
现在有些高校图书馆开始建立“学习空间”,专供读者在此进行交流、沟通,期望通过这一过程帮助读者将书里的信息转化为自己的知识,体现了图书馆在实体空间社会性延伸领域所做的尝试和努力。
与此同时,与实体图书馆几乎具有同样重要地位的虚拟图书馆的社会性却没有得到相应的加强,OPAC的信息内容主要由图书馆员选择并处理,没有为读者提供交流分享知识的平台,这种状况与网络社区高度发达的现实脱节,表现为图书馆虚拟空间社会性的缺失,严重影响到图书馆作为知识中心功能的发挥。
在网络如此发达的今天,虚拟图书馆的社会性可以通过在图书馆资源门户中为读者提供信息资源标注和社交讨论空间来实现。
通过这样的社交平台,图书馆的社会性得到进一步加强,读者在此过程中也能够将书本信息更顺利地转化为自己掌握的知识,因此应当充分利用图书馆虚拟空间的社会性来提升图书馆知识中心的功能。
从上述几个方面来看,传统OPAC已经落后于时代的发展,至少应当在提高检索效率、兼容电子资源检索和获取、贴近读者网络空间、提高社会性等方面做出切实的改革,才能基本胜任新时代赋予的网络OPAC资源发现的重任。
基于此,自2005年以来,在具有深厚开源软件传统的美国,图书馆同行对OPAC改革创新的讨论不断升温,既催生了主要集成系统供应商推出新一代OPAC前端产品,同时图书馆的技术馆员也努力推进开源OPAC软件的设计开发和应用。
这些开源软件的应用为图书馆软件开发带来了新鲜力量,在推动新一代OPAC开发和应用进程中起到重要作用,也是本文重点关注的领域。
2新一代OPAC开源软件开发及应用情况
为了不受私有软件的约束,同时将OPAC的设计权掌握在自己手中,越来越多的技术馆员自愿组织起来开发开源软件,试图以合作共建的模式进一步诠释图书馆资源共享的精神。
基于对OPAC功能的不同认识以及所投入的精力多少,美国图书馆界在新一代OPAC开源软件方面所做的工作可以划分为功能增强型、外观更新型、前端替代型和ILMS替代型等,开发成本和实现难度逐级递增,功能也逐渐强大[3]。
2.1功能增强型
这种模式是在基本保持现有OPAC内部结构和检索界面前提下增加一些侧重提升OPAC社会性的功能,比如实现OPAC与其他网站封面信息的连接、为读者提供资源加注平台等、为读者在自己的网络空间利用图书馆资源发现体系创造便利条件等。
比较知名的有宾夕法尼亚大学图书馆的PennTag[4]、密歇根大学图书馆的Mtagger[5]等,它们率先在OPAC中实现了标签云功能,允许读者对资源加注标签并以标签对馆藏进行聚类。
这种功能增强型工具的开发往往在图书馆同行之间以非正式交流的方式分享,也可以称得上是开源代码。
值得一提的是LibraryThingForLibraries(LTFL)[6],这是LibraryThing网站专门面向图书馆推出的图书评注模块,它突破了由大学图书馆自行开发实现、本校读者加注标签的功能,充分利用LibraryThing网站所有用户提交的图书评论及标签信息,以此增强本馆读者的图书检索体验。
它的运行与OPAC相对独立,通过一个实用小程序在OPAC和标签浏览器之间建立关联。
这个产品并不像该网站的书封一样免费提供,需要付一定的年费。
尽管如此,已经有许多图书馆开始使用这一产品加强本馆OPAC的功能。
这个产品的价值不在于其软件,而在于其提供的读者书评。
从其用户群来看,公共图书馆比学术图书馆更欢迎这种功能增强型的产品。
2.2外观更新型
这种模式依然利用原有OPAC作为检索工具,但是选用了有关的内容管理软件来设计OPAC前端,推出全新的用户友好的检索界面,同时增加一些新功能,诸如提高社会性、实现分面组配浏览等。
这种模式的好处是不用单独设计程序处理ILMS里的MARC数据,减少系统的开发和维护成本。
不足之处在于不能随意将ILMS系统之外的资源内容纳入检索体系中,不能控制和改变原有系统的检索机制,因此检索效率没有实质性提高。
2.2.1 SOPAC
SOPAC[7]是这一类型开源软件中比较突出的代表,该软件最初在AnnArborDistrictLibrary开发并实现,是“SocialOPAC”的简称,侧重于加强OPAC的社会性功能,允许读者提交标签、评论、评级等,可适用于各种图书馆集成系统。
它使用开源的Drupal内容管理系统作为结构,读者书目检索请求被发送到Drupal,该软件再向图书馆集成管理系统发送相应的请求,然后Drupal对管理系统的回应进行处理后得到题名、作者、主题、借阅信息等关键字段,并将这些信息与存储在Drupal中的其他信息,诸如评级、标签、评论、封面等组合在一起,生成一个新网页并发送到读者的浏览器。
2.2.2Fish4Info
Fish4Info[8]的使用对象主要是中小学图书馆,由纽约州GeneseeValleyBOCES地区学校图书馆系统的人员开发并在当地的学校图书馆系统内得到广泛使用。
该系统同SOPAC一样也应用Drupal作为主要开发工具,独具一格的是软件主创人员认为传统意义上的OPAC是将读者指向MARC记录的通道,重点关注的对象是资源,只有那些真正想找图书的人才会耐着性子查询目录。
而Fish4Info则将重点放在读者身上,为他们提供更为丰富的资源发现体验,而不是以前那种令人沮丧的无果而终的检索。
这里的书评、读者社交空间以及图书馆门户网站是作为目的地而不是通道的特征令人耳目一新。
FISH目前已经在Drupal名下开源发布。
2.3完全替代型
这种OPAC更新产品完全取代以前的OPAC而独立运行。
与OPAC外观更新不同之处在于,此时系统不是从现有的OPAC那里实时取得数据,而直接从ILMS抽取数据。
有时候这些替代型OPAC依然要依赖底层的原有OPAC产生所需要的馆藏状态信息,比如图书外借或者到期信息等。
由于存在巨大的市场需求,很多图书馆集成系统供应商也瞄准这一市场,比如InnovativeInterfaces推出的Encore,ExLibris公司推出的Primo,MedialabSolutions推出的Aquabrowser等[9]。
但是开源的OPAC赋予图书馆员更大的自主权,既可以提高检索性能,也可以在系统中纳入其他类型的资源,同时强化检索界面的社会性功能,所以受到开发人员的追捧,成为开源软件的高产地带。
在此对一些已经得到实际应用的OPAC替代型开源软件给以简单的介绍。
2.3.1 Endeca应用
最初构思OPAC前端独立于ILMS并付诸实施的是北卡州立大学图书馆的工作人员,他们早在2006年1月就推出了EndecaOPAC的实际应用。
这个系统以商业性软件Endeca作为关键词检索的搜索引擎,检索界面则由图书馆工作人员以Java开发而成,负责向Endeca的后端HTTP服务——MDEX引擎发送请求,并显示返回的检索结果。
该OPAC能够应用到不同的图书馆集成管理系统中,开创了OPAC与ILMS分离应用的先例,并且首次推出了检索结果相关性排序、关键词检索之外的多途径浏览帮助。
根据其开发主创AndrewPace[10]的说法,EndecaIAP是第一个真正具有下一代OPAC特征的图书馆目录系统。
不管这种说法是否属实,Endeca应用的确启发了后来多种开源OPAC的开发应用,为OPAC的创新发展提供了灵感,自此以后,他们的OPAC模式基本奠定了新一代OPAC的基本结构,分面组配浏览帮助几乎成为所有开源OPAC的开发重点。
从这一点来看,其功不可没。
2.2.2 Scriblio(原名为WPopac)
Scriblio[11]是普利茅斯州立大学图书馆开发实现的一个开源OPAC项目,基于博客软件WordPress开发而成,曾获2006年梅隆奖。
WordPress内嵌的功能如永久链接、评论、追溯、垃圾评论筛选等功能是开发者选用时所看重的因素。
另外,Scriblio保留了WordPress丰富的APT应用和主题结构,因此拥有该博客平台所有用户以及软件设计人员、开发人员和管理人员的参与和支持。
这正是使用流行的开源软件作为OPAC前端基础结构的好处之一,可以获取丰富的社区知识。
Scriblio可以提供分面组配检索、浏览、标签等功能,并将这些结果同步发送到PlymouthStateUniversity使用的MillenniumWebOPAC。
2.3.2 Vufind
VuFind[12]是VillanovaUniversity图书馆的工作人员为本馆设计开发的资源门户,获2008年梅隆奖。
早在2008年8月该馆正式应用该软件以前,已经有包括澳大利亚国家图书馆在内的两家图书馆率先采用VuFind作为其新一代OPAC,目前VuFind是图书馆界应用较多的开源OPAC之一。
VuFind完全实现了模块化运行,可以只实施基本系统,也可采用所有组件。
检索资源包括书目记录、数字图书馆条目、机构存储、机构书目和其他图书馆的收藏。
VuFind采用Lucene/Solr作为其主要检索引擎,利用Yahoo!
UserInterfaceLibrary设计检索前端,这种Lucene/Solr组合在开源OPAC设计中比较受到青睐,诸如Blacklight等都适用这种模式,甚至一些商业性厂商的产品也采用这种组合,比如ExLibris公司的Primo。
2.3.3 Blacklight
2006年弗吉尼亚大学图书馆人员受到Endeca的启发,开始开发名为Blacklight的OPAC前端开源软件,该软件独立于该馆现有的ILMS系统,于2008年10月推出使用。
采用ApacheSolr做数据索引和搜索引擎,应用RubyonRails作为前端开发软件[13]。
从检索效率和数据容量来看,Solr的索引功能并不比ILMS差,从与其他系统的交互性来看甚至略胜一筹,而且在索引和检索方面具有很好的灵活性。
Solr可以为多种数据格式提供索引、检索及分面浏览的功能,从而将更大范围的资源纳入索引系统中,无须为那些非印本图书资源费神编制MARC数据。
同时,RubyonRails赋予馆员对检索界面极大的配置灵活性,可以保证检索前端不同类型资源的应用完全分离,馆员对某种资源检索配置的修改不会影响其他资源的检索行为及索引过程或者基本的数据模式。
这种灵活性在当前的信息环境下显得格外重要,因为OPAC中各种资源的检索设置常会根据网络环境及读者需求做各种修订。
2.3.4 Fac-Back-OPAC
该软件采用Solr,marc4j和Django等开源软件来实现其功能,最初由LaurentianUniversity图书馆的系统馆员DanScott发起,后来吸引了来自PaulSmithcollege图书馆的系统馆员MikeBeccaria共同完成,目前已经在这两家图书馆得到实现[14]。
采用Solr和Django组合作为软件的基础结构,其中Solr用于提供搜索引擎功能,marc4j用于将MARC数据格式转化为Solr可识别的UTF-8格式,Django用于提供用户检索界面。
该软件目前还没有提供社会性功能,希望通过开源合作的方式得到进一步加强。
2.3.5 Libraryfind
由俄勒冈州立大学图书馆研制并发布[15],基于RubyOnRails实现检索界面,与众不同之处在于其内置的OpenURLresolver可以允许读者直接点击检索结果而得到电子期刊的全文,经过两次点击就可实现从发现到得到的全部工作流程。
此外,该软件可以对本地馆藏做索引,实现基于网络的管理,具有三层缓冲系统来改进检索速度,也可以实现读者订制的检索界面,目前在俄勒冈州立大学已经得到应用。
2.3.6 SOPAC2
SOPAC2是SOPAC的程序主创人员离开AADL以后在Darian公共图书馆推出的新版,软件分为三个模块,其中SOPAC提供可定制的用户界面,Locum提供与ILS的联结,Insurge提供独立的标签、评级、评论等社会性功能[16]。
SOPAC2不再只是给OPAC换上一个新的外壳,而是可以独立于ILMS进行索引,具有模块化、可移植代码等特性,并且拥有自己的商标TheSocialOPAC(TM)。
2.3.8 Extensiblecatalog(XC)
XC项目由罗切斯特大学图书馆负责开发[17],受到梅隆基金资助,产品开发规划比较周密,邀请了一些在图书馆开源软件方面颇有造诣的机构和人员作为用户研究和开发合作伙伴,期望从每一个合作机构那里得到有力支持,共同实现一个与当前任何ILS系统有机整合的新一代开源OPAC。
XC软件使用Java和PHP这两种语言开发。
为了充分体现开源精神,XC软件应用很多开源软件作为开发基础,比如Solr、Lucene、MySQL和JOAT。
该产品同样以开源软件Drupal作为内容管理框架,预期于2009年7月推出使用。
2.4 ILMS更新
通过更换整个图书馆集成管理系统来提升读者服务,目前北美地区公共图书馆界比较成功的开源ILMS中最具代表性、市场渗入率较高的是Evergreen和Koha[18]。
它们提供的OPAC基本具有新一代OPAC前端的功能,能够实现关键词检索、分面组配浏览功能,同时添加社会性元素。
弱点在于以管理印本图书为主,对于电子资源在OPAC中的揭示则明显不足。
目前这两个开源ILMS都应用于公共图书馆联盟,较大规模的学术型图书馆还没有整体采用开源ILMS解决方案的先例。
另外一个比较引人关注的ILMS项目是由杜克大学图书馆牵头建设、受到梅隆基金资助的开放图书馆环境项目(OLE)[19]。
该项目旨在探讨新一代图书馆集成管理系统的发展模式,并就大家共同关心的话题开展讨论以引导开源软件或者系统供应商共同努力,为提高图书馆服务水平作出贡献。
目前该项目已经开始正常运转,有兴趣的读者可以前往其项目主页及时了解有关动态。
3开源OPAC未来发展
3.1现有开源OPAC的不足之处
目前的新一代OPAC在提高检索效率方面做出了很大的努力,基本能够为读者提供友好的检索界面,尽量帮助读者发掘馆藏藏书资源。
从增强图书馆社会性角度来看,新一代OPAC增加了许多来自图书馆以外的社会网络的相关内容以增强读者的资源发现体验,并为读者提供了交流互动的平台。
但是这些开源OPAC在资源收录定位和如何走出去贴近读者这两方面则没有实现太大的突破。
从资源收录范围来看,当前的OPAC应当将图书馆元数据、用户贡献的内容以及馆藏全文网络资源有机结合起来以统一的检索界面呈现给读者,但是开源OPAC在这方面明显不足,目前依然以纸质馆藏作为主要揭示对象。
此外,免费网络资源是否也应当由图书馆资源发现体系来负责搜索?
这个棘手的问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新一代 OPAC 软件 兴起 未来 发展
![提示](https://static.bingdoc.com/images/bang_tan.gif)