浅析分布式数据库.doc
- 文档编号:2135034
- 上传时间:2023-05-02
- 格式:DOC
- 页数:19
- 大小:55.50KB
浅析分布式数据库.doc
《浅析分布式数据库.doc》由会员分享,可在线阅读,更多相关《浅析分布式数据库.doc(19页珍藏版)》请在冰点文库上搜索。
分布式数据库系统
指导老师:
施汉琴
学校:
淮北师范大学
班级:
10网络工程
学号:
20101204015
姓名:
冯燕艳
日期:
2013年6月15日
浅析分布式数据库
目录
目录 2
引言 4
分布式数据库系统概述 5
1、分布式数据库系统的定义 5
2、分布式数据库的特性 5
3、分布式数据库系统的优点 6
4、分布数数据库系统存在的问题 6
5、几种典型分布式数据库原型系统 7
分布式数据库技术发展现状 8
1、分布式数据库技术国外发展现状 8
2、分布式数据库技术国内发展现状 9
分布式数据库应用设计三个列子 10
1、分布式数据库在学生信息管理系统中的应用 10
2、分布式数据库在物流系统中的应用 10
3、分布式数据库系统在企业信息系统中的应用 13
分布式数据库系统安全分析 14
1、概念 14
2、分布式数据库安全需求分析 14
3、分布式数据库安全策略 15
分布式数据库发展趋势 17
1、分布式并发控制 17
2、P2P数据管理系统 18
3、Web数据库集成系统 18
小结 18
参考书籍 19
引言随着信息技术的飞速发展,社会经济结构、生产方式和消费结构已经发生了重大变化,这些变化深刻地影响着人民生活的方方面面。
尤其是近十年来人们对计算机的依赖性越来越强,同时也对计算机提出了更高的要求。
随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求,数据量也急剧增加,对于管理这些数据的复杂度也随之增加。
同时各行业部门或企业所使用的软硬件之间的差异,这给开发企业管理数据库管理软件带来了巨大的工作量,如果能够有效解决这个问题,即使用同一模块管理操作不同的数据表格,对不同的数据表格进行查询、插入、删除、修改等操作,也即对企业简单的应用实现即插即用的功能,那么就能大大地减少软件开发的维护和更新费用,缩短软件的开发周期。
分布式数据库系统的开发,降低了企业开发的成本,提高了软件使用的回报率。
当今社会已进入了信息时代,人们将越来越多的信息存储在网络中的计算机上。
如何更有效地存储、管理、共享和提取信息,越来越引起人们的关注。
集中式数据库已经不能满足人们的需求,因此分布式数据库系统应运而生,并且得到迅速发展。
分布式数据库系统的出现,有效地利用企业现有资源和网络资源。
分布式数据库系统是一个面向地理上分布而在管理上需要不同程度集中的处理系统,主要解决在计算机网络上如何进行数据的分布和处理。
由于分布式数据库有许多突出的优点,因此,分布式数据库系统可以广泛地应用于大企业,多种行业及军事国防等领域,这对建立集约型社会,加快社会主义现代化建设,将具有重要的现实意义。
本文主要对分布式数据库进行了简要介绍,分析其研究现状及安全方面的问题,并结合三个列子进一步研究分布式数据库的应用设计,最后探讨了分布式数据库的发展趋势。
分布式数据库系统概述
1、分布式数据库系统的定义
分布式数据库是地理上分散而逻辑上集中的数据库系统,具体来说是由一组数据组成的,这组数据分布在计算机网络的不同计算机上。
网络中的每个结点具有独立处理的能力,称为场地自治(Autonomous)。
它可以执行局部的应用程序。
同时,每个结点也能通过网络通信子系统执行全局的应用。
这就是说,每个场地是独立的数据库系统:
它有自己的数据库、一组终端、中央处理器、运行它自己的局部DBMS,执行局部的应用程序,具有高度的自治性。
同时又相互协作组成一个整体,这种整体性的含义是,对于用户来说,从一个分布式数据库系统的逻辑上看如同一个集中式数据库系统一样,用户可以在任何一个场地执行全局应用。
2、分布式数据库的特性
分布式数据库具有数据透明性和场地自治性。
(1)数据透明性,具体体现为分布透明性、分片透明性、复制透明性。
(2)场地自治性,具体体现为设计自治性、通信自治性、执行自治性。
3、分布式数据库系统的优点
(1)适合分布式数据管理,能够有效提高系统性能。
分布式数据库系统的结构更适合具有地理分布特性的组织或机构使用,允许分布在不同区域、不同级别的各个部门对其自身的数据实行局部控制。
(2)系统经济性和灵活性好。
与一个大型计算机支持一个大型的冀中是数据库在加一些进程和远程终端相比,由超级微型计算机或超级小型计算机支持的分布式数据库系统往往具有更高的性价比和实施灵活性。
集中式数据库系统强调的是集中式控制,而DDBS更多地强调各个场地局部DBMS的自治性,大部分的局部事务管理和控制就地解决,只有涉及其它场地数据时才通过网络作为全局事务处理。
DDBMS可以设计成不同程度的自治性,从具有充分的场地自治性到几乎完全的集中式控制。
(3)系统经可靠性高和可用性强。
由于存在冗余数据,个别场地或个别链路的故障不会导致整个系统的崩溃。
同时,系统可自动检测故障所在,并利用冗余数据恢复出故障的场地,这种检测和修复是在联机状态下完成的。
4、分布数数据库系统存在的问题
(1)系统设计复杂。
分布式数据库的分片设计和分配设计依赖于系统的应用需求,并且影响系统性能、响应速度及可能性的。
分布式数据库的查询处理优化、事务管理、故障恢复和并发控制,以及元数据管理等,都需要分布式处理。
(2)系统处理和维护复杂。
一般来说,在分布时数据库中存取数据,与集中式数据库系统相比,DDBS更复杂,为保证各场地之间的协调必须做很多额外的工作。
(3)数据的安全性和保密性较难控制。
在具有高度场地自治的分布时数据库中,不同场地的局部数据库管理员可以采用不同的安全措施,但是无法保证全局数据都是安全的。
安全性问题是分布式系统固有的问题。
因为分布式系统是通过通信网络来实现分布控制的,而通信网络本身却在保护数据的安全性和保密性方面存在弱点,数据很容易被窃取。
5、几种典型分布式数据库原型系统
(1)SDD-1DDBMS
美国计算机公司(ComputerCorporationofAmerica)研制的SDD-1项目是第一个分布式数据库管理系统的样机。
各地点由ARPANET连接,并采用叫做数据计算机的当前DBMS。
这个项目特别有助于理解分布式数据库的重要问题和对其中某些问题的解决方法。
(2)ENCOMPASS
ENCOMPASS是一种同构型分布式数据库管理系统,它是根据Tandem公司的NonStop计算机体系结构和GUARDIANOS建立起来的。
计算机的体系结构和OS两者都具有对实现分布式数据库管理系统极其有用的特性。
Tandem公司的计算机的最好的特性在于它是由几个(至
少两个)独立CPU组成,这些独立的CPU利用高吞吐量总线连接起来,共享对磁盘驱动器的访问。
因为Tandem公司的计算机的基本体系结构是分布式的,所以Guardian操作系统能在由不同CPU执行的各进程之间提供方便的通信。
各进程之间的所有通信都通过信息进行。
信息系统可使硬件各单元的分布对进程是透明的。
(3)IBMSystemR*
R*系统是在美国CA州的IBMSanJoseResearchLaboratory开发的。
它的目的是建立协同操作,却是独立的地点构成的分布式数据库系统。
每个地点支持一个关系数据库系统。
R*是R系统向分布式环境的自然扩展。
分布式数据库技术发展现状
1、分布式数据库技术国外发展现状
分布式数据库系统(DistributedDatabasesystem,简称DDBS)已有20多年的发展历史,经历了一个从产生到发展的过程,取得了长足的进步,许多技术问题被提出并得到了解决。
20世纪90年代起,DDBS己进入商品化应用阶段,当前,分布式数据库技术已经成熟并得到广泛应用。
一些数据库厂商在不断推出和改进自己的分布式数据库产品,以适应多种需要和扩大市场的占有份额。
但是,实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合,而是在这两种技术相互渗透和有机融合后的技术升华,它又产生了很多新的技术。
而且,分布式数据库系统虽然基于集中式数据库系统,但分布式数据库系统却有它自己的特色和理论基础。
由于数据的分布环境形成了很大的固有的技术难度,使得分布式数据库系统的应用被推迟。
至今完全遵循分布式数据库系统规则,特别是实现完全分布透明性的商用系统还很难见到。
对分布数据管理的研究有两个方面:
一是单项的研究。
比如数据的分布问题,通信问题等。
在研究一个问题时,假定其它因素是不变的,得出研究成果。
此处还要研究的是要将各种因素综合起来,研究它们的相互作用和结果。
数据库设计和更新同步之间就有密切的联系,对于更新要求,依据不同的更新同步方案,对通信系统的要求也随着不同。
因此,就要对这些因素综合地考虑。
二是对计算机网络的研究。
计算机网络技术的迅速发展,已经很大程度地影响到了数据库和分布数据库的领域。
不管是在远程网络还是局域网领域,都发生了很多的变比。
局域网和远程网之间的处理差别,必然会导致处理数据库和分布数据库问题的显然不同的一些原则和方法。
分布式数据库系统已经成为信息处理学科的重要领域,正在迅速发展之中。
2、分布式数据库技术国内发展现状
我国对分布式数据库系统的研究约在20世纪80年代初期开始,一些科研单位和高校先后建立和实现了几个各具特色的分布式数据库系统。
如由中国科学院数学研究所设计,由该所与上海科学技术大学、华东师范大学合作实现的C.POREL,武汉大学研制的WDDBS和WOODDBS,东北大学研制的DMD/FO系统等,尤其值得一提的是华中科技大学达梦数据库多媒体研究所开发的DMZ多媒体数据库,它解决了异构数据库系统实现数据的共享和透明访问的难度。
他们的工作对我国分布式数据库技术的理论研究和应用开发起到了积极的推动作用。
分布式数据库应用设计三个列子
1、分布式数据库在学生信息管理系统中的应用
(1)需求分析
学校学生信息量大,不同校区间距离可能较大,各学院分布较散。
学生信息是一个整体,而各个学院只需处理学生信息的部分,所以采用分布式数据库十分合理。
(2)概念设计
一个学生可以选择多门课程,而一门课程也可以有多个学生;没门课程只有一个成绩,每个成绩也只对应一门课程。
(3)逻辑设计
数据模型包括学生数据、成绩数据、课程数据。
① 学生数据:
学生编号,学生姓名,学生生日,学生性别,民族,家庭住址,电话,政治面貌,简介
② 成绩数据:
学期编号,课程名称,分数
③ 课程数据:
课程名称,分数,授课老师
(4)分布设计
学校行政管理部门储存全部学生信息,各学院各自存储自己学院学生,即采用水平分片方式、非冗余设计。
2、分布式数据库在物流系统中的应用
(1)需求分析
物流企业规模大,呈现国际化、全国性、仓储分布分散的特点。
每个物流企业都有若干个子公司或相互关联的部门,虽然在业务上它们独立处理各自的数据,但彼此之间数据的交换和处理显得越来越重要并日趋频繁.所以针对顾客的个性化需求和企业区域分散性的特点,将众多物流公司整合起来,实现对物流资源的有效利用是非常有必要的。
所以为达到既要保持单个公司的独立性,又要实现分布式的信息资源共享,使物流在各公司或大型公司内部、各仓储单位之间更加顺畅的目标。
采用分布式数据库系统才能实现。
(2)概念设计
由于物流企业的特点,分析设计采用全局数据模式。
一个供应商可以对应多个零售商,一个零售商也可以对应多个供应商,而供应商和配送中心既可以是同一个公司的实体,也可以是相对独立的不同公司。
为了顺畅高效率地协调零售商、供应商和配送中心三方的运作,根据系统的层次结构搭建了统一协调系统。
零售商向仓储公司发出订单请求后,仓储公司将做出相应回应,根据订单性质查找公司数据库存储的相关信息,并制定出相应的运输方案。
当该公司缺货无法满足订单要求时,可将订单发给配送中心协助调配相关货源。
(3)逻辑设计
本系统逻辑设计阶段采用全局操作模式。
数据模型包括公共数据、配送中心数据、仓储公司数据和零售商数据
① 公共数据:
货物名称,货物数量,生产商,
② 配送中心数据:
配送单位,配送货物信息,配送路线
③ 仓储公司数据:
存货量,发送清单,
④ 零售商数据:
订购商品数量,货物名称,规格,期限
(4)分片设计
在本系统中采用了混合分片的设计。
根据不同的数据关系采用不同的分片方式:
① 在总公司与分公司和公司与各个部门的数据关系中,由于部门业务的数据是公司业务数据的子集,本系统采用了水平分片的方式,通过并运算实现关系的重构。
② 在总数据库的数据关系中,数据是按照其业务流程来划分的,所以这里采用了垂直分片的方式。
(5)非冗余设计
在有些情况下,根据选定的划分准则,很容易得出非冗余分配,例如在这次为物流设计的分布式数据库中,各个部门(功能模块)只存放本部门的数据,数据管理和分析功能是由总公司的数据库服务器来实现的,各个部门只需将更新的数据发送到总公司的数据库即可。
(6)局部模式重新构造
上层统一协调系统用于各个公司之间或仓储单位之间的管理与协调,可以允许零售商、供应商和配送中心弹性地加入或退出,最终目的是要产生出满足订单的最佳配送方案,节约成本。
统一协调的基础是一致的数据模型和传输协议。
下层的手持设备是信息感知部分,Internet通信功能的加入更有利于与上层系统的集成与交流。
系统既具有对各个公司或子公司进行统一管理协调的能力,又具有对货物进行信息采集跟踪的能力。
统一协调子系统是在各个公司内部原有系统实现自治的基础上进行分布式信息协作的系统,平台由统一的数据模型对货物进行描述。
信息采集子系统是记载着货物的供应商,当前所在位置、目的地以及最后期限等各种属性,便于到货时校验。
3、分布式数据库系统在企业信息系统中的应用
(1)需求分析
使用数据库的单位在组织上常常是分布的(如分为部门、科室、车间等等),在地理上也是分布的。
分布式数据库系统的结构符合部门分布的组织结构,允许各个部门对自己常用的数据存储在本地,在本地录入、查询、维护,实行局部控制。
由于计算机资源靠近用户,因而可以降低通信代价,提高响应速度,使这些部门使用数据库更方便更经济。
当在一个大企业或大部门中已建成了若干个数据库之后,为了利用相互的资源,为了开发全局应用,就要研制分布式数据库系统。
这种情况可称为自底向上的建立分布式系统。
这种方法虽然也要对各现存的局部数据库系统做某些改动、重构,但比起把这些数据库集中起来重建一个集中式数据库,则无论从经济上还是从组织上考虑,分布式数据库均是较好的选择。
其他个点可是和例二设计相似,不再详细分析。
分布式数据库系统安全分析
1、概念
分布式数据库系统的安全指的是整个分布式数据库系统内的数据保持完整、一致,不会被泄露和更改,能够有效防止外界对数据库的侵入和破坏。
分布式数据库系统由于其物理分布不集中,分布控制只能通过网络实现,这给系统的安全保密性带来很大的风险。
由于物理分布,各个节点数据库要有不同的人员来管理,由于安全意识高低和安防措施的不同,整个系统的数据安全得不到安全保证;而各节点间实现互动的网络更是信息安全的薄弱环节。
2、分布式数据库安全需求分析
在开发分布式数据库系统的过程中,保证数据库中数据的安全是一项非常重要的工作。
试想一下,如果没有充分的安全性控制机制,那么任何无管理权限的人员都可以访问数据库,也都可以查询或更改其数据,则数据库必然遭到破坏,甚至可能造成整个系统的瘫痪。
因此,一个好的分布式数据库必须能确保系统数据的完整性、有效性和安全性,防止未授权用户对其访问,跟踪用户对其访问的情况,控制授权用户仅能对自己所拥有权限的子系统和数据进行访问,使系统免于因各种破坏而造成数据丢失和偷窃,这也是分布式数据库系统安全管理必须要解决的问题。
一般情况下,分布式数据库面临三大类安全问题:
一是要保障数据库数据的可靠性、完整性,预防和减少因为软、硬件系统误差所造成的数据库恶性破坏,针对由单站点故障、网络故障等自然因素引起的问题,可以考虑利用网络安全性来提供安全防护。
二是来自于本机或网络上的人为攻击,例如黑客的攻击。
三是数据库管理系统自身的安全脆弱性,现阶段系统的安全与操作系统的安全是相互配套的,由于数据库管理系统所存在的操作系统的结构多种多样,一个可以打补丁和可渗透的操作系统是难以从根本上解决安全问题的,因此,数据库管理系统也是脆弱的。
3、分布式数据库安全策略
(1)站点间的身份验证。
分布式数据库系统各个站点之间相互访问要建立双向身份验证机制。
分布式数据库系统各个站点位置往往比较分散,通常无法确认登录分站点的用户身份是否符合权限,为防止假冒登录,有必要在客户端和数据库服务器之间进行双向身份验证。
此外,为了完成各种分布式事务处理及数据处理等的功能,不同的站点间也要取得相应的密钥,在执行具体操作时,系统根据授权,完成身份验证,保证数据库操作的安全性。
(2)保密性安全策略。
经过上述的身份验证成功后,确认授权合法,分站点之间才可以进行数据互动。
在数据传输过程中,为了保证数据信息的保密性,最好对传输数据进行加密。
具体做法通常是采用信息加密的方式来防止黑客攻击或者采用实时入侵检测等,加强站点间的安全监测,在通信双方之间建立安全通道。
(3)访问控制。
在分布式数据库系统中,为了保证数据库操作系统的安全性,还有一项非常重要的条件,即对用户访问权限的认证。
每当有分站点连接数据库服务器时,都要事先输入系统管理员分配的授权指令。
要严格限制分站点登录用户操作权限,规范其对数据库对象的访问方式和访问范围。
跟踪监控登录用户的操作痕迹,包括能对该数据库做什么样的操作和管理,或可访问哪部分的数据库等。
一般来说,合法用户的访问控制一般就两种形式:
独立授权访问控制和强制访问授权控制。
除此以外的访问用户极有可能是非法入侵者。
合法用户的访问控制方式中,独立授权访问控制是由系统管理员设置访问控制表,为用户提供对数据对象具有的操作权限,这是最为常见的访问控制;而强制访问授权控制相对来说比较复杂,系统管理员往往无法进行有效控制,其过程首先是先给系统内的合法用户和数据对象授予较高的安全级别,然后根据用户、数据对象之间的安全级别对应关系,安全系统自动限定登录用户的具体操作权限。
(4)数据库加密策略。
数据库存储和管理着大量的有用信息和关键数据,在信息化社会是重要的社会管理工具,因此,数据库也成为很多不法分子攻击的对象。
为了保护数据库文件安全完整,避免黑客非法篡改、盗窃、破坏数据信息,我们有必要对数据库中的信息进行加密处理。
(5)安全审核。
为了明确安全威胁来源,有针对性建立数据库安防体系,数据库管理系统应建立起明确的用户权限安全性审核体制。
在用户登录期间,如果出现了分布式数据库系统的可能非法入侵行为,那么就应该执行数据库的安全审核。
除此之外,还应该加强对分布式数据库管理人员的审核,目前的互联网环境中,大量的经恶意代码而产生的安全问题越来越多,而这些恶意的代码的传播,不能完全归责于所谓黑客行为,有很大一部分是由数据库程序的编制人员或内部的管理人员加到数据库系统中去的,有鉴于此,加强内部工作人员的道德教育是很有必要的。
(6)故障恢复。
综合上文所述各种安全策略,数据库系统安全看似已经非常完善了,事实并非如此。
在分布式数据库系统中,由于计算机故障或操作失误以及人为的破坏,数据库安全问题仍会层出不穷,更有甚者甚至会导致数据库中现有的信息全部或部分遭到破坏。
在严峻的数据信息安全威胁下,分布式数据库的两段提交协议就是一种很好的用于故障恢复的方法,对任何故障均有一定的恢复能力,当然其前提是在系统运行日志不丢失的情况下。
分布式数据库发展趋势
分布式数据库在未来的发展,将主要体现在以下三方面:
1、分布式并发控制
并发控制是事务管理的基本任务之一,它的主要目的是保证分布式数据库中数据的一致性。
当分布式事务并发执行是,并发控制既要实现分布式事务的可串行性,又要保持事务具有良好的并发度,尤其是两段封锁协议。
我们知道,多个事务并发执行,就可能产生操作冲突,如出现丢失修改或重复读错误或读取了脏数据等。
对此分布式数据库提出了基于锁的并发控制方法、基于时间戳的并发控制算法和乐观的并发控制算法。
2、P2P数据管理系统
目前,基于P2P技术的应用是互联网上最为活跃的一个部分。
P2P网络是一个典型的分布式环境,在实际的大规模P2P网络中,必须把灵活支持语义异构和具有高可扩展性紧密地结合起来,并且应至少提供关系完备的查询处理能力,这是一个尚未解决的研究问题,为此可以从以下几个方面进行工作:
(1)数据/模式映射的方法及映射关系的管理方法;
(2)高可扩展性语义索引构造和维护方法;
(3)查询处理和查询优化。
3、Web数据库集成系统
Internet是世界上规模最大、用户最多、影响最广的一个全球化的、开放性的互联网络,它蕴藏着丰富的信息资源,为人们工作、生活带来了许多便利。
随着Web的发展,Web上的信息呈爆炸式增长,又由于Web数据库集成系统是面向查询的服务系统,所以资源查询子系统中各组成模块和传统的分布式数据库系统还有差异。
小结
分布式数据库发展到今天,虽然有许多不完善的地方,但仍在许多场合得到了广泛的应用。
由于新应用(如办公自动化系统、计算机集成制造系统)的出现和计算机技术(如并行多处理机、超高速网络)的发展,促进了分布式数据库系统向更广阔的领域迈进。
另外,面向对象技术研究地深入、人工智能、专家系统地进一步成熟,迫切需要分布式数据库进一步发展。
参考书籍
(1)《分布式数据库原理与应用》申德荣、于戈等著机械工程出版社出版
(2)网上相关分布式数据库资料
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浅析 分布式 数据库
![提示](https://static.bingdoc.com/images/bang_tan.gif)