数据库系统概论-王珊-5版PPT第1章.ppt
- 文档编号:18693198
- 上传时间:2023-09-15
- 格式:PPT
- 页数:143
- 大小:1.11MB
数据库系统概论-王珊-5版PPT第1章.ppt
《数据库系统概论-王珊-5版PPT第1章.ppt》由会员分享,可在线阅读,更多相关《数据库系统概论-王珊-5版PPT第1章.ppt(143页珍藏版)》请在冰点文库上搜索。
,数据库系统概论AnIntroductiontoDatabaseSystem,中国人民大学信息学院,SchoolofInformation,RenminUniversityofChina2014,教材及参考书
(1),教材王珊,萨师煊.数据库系统概论(第5版).北京:
高等教育出版社,2014.9AFirstCourseinDatabaseSystemsJeffrey.D.Ullman,JenniferWidomDept.OfComputerScienceStanfordUniversity,教材及参考书
(2),参考书C.J.Date,AnIntroductiontoDatabaseSystem(Ed.8),Addison-Wesley,2003上机软件KingBaseES系统可以从北京人大金仓信息技术股份有限公司的网站http:
/,学习方式,听课(启发式、讨论式)读书(预习、复习)报告(综合练习),考试成绩,平时成绩(书面作业、上机练习、综合练习)期中考试期末考试,内容安排
(1),基础篇第1章绪论第2章关系数据库第3章关系数据库标准语言SQL第4章数据库安全性第5章数据库完整性设计与应用开发篇第6章关系数据理论第7章数据库设计第8章数据库编程,内容安排
(2),系统篇第9章关系查询处理和查询优化第10章数据库恢复技术第11章并发控制*第12章数据库管理系统第1至第11章是本科专业的基本教程(书中有*号的部分除外)第12至第16章是新技术篇(本科生、研究生选读),数据库系统概论第一章绪论,第一章绪论,1.1数据库系统概述1.2数据模型1.3数据库系统的结构1.4数据库系统的组成1.5小结,数据库的地位,数据库技术产生于六十年代末,是数据管理的有效技术,是计算机科学的重要分支。
数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透。
数据库已经成为每个人生活中不可缺少的部分。
1.1数据库系统概述,1.1.1数据库的4个基本概念1.1.2数据管理技术的产生和发展1.1.3数据库系统的特点,1.1.1数据库的4个基本概念,数据(Data)数据库(Database)数据库管理系统(DBMS)数据库系统(DBS),1.数据,数据(Data)是数据库中存储的基本对象数据的定义描述事物的符号记录数据的种类数字、文字、图形、图像、音频、视频、学生的档案记录等,数据举例,数据的含义称为数据的语义,数据与其语义是不可分的。
例如93是一个数据语义1:
学生某门课的成绩语义2:
某人的体重语义3:
计算机系2013级学生人数语义4:
请同学给出,数据举例,学生档案中的学生记录(李明,男,199505,江苏南京市,计算机系,2013)语义:
学生姓名、性别、出生年月、出生地、所在院系、入学时间解释:
李明是个大学生,1995年5月出生,江苏南京市人,2013年考入计算机系,2.数据库,数据库的定义数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库的基本特征数据按一定的数据模型组织、描述和储存可为各种用户共享冗余度较小数据独立性较高易扩展,3.数据库管理系统,什么是数据库管理系统位于用户与操作系统之间的一层数据管理软件是基础软件,是一个大型复杂的软件系统数据库管理系统的用途科学地组织和存储数据、高效地获取和维护数据,硬件平台,基础软件平台,软件基础构架平台,应用软件平台,软件产品,协同软件办公软件,数据库系统操作系统,中间件应用服务器,数据库在计算机系统中的位置,数据库管理系统的主要功能,数据定义功能提供数据定义语言(DDL)定义数据库中的数据对象数据组织、存储和管理分类组织、存储和管理各种数据确定组织数据的文件结构和存取方式实现数据之间的联系提供多种存取方法提高存取效率,数据库管理系统的主要功能,数据操纵功能提供数据操纵语言(DML)实现对数据库的基本操作(查询、插入、删除和修改)数据库的事务管理和运行管理数据库在建立、运行和维护时由数据库管理系统统一管理和控制保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复,数据库管理系统的主要功能,数据库的建立和维护功能数据库初始数据的装载和转换数据库转储、恢复功能数据库的重组织性能监视、分析等其它功能数据库管理系统与网络中其它软件系统的通信数据库管理系统系统之间的数据转换异构数据库之间的互访和互操作,4.数据库系统,数据库系统(DatabaseSystem,简称DBS)数据库系统的构成数据库数据库管理系统(及其应用开发工具)应用程序数据库管理员,数据库,应用系统,应用开发工具,操作系统,数据库管理系统,数据库管理员,用户,用户,用户,数据库系统,1.1数据库系统概述,1.1.1四个基本概念1.1.2数据管理技术的产生和发展1.1.3数据库系统的特点,数据管理技术的产生和发展,什么是数据管理对数据进行分类、组织、编码、存储、检索和维护数据处理的中心问题数据管理技术的发展过程人工管理阶段(20世纪50年代中之前)文件系统阶段(20世纪50年代末-60年代中)数据库系统阶段(20世纪60年代末-现在),数据管理技术的产生和发展(续),数据管理技术的发展动力应用需求的推动计算机硬件的发展计算机软件的发展,1.人工管理阶段,时期20世纪50年代中之前产生的背景应用背景科学计算硬件背景无直接存取存储设备软件背景没有操作系统处理方式批处理,人工管理阶段(续),特点数据的管理者:
用户(程序员),数据不保存数据面向的对象:
某一应用程序数据的共享程度:
无共享、冗余度极大数据的独立性:
不独立,完全依赖于程序数据的结构化:
无结构数据控制能力:
应用程序自己控制,应用程序与数据的对应关系(人工管理阶段),人工管理阶段应用程序与数据之间的对应关系,2.文件系统阶段,时期20世纪50年代末-60年代中产生的背景应用背景科学计算、数据管理硬件背景磁盘、磁鼓软件背景有文件系统处理方式联机实时处理、批处理,文件系统阶段(续),特点数据的管理者:
文件系统,数据可长期保存数据面向的对象:
某一应用数据的共享程度:
共享性差、冗余度大数据的结构化:
记录内有结构,整体无结构数据的独立性:
独立性差数据控制能力:
应用程序自己控制,应用程序与数据的对应关系(文件系统阶段),文件系统阶段应用程序与数据之间的对应关系,3.数据库系统阶段,时期20世纪60年代末以来产生的背景应用背景大规模数据管理硬件背景大容量磁盘、磁盘阵列软件背景有数据库管理系统处理方式联机实时处理,分布处理,批处理文件系统到数据库系统,标志着数据管理技术的飞跃,1.1数据库系统概述,1.1.1四个基本概念1.1.2数据管理技术的产生和发展1.1.3数据库系统的特点,一个例子,学生的信息包括学号、姓名、性别、年龄、专业和奖励用文件系统实现学籍管理数据存储定长记录存储在“学生基本信息”文件中变长记录存放在另一个”奖励”文件“学生基本信息”表中的位置和长度描述“奖励”文件中记录的开始位置和长度查询数据编写应用程序,实现数据的录入和查找缺点:
程序员必须关注记录结构和不同文件中记录之间的联系,工作量大,编程复杂,开发速度慢,一个例子(续),“奖励”文件的结构和内容,“学生基本信息”文件的结构和内容,一个例子(续),数据库系统管理存储数据建立两张表:
STUDENT表-存放学生的基本信息,AWARD表-存放学生的奖励情况使用两条插入命令完成学生基本信息和奖励情况的数据录入功能查询功能可以用一条查询语句实现,1.1.3数据库系统的特点,数据结构化数据的共享性高,冗余度低且易扩充数据独立性高数据由数据库管理系统统一管理和控制,数据结构化,数据的整体结构化是数据库的主要特征之一整体结构化不再仅仅针对某一个应用,而是面向全组织不仅数据内部结构化,整体是结构化的,数据之间具有联系数据记录可以变长数据的最小存取单位是数据项数据的用数据模型描述,无需应用程序定义,数据的共享性高,冗余度低且易扩充,数据面向整个系统,可以被多个用户、多个应用共享使用。
数据共享的好处减少数据冗余,节约存储空间避免数据之间的不相容性与不一致性使系统易于扩充,数据独立性高,物理独立性指用户的应用程序与数据库中数据的物理存储是相互独立的。
当数据的物理存储改变了,应用程序不用改变。
逻辑独立性指用户的应用程序与数据库的逻辑结构是相互独立的。
数据的逻辑结构改变了,应用程序不用改变。
数据独立性由数据库管理系统的二级映像功能来保证。
数据由数据管理系统统一管理和控制,数据库管理系统提供的数据控制功能
(1)数据的安全性(Security)保护保护数据以防止不合法的使用造成的数据的泄密和破坏。
(2)数据的完整性(Integrity)检查保证数据的正确性、有效性和相容性。
(3)并发(Concurrency)控制对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
(4)数据库恢复(Recovery)将数据库从错误状态恢复到某一已知的正确状态。
应用程序与数据的对应关系(数据库系统阶段),数据库系统阶段应用程序与数据之间的对应关系,数据库概念小结,数据库是长期存储在计算机内有组织的大量的共享的数据集合。
可以供各种用户共享,具有最小冗余度和较高的数据独立性。
数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
第一章绪论,1.1数据库系统概述1.2数据模型1.3数据库系统的结构1.4数据库系统的组成1.5小结,1.2数据模型,数据模型是对现实世界数据特征的抽象。
通俗地讲数据模型就是现实世界的模拟。
数据模型应满足三方面要求能比较真实地模拟现实世界容易为人所理解便于在计算机上实现数据模型是数据库系统的核心和基础,1.2数据模型,1.2.1两类数据模型1.2.2概念模型1.2.3数据模型的组成要素1.2.4常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.1两类数据模型,数据模型分为两类(两个不同的层次)
(1)概念模型也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
(2)逻辑模型和物理模型逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。
按计算机系统的观点对数据建模,用于DBMS实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
两类数据模型(续),客观对象的抽象过程-两步抽象现实世界中的客观对象抽象为概念模型;将现实世界抽象为信息世界把概念模型转换为某一数据库管理系统支持的数据模型。
将信息世界转换为机器世界,两类数据模型(续),数据库管理系统支持的数据模型,概念模型,认识抽象,信息世界,机器世界,现实世界中客观对象的抽象过程,现实世界,1.2数据模型,1.2.1两大类数据模型1.2.2概念模型1.2.3数据模型的组成要素1.2.4最常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.2概念模型,概念模型的用途概念模型用于信息世界的建模是现实世界到机器世界的一个中间层次是数据库设计的有力工具数据库设计人员和用户之间进行交流的语言对概念模型的基本要求较强的语义表达能力简单、清晰、易于用户理解,1.2.2概念模型,1.信息世界中的基本概念2.概念模型的一种表示方法:
实体-联系方法,1.信息世界中的基本概念,
(1)实体(Entity)客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
(2)属性(Attribute)实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
(3)码(Key)唯一标识实体的属性集称为码。
信息世界中的基本概念(续),(4)实体型(EntityType)用实体名及其属性名集合来抽象和刻画同类实体称为实体型(5)实体集(EntitySet)同一类型实体的集合称为实体集,信息世界中的基本概念(续),(6)联系(Relationship)现实世界中事物内部以及事物之间的联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系实体之间的联系通常是指不同实体集之间的联系实体之间的联系有一对一、一对多和多对多等多种类型,实体-联系方法,实体-联系方法(Entity-RelationshipApproach)用E-R图来描述现实世界的概念模型E-R方法也称为E-R模型,1.2数据模型,1.2.1两大类数据模型1.2.2概念模型1.2.3数据模型的组成要素1.2.4最常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.3数据模型的组成要素,数据结构数据操作数据的完整性约束条件,1.数据结构,数据模型的数据结构描述数据库的组成对象,以及对象之间的联系描述的内容1.与对象的类型、内容、性质有关2.与数据之间联系有关数据结构是对系统静态特性的描述,2.数据操作,数据操作对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则数据操作的类型查询更新(包括插入、删除、修改),数据操作(续),数据模型对操作的定义操作的确切含义操作符号操作规则(如优先级)实现操作的语言数据操作是对系统动态特性的描述,3.数据的完整性约束条件,数据的完整性约束条件一组完整性规则的集合完整性规则:
给定的数据模型中数据及其联系所具有的制约和依存规则用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容,数据的完整性约束条件(续),数据模型对完整性约束条件的定义反映和规定必须遵守的基本的通用的完整性约束条件。
提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
1.2数据模型,1.2.1两大类数据模型1.2.2数据模型的组成要素1.2.3概念模型1.2.4常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.4常用的数据模型,层次模型(HierarchicalModel)网状模型(NetworkModel)关系模型(RelationalModel))面向对象数据模型(ObjectOrientedDataModel)对象关系数据模型(ObjectRelationalDataModel)半结构化数据模型(SemistrutureDataModel),1.2数据模型,1.2.1两大类数据模型1.2.2数据模型的组成要素1.2.3概念模型1.2.4常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.5层次模型,层次模型是数据库系统中最早出现的数据模型层次数据库系统的典型代表是IBM公司的IMS(InformationManagementSystem)数据库管理系统层次模型用树形结构来表示各类实体以及实体间的联系,1.层次模型的数据结构,层次模型满足下面两个条件的基本层次联系的集合为层次模型1.有且只有一个结点没有双亲结点,这个结点称为根结点2.根以外的其它结点有且只有一个双亲结点层次模型中的几个术语根结点,双亲结点,兄弟结点,叶结点,层次模型的数据结构(续),图1.9一个层次模型的示例,层次模型的数据结构(续),层次模型的特点:
结点的双亲是唯一的只能直接处理一对多的实体联系每个记录类型可以定义一个排序字段,也称为码字段任何记录值只有按其路径查看时,才能显出它的全部意义没有一个子女记录值能够脱离双亲记录值而独立存在,层次模型的数据结构(续),图1.10教员学生层次数据库模型,根结点,记录型系的子女结点记录型教员的双亲结点,叶结点,叶结点,字段,层次模型的数据结构(续),图1.11教员学生层次数据库的一个值,2.层次模型的数据操纵与完整性约束,层次模型的数据操纵查询插入删除更新,层次模型的完整性约束条件(续),层次模型的完整性约束条件无相应的双亲结点值就不能插入子女结点值如果删除双亲结点值,则相应的子女结点值也被同时删除更新操作时,应更新所有相应记录,以保证数据的一致性,3.层次模型的优缺点,优点层次模型的数据结构比较简单清晰查询效率高,性能优于关系模型,不低于网状模型层次数据模型提供了良好的完整性支持缺点结点之间的多对多联系表示不自然对插入和删除操作的限制多,应用程序的编写比较复杂查询子女结点必须通过双亲结点层次命令趋于程序化,1.2数据模型,1.2.1两大类数据模型1.2.2数据模型的组成要素1.2.3概念模型1.2.4最常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.6网状模型,网状数据库系统采用网状模型作为数据的组织方式典型代表是DBTG系统:
亦称CODASYL系统20世纪70年代由DBTG提出的一个系统方案实际系统CullinetSoftware公司的IDMSUnivac公司的DMS1100Honeywell公司的IDS/2HP公司的IMAGE,1.网状模型的数据结构,网状模型满足下面两个条件的基本层次联系的集合:
1.允许一个以上的结点无双亲;2.一个结点可以有多于一个的双亲。
网状模型的数据结构(续),表示方法(与层次数据模型相同)实体型:
用记录类型描述每个结点表示一个记录类型(实体)属性:
用字段描述每个记录类型可包含若干个字段联系:
用结点之间的连线表示记录类型(实体)之间的一对多的父子联系,网状模型的数据结构(续),网状模型与层次模型的区别网状模型允许多个结点没有双亲结点网状模型允许结点有多个双亲结点网状模型允许两个结点之间有多种联系(复合联系)网状模型可以更直接地描述现实世界层次模型实际上是网状模型的一个特例,网状模型的数据结构(续),网状模型中子女结点与双亲结点的联系可以不唯一要为每个联系命名,并指出与该联系有关的双亲记录和子女记录,R1与R3之间的联系L1,R2与R3之间的联系L2,网状模型的例子,网状模型的数据结构(续),多对多联系在网状模型中的表示用网状模型间接表示多对多联系方法:
将多对多联系直接分解成一对多联系,网状模型的数据结构(续),例如:
一个学生可以选修若干门课程,某一课程可以被多个学生选修,学生与课程之间是多对多联系引进一个学生选课的联结记录,由3个数据项组成学号课程号成绩表示某个学生选修某一门课程及其成绩,网状模型的数据结构(续),图1.13学生/选课/课程的网状数据模型,2.网状模型的操纵与完整性约束,网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束码:
唯一标识记录的数据项的集合一个联系中双亲记录与子女记录之间是一对多联系支持双亲记录和子女记录之间某些约束条件,3.网状模型的优缺点,优点能够更为直接地描述现实世界,如一个结点可以有多个双亲具有良好的性能,存取效率较高缺点结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握DDL、DML语言复杂,用户不容易使用记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节,1.2数据模型,1.2.1两大类数据模型1.2.2数据模型的组成要素1.2.3概念模型1.2.4最常用的数据模型1.2.5层次模型1.2.6网状模型1.2.7关系模型,1.2.7关系模型,关系数据库系统采用关系模型作为数据的组织方式1970年美国IBM公司SanJose研究室的研究员E.F.Codd首次提出了数据库系统的关系模型计算机厂商新推出的数据库管理系统几乎都支持关系模型,1.关系模型的数据结构,在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
学生登记表,属性,元组,关系模型的数据结构(续),关系(Relation)一个关系对应通常说的一张表元组(Tuple)表中的一行即为一个元组属性(Attribute)表中的一列即为一个属性,给每一个属性起一个名称即属性名主码(Key)也称码键。
表中的某个属性组,它可以唯一确定一个元组,关系模型的数据结构(续),域(Domain)是一组具有相同数据类型的值的集合。
属性的取值范围来自某个域。
分量元组中的一个属性值。
关系模式对关系的描述关系名(属性1,属性2,属性n)学生(学号,姓名,年龄,性别,系名,年级),关系模型的数据结构(续),关系必须是规范化的,满足一定的规范条件最基本的规范条件:
关系的每一个分量必须是一个不可分的数据项,不允许表中还有表图1.15中工资和扣除是可分的数据项,不符合关系模型要求,图1.15一个工资表(表中有表)实例,关系模型的数据结构(续),表1.5术语对比,2.关系模型的操纵与完整性约束,数据操作是集合操作,操作对象和操作结果都是关系查询插入删除更新存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”,关系模型的操纵与完整性约束(续),关系的完整性约束条件实体完整性参照完整性用户定义的完整性,3.关系模型的优缺点,优点建立在严格的数学概念的基础上概念单一实体和各类联系都用关系来表示对数据的检索结果也是关系关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作,关系模型的优缺点(续),缺点存取路径对用户透明,查询效率往往不如格式化数据模型为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度,第一章绪论,1.1数据库系统概述1.2数据模型1.3数据库系统的结构1.4数据库系统的组成1.5小结,1.3数据库系统的结构,从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构从数据库最终用户角度看,数据库系统的结构分为:
单用户结构主从式结构分布式结构客户-服务器浏览器-应用服务器数据库服务器多层结构等,数据库系统的结构(续),1.3.1数据库系统模式的概念1.3.2数据库系统的三级模式结构1.3.3数据库的二级映像功能与数据独立性,1.3.1数据库系统模式的概念,“型”和“值”的概念型(Type)对某一类数据的结构和属性的说明值(Value)是型的一个具体赋值例如学生记录:
(学号,姓名,性别,系别,年龄,籍贯)一个记录值:
(201315130,李明,男,计算机系,19,江苏南京市),数据库系统模式的概念(续),模式(Schema)数据库逻辑结构和特征的描述是型的描述,不涉及具体值反映的是数据的结构及其联系模式是相对稳定的实例(Instance)模式的一个具体值反映数据库某一时刻的状态同一个模式可以有很多实例实例随数据库中的数据的更新而变动,数据库系统模式的概念(续),例如:
在学生选课数据库模式中,包含学生记录、课程记录和学生选课记录2013年的一个学生数据库实例,包含:
2013年学校中所有学生的记录学校开设的所有课程的记录所有学生选课的记录2012年度学生数据库模式对应的实例与2013年度学生数据库模式对应的实例是不同的,数据库系统结构(续),1.3.1数据库系统模式的概念1.3.2数据库系统的三级模式结构1.3.3数据库的二级映像功能与数据独立性,1.3.2数据库系统的三级模式结构,模式(Schema)外模式(ExternalSchema)内模式(InternalSchema),数据库系统的三级模式结构(续),图1.16数据库系统的三级模式结构,1.模式(Schema),模式(也称逻辑模式)数据库中全体数据的逻辑结构和特征的描述所有用户的公共数据视图一个数据库只有一个模式模式的地位:
是数据库系统模式结构的中间层与数据的物理存储细节和硬件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 系统 概论 王珊 PPT
![提示](https://static.bingdoc.com/images/bang_tan.gif)