自考数据库系统原理12章整理.docx
- 文档编号:10073625
- 上传时间:2023-05-23
- 格式:DOCX
- 页数:32
- 大小:215KB
自考数据库系统原理12章整理.docx
《自考数据库系统原理12章整理.docx》由会员分享,可在线阅读,更多相关《自考数据库系统原理12章整理.docx(32页珍藏版)》请在冰点文库上搜索。
自考数据库系统原理12章整理
第一章数据库系统基本概念
1·1数据管理技术的发展
①数据不保存在计算机内
②没有专用的软件对数据进行管理
1、人工管理阶段③只有程序的概念没有文件的概念
④数据面向程序
①数据以“文件”形式可长期保存在外部存储器的磁盘上。
②数据的物理结构和逻辑结构有了区别,但比较简单。
③文件组织已多样化。
特点④数据不再属于某个特定的程序,可以重复使用,即数据面向应用。
2、文件系统阶段⑤对数据的操作以记录为单位。
1、数据管理技术的发展经历
缺陷:
①数据冗余②数据不一致③数据联系弱
①采用数据模型表示复杂的数据结构。
②有较高的数据独立性。
③数据库系统为用户提供了方便的用户接口。
3、数据库阶段④数据库系统提供以下四方面的数据控制功能:
数据库的恢复、数据库的并发控制、数据的完整性、数据安全性。
⑤增加了系统的灵活性。
4、高级数据库阶段
2、定义:
数据库(DB):
DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。
数据库管理系统(DBMS):
DBMS是位于用户与操作系统(OS)之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。
DBMS总是基于某种数据模型:
层次型、网状型、关系型、面向对象型。
数据库系统(DBS):
DBS是实现有组织的动态的存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,及它是采用数据库技术的计算机系统。
数据库技术:
数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。
1·2数据描述
1、概念设计中的数据描述
实体(E):
客观存在的,可以相互区别的事物称为实体。
实体集(ES):
性质相同的同类实体的集合。
属性(A):
实体有很多特性,每一个特性称为属性。
实体标识符(I):
能唯一标示实体的属性或属性集。
有时也称为关键码(key),或关键字。
2、逻辑设计中的数据描述
字段(F):
标记实体属性的命名单位称为字段,或数据项。
记录(R):
字段的有序集合称为记录。
一般用一个记录描述一个实体。
文件(File):
同一类记录的集合称为文件。
文件是用来描述实体集的。
关键码(Key):
能惟一标识文件中每个记录的字段或字段集,称为记录的关键码。
对应关系
概念设计
逻辑设计
实体
记录
属性
字段(数据项)
实体集
文件
实体标识符
关键字
3、物理设计中的数据描述
①高速缓冲存储器(Cache)[访问速度最快、容量小、由cpu直接管理]
②主存储器(Mainmemory)[内存、断电数据丢失]
物理存储介质层次③快擦写存储器(Flashmemory)[EEP-ROM、断电数据不丢失]
④磁盘存储器(Magneticmemory)
⑤光存储器(OpticalStorage)[CD-ROM、CD-RW、DVD-RW、]
⑥磁带(TapeStorage)
4、物理存储中的数据描述
位(Bit比特):
一个二进制位称为“位”。
字节(Byte):
8个比特称为一个字节。
字(Word):
若干个字节组成一个字。
块(Block):
又称为物理块或物理记录。
块是内存和外存交换信息的最小单位,每块的大小为2/10~~2/14。
桶(Bucket):
外存的逻辑单位,一个桶可以包含一个物理块或多个在空间上不一定连续的物理块。
卷(Volume):
一个输入输出设备所能装载的全部有用信息,称为“卷”。
5、定义:
联系(Relationship):
是实体之间的相互关系。
与一个联系有关的实体集个数,称为联系的元数。
二元联系有以下三种类型:
①一对一联系:
如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,
反之亦然,那么实体集E1和E2的联系称为“一对一联系”,记为“1:
1”。
②一对多联系:
如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)
实体有联系,而E2中每个实体至多和E1中一个实体有联系,那么称E1和E2
的联系是“一对多联系”,记为“1:
N”。
③多对多联系:
如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)
实体有联系,反之亦然,那么称E1和E2的联系是“多对多联系”,
记为“M:
N”。
1·3数据抽象的级别
1、定义:
概念模型:
表达用户需求观点的数据全局逻辑结构的模型,称为“概念模型”。
逻辑模型:
表达计算机实现观点的DB全局逻辑结构的模型,称为“逻辑模型”。
外部模型:
表达用户使用观点的DB局部逻辑结构的模型,称为“外部模型”。
内部模型:
表达DB物理结构的模型,称为“内部模型”。
①根据用户需求,设计数据库的概念模型,这是一个“综合”过程。
②根据转换规则,把概念模型转换成数据库的逻辑模型,这是一个“转换”的过程。
2、数据库设计过程③根据用户的业务特点,设计不同的外部模型,给程序员使用。
④数据库实现时,要根据逻辑模型设计其内部模型。
内部模型与逻辑模型之间的对
应性称为映像。
①概念模型表达了数据的整体逻辑结构,它是系统用户对整个应用项目
涉及的数据的全面描述。
3、概念模型的特点②概念模型是从用户需求的观点出发,对数据建模。
③概念模型独立于硬件和软件。
④概念模型是数据库设计人员与用户之间进行交流的工具。
现在采用的概念模型主要是实体联系(ER)模型
①简单,容易理解,真实的反映用户的需求。
ER模型的优点②与计算机无关,用户容易接受。
①逻辑模型表达了DB的整体逻辑结构,但它是设计人员对整个应用项目
数据库的全面描述。
4、逻辑模型的特点②逻辑模型是从数据库实现的观点出发,对数据建模。
③逻辑模型独立于硬件,但依赖于软件(DBMS)。
④逻辑模型是数据库设计人员与应用程序员之间进行交流的工具。
概念:
用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。
特点:
记录之间的联系通过指针来实现,查询效率较高。
层次模型①只能表示1:
N联系
缺点②由于层次顺序的严格和复杂,引起数据的查询和更新操作很复杂,
因此应用程序的编写也比较复杂。
逻辑模型分为概念:
用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。
网状模型特点:
记录之间的联系通过指针来实现,M:
N联系也容易实现,查询效率较高。
缺点:
数据结构复杂,编程复杂。
关系模型特点:
用二维表格表达实体集。
5、外部模型中的模式称为“视图”。
视图中的数据可以从逻辑模型的数据库中得到。
①外部模型是逻辑模型的一个逻辑子集。
外部模型的特点②外部模型独立于硬件,依赖于软件。
③外部模型反映了用户使用数据库的观点。
①简化了用户的观点。
外部模型的优点②有助于数据库的安全性保护。
③外部模型是对概念模型的支持。
6、内部模型又称为物理模型。
7、定义:
从用户(或应用程序)到数据库之间,DB的数据结构描述有三个层次——
①外模式是用户与数据库系统的接口,是用户用到的那部分数据的描述。
外模式由若干个外部记录类型组成。
②逻辑模式是数据库中全部数据的整体逻辑结构的描述。
它由若干个逻辑记录类型组成,还包含记录间的联系、数据的完整性安全性等要求。
③内模式是数据库在物理存储方面的描述,定义所有内部记录类型、索引和文件的组织方式,以及数据控制方面的细节。
三层模式之间存在着两级映像:
①外模式/逻辑模式映像存在于外模式和逻辑模式之间,用于定义外模式和逻辑模式之间的对应性。
②逻辑模式/内模式映像是存在于逻辑模式和内模式之间,用于定义逻辑模式和内模式之间的对应性。
数据独立性:
是指应用程序和数据库的数据结构之间相互独立、不受影响。
数据独立性分为物理数据独立性和逻辑数据独立性两个级别。
①用户使用DB的数据操纵语言语句对数据库进行操作,实际上是对外模式的外部记录进行操作。
8、三层模式体系特点②逻辑模式必须不涉及到存储结构、访问技术等细节。
③内模式并不涉及到物理设备的约束。
1·4数据库管理系统(DBMS)
1、数据库管理系统(DBMS):
是指数据库系统中对数据进行管理的软件系统,它是数据库系统的核心组成部分。
对DB的一切操作,包括定义、查询、更新及各种控制,都是通过DBMS进行的。
DBMS的工作模式:
①接受应用程序的数据请求和处理请求
②将用户的数据请求(高级指令)转换成复杂的机器代码(低层指令)
③实现对数据库的操作
④从对数据库的操作中接受查询结果DBMSDB
⑤对查询结果进行处理(格式转换)⑤③
⑥将处理结果返回给用户
根据数据模型的不同,DBMS可以分为层次型、网状型、关系型、面向对象型等。
DBMS的主要目标是使数据作为一种可管理的资源来处理。
①数据库的定义功能
②数据库的操纵功能
数据库的恢复
2、DBMS的主要功能③数据库的保护功能数据库的并发控制
数据完整性控制
数据安全性控制
④数据库的维护功能
⑤数据字典:
数据库系统中存放三级结构定义的数据库称为数据字典(DD)
1·5数据库系统(DBS)
1、DBS是采用了数据库技术的计算机系统。
①数据库(DB)应用数据的集合(称为物理数据库)主体
各级数据结构的描述(称为描述数据库)由DD系统管理
②硬件:
CPU、内存、外存、IO设备等
2、DBMS的组成③软件DBMS、OS、各种主语言
应用开发支撑软件等程序
熟悉企业全部数据的性质和用途
④数据库管理员(具备素质)对所有用户的需求有充分的了解
对系统的性能非常熟悉
兼有系统分析员和运筹学专家的品质和知识
3、定义:
数据库管理员(DBA):
DBA是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护数据库结构的责任。
①定义模式
②定义内模式
4、DBA的主要职责③与用户的联系。
包括定义外模式、应用程序的设计、提供技术培训等专业服务。
④定义安全性规则,对用户访问数据库的授权。
⑤定义完整性规则,监督数据库的运行。
⑥数据库的转储与恢复工作。
5、数据库的用户分为:
DBA、专业用户、应用程序员、终端用户。
①DDL解释器:
解释DDL语言,并将这些定义登录在数据字典中。
6、DBMS查询处理器分为②DML编译器:
对DML语句进行优化,并转化成查询求值引擎能执行的低层指令。
③嵌入式DML的预编译器:
把嵌入在主语言中的DML语句处理成规范的过程调用形式。
④查询求值引擎:
执行由DML编译器产生的低层指令。
①权限和完整性管理器
7、DBMS存储管理器分为②事务管理器。
③文件管理器。
④缓冲区管理器。
①数据文件
②数据字典
8、磁盘存储器中数据结构形式③索引。
④统计数据。
⑤日志。
①灵活性
②简易性
③面向用户
9、DBS的效益④有效地数据控制
⑤加快应用系统的开发速度
⑥维护方便
⑦标准化
第二章数据库设计和ER模型
2·1数据库系统生存期
①开发过程无法控制,常常一再拖延。
1、软件危机表现在②缺乏科学的指导原则和管理方法,软件产品质量低劣,达不到规定的要求。
③由于产品质量低劣,维护任务十分繁重。
④软件开发费用急剧上升,常常超出预算,使应用部门与开发部门无法负担。
2、软件生存期:
软件工程中把软件开发和运营的全过程称为“软件生存期”。
软件生存期是指从软件的规划、研制、实现、投入运行后的维护,直到它被新的软件所取代而停止使用的整个期间。
3、定义:
数据库系统生存期:
我们把数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间称为数据库系统生存期。
①系统调查
一、规划阶段(步骤)②可行性分析
③确定数据库系统的总目标,
并对应用单位的工作流程进行优化和定制项目开发计划。
①分析用户活动,产生业务流程图
二、需求分析阶段(组成)②确定系统范围,产生系统关联图
③分析用户活动,产生数据流图
④分析系统数据,产生数据字典
①进行数据抽象,设计局部概念模型。
三、概念设计阶段(步骤)②将局部概念模型综合成全局概念模型。
③评审。
①把概念模型转换成逻辑模型。
②设计外模型。
四、逻辑设计阶段(步骤)③设计应用程序与数据库的接口。
④评价模型。
⑤修正模型。
①存储记录结构设计
②确定数据存放位置
4、生存期可划分为七个阶段五、物理设计阶段(步骤)③存取方法的设计
④完整性和安全性考虑
⑤程序设计
①用DDL语言定义数据库结构
筛选数据
对于小型系统转换数据格式
输入数据
校验数据
②组织数据入库(数据装载)筛选数据
六、数据库的实现输入数据
对于大中型系统校验数据
转换数据
综合数据
③编制与调试应用程序
④数据库试运行功能调试
性能调试
①数据库的转储和恢复
七、数据库的运行与维护②数据库安全性、完整性控制
③数据库性能的监督、分析和改进
④数据库的重组织和重构造
2·2ER模型的基本概念
5、ER模型的基本元素是:
实体、联系和属性。
定义:
实体(Entity):
是一个数据对象,指应用中可以区别的客观存在的事务。
实体集(EntitySet):
是指同一类实体构成的集合。
实体类型(EntityType):
是对实体集中实体的定义。
联系(Relationship):
表示一个或多个实体之间的关联关系。
联系集(RelationshipSet):
是指同一类联系构成的集合。
联系类型(RelationshipType):
是对联系集中联系的定义。
属性(Attribute):
实体的某一特性称为属性。
在一个实体中,能够惟一标识实体的属性或属性集称为“实体标识符”。
在ER模型中,实体用表示、联系用表示、属性用表示。
根据属性的类别分为简单属性(不可分)
复合属性(可再分)
根据属性的取值特点分为单值属性
6、属性的分类多值属性用双椭圆表示
根据属性的相关性分为存储属性
派生属性用
虚线椭圆表示
允许为空值属性(NULL)
7、联系的元数:
一个联系涉及到的实体集个数,称为该联系的元数或度数(Degree).
通常一个实体集内部实体之间的联系,称为一元联系,也称为递归联系;两个不同实体集、实体之间的联系,称为二元联系;以此类推。
8、联系类型的约束基数约束
参与约束
映射基数:
实体集E1和E2之间有二元联系,则参与一个联系中的实体数目称为映射基数。
对于二元联系类型,可能的映射基数有1:
1、1:
N、M:
N、M:
1、
一元联系的映射基数有1:
1、1:
N、M:
N、
三元联系的映射基数M:
N:
P
参与约束:
如果实体集E中的每个实体都参与联系集R的至少一个联系中,我们称实体集E“完全参与”联系集R。
如果实体集E中只有部分实体参与联系集R的联系中,我们称实体集E“部分参与”联系集R。
在ER图中,用双线边表示完全参与;用单线边表示部分参与。
9、对ER模型的操作,包括实体类型、联系类型和属性的分裂、合并、增删等等。
水平分裂
分裂方式
垂直分裂(键必须在分裂后的诸实体类型出现)
合并的联系类型必须是定义在相同的实体类型组合中。
设计局部ER模型
10、采用ER模型的数据库概念设计步骤把各局部ER模型综合成一个全局ER模型
对全局ER模型进行优化,得到最终的ER模型,即概念模型
①依据系统的当前用户进行自然划分。
步骤②按用户要求数据库提供的服务归纳成几类,使每一类应用访问的
1>确定局部结构范围数据显著的不同于其他类,然后为每类应用设计一个局部ER模型。
①范围的划分要自然,易于管理。
考虑因素②范围之间的界面要清晰,相互影响要小
③范围的大小要适度
设计局部ER模型①采用人们习惯划分
2>定义实体②避免冗余,在一个局部结构中,对一个对象只取一种抽象形式,不要重复
③依据用户的信息处理需求
3>定义联系属性应该是不可再分解的语义单体
①确定属性原则实体与属性之间的关系只能是1:
N的
4>分配属性不同实体类型的属性之间应无直接关联关系
②把属性分配到有关实体和联系中去
①实体类型的个数尽可能少
满足条件②实体类型所含属性个数尽可能少
全局ER模型优化③实体类型间联系无冗余
①合并实体类型
优化原则②消除冗余属性
③消除冗余联系
☞例:
2·3关系模型的基本概念
1、定义:
关系模型:
用二维表格表示实体,用关键码表示实体之间联系的数据模型称为关系模型。
元组为行、属性为列。
关系中属性个数为元数、元组个数为基数。
关键码:
由一个或多个属性组成。
①超键(SuperKey):
在关系中能唯一标识元组的属性集称为关系模式的超键。
②候选键(CandidateKey)不含有多余属性的超键称为候选键。
关键码分为③主键(PrimaryKey)用户选作元组标识的候选键称为主键。
④外键(ForeignKey)如果模式R中属性K是其他模式的主键,那么K在模式R中称为外键。
一般在外键的属性姓名划一条~~~~波浪线
关系:
关系是一个属性数目相同的元组的集合。
①关系中每个属性集都是不可分解的
对关系的限制②关系中不允许出现重复元组
③由于关系是一个集合,因此不考虑元组间的顺序,即没有行序
④元组中的属性在理论上也是无序的,但使用时按习惯考虑列的顺序
①实体完整性规则要求主键属性不能为空
定义:
如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么在R2的关系中,K的取值只允许两种可能,或者为空值,或者等于R1关系中某个主键的值。
2、三类完整性规则②参照完整性规则
(1)外键和相应的主键可以不同名,只要定义在相同值域上即可
(2)R1和R2也可以是同一个关系模式,此时表示了同一个关系中不同元组之间的联系
(3)外键值是否允许空,应视具体问题而定
③用户定义的完整性规则
2·4ER模型到关系模型的转换
1、把ER图中实体联系和联系类型转换成关系模式的算法
步骤1(实体类型的转换):
将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,
实体标识符即为关系模式的键。
步骤2(联系类型的转换):
根据不同情况做不同处理。
步骤2.1(二元联系类型的转换)
1
若实体间联系是1:
1,可以在两个实体类型转换成的两个关系模式中任意一个关系模式
的属性中加入另一个关系模式的键(作为外键)和联系类型的属性。
2若实体间联系是1:
N则在N端实体类型转换成的关系模式中加入1端实体类型的键
(作为外键)和联系类型的属性。
3若实体间联系是M:
N,则将联系类型也转换成关系模式,其属性为两端实体类型的
键(作为外键)加上联系类型的属性,而键为两端实体键的组合。
步骤2.2(一元联系类型的转换)
和二元联系类型的转换(步骤2.1)类似
步骤2.3(三元联系类型的转换)
①若实体间联系是1:
1:
1,可以在三个实体类型转换成的三个关系模式中任意一个关系模式的属性中加入另两个关系模式的键(作为外键)和联系类型的属性。
②若实体间联系是1:
1:
N则在N端实体类型转换成的关系模式中加入两个1端实体类型的键(作为外键)和联系类型的属性。
③若实体间联系是1:
M:
N,则将联系类型也转换成关系模式,其属性为M端和N端实体类型的键(作为外键)加上联系类型的属性,而键为M端和N端实体键的组合。
④若实体间联系是M:
N:
P,则将联系类型也转换成关系模式,其属性为三端实体类型的键(作为外键)加上联系类型的属性,而键为三端实体键的组合。
①导出初始关系模式集
②规范化处理
2、采用ER模型的逻辑设计步骤③模式评价
④模式修正
⑤设计子模式
2·5ER模型分析实例(P58)
2·6增强的ER模型
1、弱实体:
一个实体对于另一个实体(称为强实体)具有很强的依赖联系,而且该实体主键的一部分或全部从其强实体中获得,则称该实体为弱实体。
弱实体用表示,与弱实体的联系,用表示。
2、子类实体和超类实体
当较低层上实体类型表达了与之联系的较高层上的实体类型的特殊情况时,就称较高层上实体类型为超类型,较低层上实体类型为子类型。
①子类与超类之间具有继承性特点,即子类实体继承超类实体的所有属性。
子类与超类之间的性质但子类实体本身还可以包含比超类实体更多的属性。
②这种继承性是通过子类实体和超类实体有相同的实体标识符实现的。
☞例:
人员(身份证号,姓名,年龄,性别)
教师(身份证号,教师编号,职称)
学生(身份证号,学号,系别,专业)
本科生(身份证号,入学年份)
研究生(身份证号,研究方向,导师姓名)
不相交小圆圈里d表示
3、不相交约束:
指特化的子类是否相交
重叠小圆圈里o表示
整体特化
4、完备性约束:
部分特化
在特化过程中:
不相交(用d表示),整体特化(用双线条表示)
不相交(用d表示),部分特化(用单线条表示)
相交(用o表示),整体特化(用双线条表示)
相交(用o表示),部分特化(用单线条表示)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自考 数据库 系统 原理 12 整理