数据库考试.docx
- 文档编号:18620463
- 上传时间:2023-08-20
- 格式:DOCX
- 页数:30
- 大小:155.67KB
数据库考试.docx
《数据库考试.docx》由会员分享,可在线阅读,更多相关《数据库考试.docx(30页珍藏版)》请在冰点文库上搜索。
数据库考试
第1章数据库基础知识
1.信息与数据
(1)信息、信息特征及作用
信息就是新的、有用的事实和知识。
信息具有四个基本特征:
1)内容是关于客观事物或思想方面的知识;
2)有用的,它是人们活动的必需知识;
3)能够在空间和时间上被传递,在空间上传递信息称为信息通信,在时间上传递信息称为信息存储;
4)需要一定的形式表示,信息与其表现符号不可分离。
信息的作用:
1)提高人们对事物的认识,减少人们活动的盲目性;
2)社会机体进行活动的纽带,社会的各个组织通过信息网相互了解并协同工作,使整个社会协调发展;
3)管理活动的核心。
(2)数据、数据和信息的关系及数据的特征
数据是用于载荷信息的物理符号。
数据的4个特征:
1)数据有“型”和“值”之分。
2)数据受数据类型和取值范围的约束。
3)数据有定性表示和定量表示之分。
4)数据应具有载体和多种表现形式。
(3)数据处理及分类
1)数据管理:
收集信息、将信息用数据表示并按类别组织保存,在需要的时候能够提供数据;
2)数据加工:
对数据变换、抽取和运算,得到更有用的数据,指导或控制人的行为或事物的变化;
3)数据传播:
在空间或时间上以各种形式传播信息,而不改变数据的结构、性质和内容,使更多的人得到信息。
2.数据管理及内容
数据管理是其他数据处理的核心和基础。
组织和保存数据,即将收集到的数据合理地分类组织,将其存储在物理载体上,使数据能够长期地被保存;进行数据维护,即根据需要插入新数据、修改原数据和删除失效数据的操作;提供数据查询和数据统计功能,以便快速地得到需要的正确数据,满足各种使用要求。
3.数据库及数据库中数据的性质
数据库(DB)是一个按数据结构来存储和管理数据的计算机软件系统。
数据库方法与文件方法相比,具有以下两个特征。
1)数据库中的数据具有数据整体性。
2)数据库中的数据具有数据共享性。
①不同的用户可按各自的用法使用数据库中的数据。
②多个用户可以同时共享数据库中的数据资源。
4.数据库管理系统与数据库应用系统
数据库管理系统(DBMS)是专门用于管理数据库的计算机系统软件。
数据库管理系统能够为数据库提供数据的定义、建立、维护、查询和统计等操作功能,并完成对数据完整性、安全性进行控制的功能。
凡使用数据库技术管理数据的系统都称为数据库应用系统。
一个数据库应用系统应携带有足够的数据量。
数据库应用系统可以被划分为数据传递系统、数据处理系统和管理信息系统。
管理信息系统及特点
1)信息管理系统是以数据库技术为基础的。
2)信息管理系统一般采用功能选单方式控制程序。
3)信息管理系统的功能模块大致相同。
数据库系统特点
一个数据库系统应由计算机硬件、数据库、数据库管理系统、应用软件和数据库管理员等5部分构成。
手工管理数据阶段
1)手工管理阶段不保存大量的数据。
2)手工管理阶段没有软件系统对数据进行管理。
3)手工管理阶段基本上没有“文件”概念。
4)手工管理阶段一组数据对应一个程序。
文件管理阶段的数据管理特点
1)管理的数据以文件的形式长久地被保存在计算机的外存中。
2)文件系统有专门的数据管理软件提供有关数据存取、查询及维护功能。
3)文件系统中的数据文件已经具有多样化。
4)文件系统的数据存取是以记录为单位的。
文件系统在数据管理上的主要缺点
1)文件系统的数据冗余度(Redundancy)大。
2)文件系统中缺乏数据与程序独立性。
①文件系统中的数据文件是为某一特定应用服务的,数据文件的可重复利用率非常低。
②当数据的逻辑结构改变时,必须修改它的应用程序,同时也要修改文件结构的定义。
3)应用程序的改变将影响到文件数据结构的改变。
数据库系统管理数据特点
1.数据库设计时面向数据模型对象
2.数据库系统的数据冗余度小、数据共享度高
1)系统现有用户或程序可以共同享用数据库中的数据。
2)当系统需要扩充时,新用户或新程序还可以共享原有的数据资源。
3)多用户或多程序可以在同一时刻共同使用同一数据。
数据库系统的数据和程序之间具有较高的独立性
(1)数据的物理独立性(PhysicalDataIndependence)
应用程序对数据存储结构(也称物理结构)的依赖程度。
数据物理独立性高是指当数据的物理结构发生变化时,应用程序不需要修改也可以正常工作。
(2)数据的逻辑独立性(LogicalDataIndependence)
应用程序对数据全局逻辑结构的依赖程度。
数据逻辑独立性高是指当数据库系统的数据全局逻辑结构改变时,它们对应的应用程序不需要改变仍可以正常运行。
数据库系统通过DBMS进行数据控制
数据的安全性控制指保护数据库,以防止不合法的使用造成的数据泄漏、破坏和更改。
数据的完整性控制指为保证数据的正确性、有效性和相容性,防止不符合语义的数据输入或输出所采用的控制机制。
数据的并发控制指排除由于数据共享,即用户并行使用数据库中的数据时,所造成的数据不完整和系统运行错误问题。
数据恢复通过记录数据库的日志文件和定期做数据备份,保证数据在受到破坏时,能够及时使数据库恢复到正确状态。
数据库系统需要的硬件资源及对硬件的要求
1)计算机内存要尽量大。
2)计算机外存也要尽量大。
3)计算机的数据传输速度要快。
数据库系统的软件组成
操作系统(OS)、数据库管理系统(DBMS)、主语言系统、应用程序软件和数据库。
数据库系统的人员组成及数据库管理员的职责
数据库系统的人员由开发人员、软件使用人员及软件管理人员组成。
软件管理人员称为数据库管理员(DBA),职责为:
1)参与数据库和应用系统的设计。
2)参与决定数据库的存储结构和存取策略的工作。
3)负责定义数据的安全性要求和完整性条件。
4)负责监视和控制数据库系统的运行,负责系统的维护和数据恢复工作。
5)负责数据库的改进和重组。
数据库管理系统的功能结构
1.数据定义功能:
能够提供数据定义语言(简称DDL)和相应的建库机制。
用户利用DDL可以方便地建立数据库。
2.数据操纵功能:
实现数据的插入、修改、删除、查询、统计等数据存取操作的功能。
数据库管理系统通过提供数据操纵语言(DML)实现其数据操纵功能。
3.数据库的建立和维护功能:
指数据的载入、转储、重组织功能及数据库的恢复功能;指数据库结构的修改、变更及扩充功能。
4.数据库的运行管理功能:
包括并发控制、数据的存取控制、数据完整性条件的检查和执行、数据库内部的维护等。
数据库的三级模式结构
数据库的三级模式是逻辑模式、外模式(子模式)、内模式(物理模式)
(1)逻辑模式(Schema)及概念数据库
对数据库中数据的整体逻辑结构和特征的描述。
以逻辑模式为框架的数据库为概念数据库。
(2)外模式(ExternalSchema)及用户数据库
对各个用户或程序所涉及到的数据的逻辑结构和数据特征的描述。
以子模式为框架的数据库为用户数据库。
(3)内模式(InternalSchema)及物理数据库
数据的内部表示或底层描述。
以物理模式为框架的数据库为物理数据库。
数据库系统的二级映象技术及作用
1)外模式/模式的映象:
定义并保证了外模式与数据模式之间的对应关系。
2)模式/内模式的映象及作用:
定义并保证了数据的逻辑模式与内模式之间的对应关系。
第2章数据模型与概念模型
信息的三种世界及其描述
1.信息的现实世界
要管理的客观存在的各种事物、事务之间的相互联系及事物的发生、变化过程。
(1)实体(Entity)
现实世界中存在的可以相互区分的事物或概念。
(2)实体的特征(EntityCharacteristic)
每个实体都有自己的特征,利用实体的特征可以区别不同的实体。
(3)实体集及实体集间的联系(Relation)
具有相同特征或能用同样特征描述的实体的集合。
在信息世界中:
实体的特征在头脑中形成的知识称为属性;实体通过其属性表示称为实例;同类实例的集合称为对象,对象即实体集中的实体用属性表示得出的信息集合;实体集之间的联系用对象联系表示。
信息世界通过概念模型、过程模型和状态模型反映现实世界,它要求对现实世界中的事物、事物间的联系和事物的变化情况准确、如实、全面地表示。
信息的计算机世界
1)数据项(Item):
对象属性的数据表示。
2)记录(Record):
实例的数据表示。
记录有型和值之分:
记录的型是结构,由数据项的型构成;记录的值表示对象中的一个实例,它的分量是数据项值。
3)文件(File):
对象的数据表示,同类记录的集合。
4)数据模型(DataModel):
现实世界中的事物和相互联系数据化的结果就是数据模型。
概念模型及其表示
概念模型是对信息世界的管理对象、属性及联系等信息的描述形式。
概念模型不依赖计算机及DBMS,它是现实世界的真实全面反映。
2.2.1概念模型的基本概念
1.概念模型涉及的基本概念
(1)对象(Object)和实例(Instance)
现实世界中具有相同性质、服从相同规则的一类事物(概念)的抽象称为对象。
对象中的每一个具体的事物(实体)为该对象的实例。
(2)属性(Attribute)
属性为实体的某一方面特征的抽象表示。
(3)主码(PrimaryKey)和次码(SecondaryKey)
码能够惟一标识一个实体;不能惟一标识实体的属性叫次码。
(4)域(Domain)
属性的取值范围称为属性的域。
实体联系的类型
(1)两个实体集之间的联系
1)一对一联系(1:
1):
设有两个实体集A和B,对于A中的每一个实体,B中至多有一个实体与之联系;反之亦然。
2)一对多联系(1:
n):
设有两个实体集A和B,对于A的每一个实体,B中有一个或多个实体与之联系;而对于B的每一个实体,A中至多有一个实体与之联系。
3)多对多联系(m:
n):
设有两个实体集A和B,对于A的每一个实体,B中有一个或多个实体与之联系;反之亦然。
多实体集之间的联系
1)多实体集之间的一对多联系。
设实体集E1,…En,对于实体集Ej(j=1,…n)中的一个给定实体,最多只和其他实体集Ei(ij)中的一个实体相联系,则称Ej与E1…,En之间的联系是一对多的。
2)多实体集之间的多对多联系。
在两个以上的多个实体集之间,当一个实体集与其他实体集之间均存在多对多联系,而其他实体集之间没有联系时,这种联系称为多实体集间的多对多联系。
概念模型的表示方法
1)用长方形表示实体集,长方形内写明实体集名。
2)用椭圆形表示实体集的属性,并用线段将其与相应的实体集连接起来。
3)用菱形表示实体集间的联系,菱形内写上联系名,用线段分别与有关实体集连接起来,在线段旁标出联系的类型。
如果联系具有属性,则该属性仍用椭圆框表示,仍需要用线段将属性与其联系连接起来。
常见的数据模型
2.3.1数据模型概述
1.数据模型的三要素
1)数据结构:
所研究的对象类型的集合。
包括与数据类型、内容、性质有关的对象;与数据之间联系有关的对象。
2)数据操作:
对数据库中各种数据对象允许执行的操作集合。
包括操作对象和有关的操作规则两部分。
3)数据约束条件:
一组数据完整性规则的集合。
2.常见的数据模型
层次模型、网状模型和关系模型。
在非关系模型中,实体集用记录表示,实体的属性对应记录的数据项(或字段)。
实体集之间的联系转换成两两记录之间的联系。
非关系模型中数据结构的单位是基本层次联系。
层次数据模型
1.层次模型的数据结构
(1)层次模型的定义
1)有且仅有一个结点没有双亲结点,这个结点称为根结点。
2)除根结点之外的其他结点有且只有一个双亲结点。
(2)层次模型的数据表示方法
实体集使用记录表示;记录型包含若干个字段;记录值表示实体;记录之间的联系使用基本层次联系表示。
(3)层次模型的特点
层次模型像一棵倒立的树,只有一个根结点,有若干个叶结点,结点的双亲是惟一的。
层次模型的完整性约束条件
(1)在进行插入记录值操作时,如果没有指明相应的双亲记录值(首记录值),则不能插入子女记录值(属记录值)。
(2)进行删除记录操作时,如果删除双亲记录值(首记录值),则相应的子女结点值(属记录值)也同时被删除。
(3)进行修改记录操作时,应修改所有相应记录,以保证数据的一致性。
网状数据模型
1.网状模型的数据结构
(1)网状模型结构的基本特征
1)有一个以上的结点没有双亲。
2)结点可以有多于一个的双亲。
(2)网状模型的数据表示方法
1)使用记录和记录值表示实体集和实体;每个结点表示一个记录,每个记录包含若干个字段。
2)联系(系)用结点间的有向线段表示。
每个有向线段表示一个记录间的一对多的联系。
网状模型的完整性约束条件
支持记录码的概念。
码即惟一标识记录的数据项的集合。
2)保证一个联系中双亲记录和子女记录之间是一对多的联系。
3)可以支持双亲记录和子女记录之间某些约束条件。
关系数据模型
1.关系模型的数据结构
(1)关系模型中的主要术语
1)关系。
一个关系对应通常所说的一张二维表。
2)元组。
表中的一行称为一个元组。
3)属性。
表中的一列称为一个属性。
4)主码。
表中的某个属性或属性组,值可以惟一地确定一个元组,且属性组中不含多余的属性。
5)域。
属性的取值范围称为域。
6)分量。
元组中的一个属性值称为分量。
7)关系模式。
关系的型称为关系模式,是对关系的描述。
(2)关系模型中的数据全部用关系表示
关系操作和完整性约束条件
关系操作主要包括数据查询和插入、删除、修改数据。
关系中的数据操作是集合操作。
关系操作语言都是高度非过程的语言
关系的完整性约束条件包括三类:
实体完整性、参照完整性和用户定义的完整性。
关系模型与非关系模型比较
1)关系数据模型建立在严格的数学基础之上。
2)关系数据模型的概念单一,容易理解。
3)关系数据模型的存取路径对用户隐蔽。
4)关系模型中的数据联系是靠数据冗余实现的。
对象关系数据模型
1.对象关系数据模型的概念
对象关系数据模型使用二维表表示数据,它包括关系表和对象表两种。
关系表属于关系模型,关系的属性对应于表的列,关系的元组对应于表的行,关系模型装不支持方法。
对象表属于面向对象数据模型,支持面向对象的基本功能,对象的类抽象对应二维表,类的实例(对象)对应于表中的行,类的属性对应于表的列,通过对象可调用方法。
对象表的数据类型和表结构特点
(1)对象表的属性支持复合数据类型
关系表强调属性数据只能是不可分割的简单数据项,复合数据是不允许出现的。
对象表的数据可以是基本项,也可以是组合数据项
(2)对象表的属性支持可变长数组类型
关系表的属性不支持数组类型,更不支持可变长的数组类型。
对于一些数据个数不确定的信息,关系表只能独立新建表的方法解决。
对象表增加了数组类型,用户可以使用可变长的数组类型保存记录中数据个数不一样的属性数据。
对象表的属性支持嵌入表数据类型
对象表中的属性,不仅可以是复合数据、数组数据等带结构的数据,还可以是嵌套表,信息结构更复杂、更丰富。
嵌套表有行和列,表的长短与具体元组有关。
数据库系统设计概述
数据库设计是设计数据库结构特性,为特定应用环境构造出最优的数据模型;数据库应用系统设计是设计数据库的行为结构特性,建立能满足各种用户对数据库应用需求的功能模型。
数据库系统设计的内容
目标:
对于给定的应用环境,建立一个性能良好的、能满足不同用户使用要求的、又能被选定的DBMS所接受的数据库系统模式。
按照该模式建立的数据库系统,应当能够完整地反映现实世界中信息及信息之间的联系;能够有效地进行数据存储;能够方便地执行各种数据检索和处理操作;并且有利于进行数据维护和数据控制管理的工作。
内容:
数据库的结构特性设计,数据库的行为特性设计,数据库的物理模式设计。
将结构特性设计和行为特性设计结合起来,相互参照,同步进行,才能较好地达到设计目标。
1.数据库的结构特性设计
先将现实世界中的事物、事物间的联系用E-R图表示,再将各个分E-R图汇总,得出数据库的概念结构模型,最后将概念结构模型转化为数据库的逻辑结构模型表示。
2.数据库的行为特性设计
首先要将现实世界中的数据及应用情况用数据流程图和数据字典表示,并详细描述其中的数据操作要求(即操作对象、方法、频度和实时性要求),进而得出系统的功能模块结构和数据库的子模式。
3.数据库的物理模式设计
根据库结构的动态特性(即数据库应用处理要求),在选定的DBMS环境下,把数据库的逻辑结构模型加以物理实现,从而得出数据库的存储模式和存取方法。
数据库系统设计应注意的问题
1.考虑到计算机硬件、软件和干件的实际情况
(1)数据库系统的硬件条件
根据其数据存储设备、网络和通信设备、计算机性能等硬件条件设计数据库的规模、数据存储方式、分布结构以及数据通讯方式。
(2)DBMS和主语言系统的特点
在数据库设计前,应当选择合适的DBMS和主语言系统,使之适合数据库系统的要求。
(3)数据库用户的技术水平和管理水平
应当让DBA充分参与设计数据库的工作,使之对数据库设计过程的每个细节都了解的比较清楚。
。
2.使结构特性设计和行为特性设计紧密结合
数据库设计过程是一种自上而下的、逐步逼近设计目标的过程,是结构设计和行为设计分离设计、相互参照、反复探寻的过程。
数据库系统设计方法
数据库系统设计应分6个阶段进行,这6个阶段是需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施和数据库运行和维护。
数据库设计的基本步骤
1.需求分析阶段:
准确了解并分析用户对系统的需要和要求,弄清系统要达到的目标和实现的功能。
2.概念结构设计阶段:
对用户需求进行综合、归纳和抽象,形成一个独立于具体计算机和DBMS的概念模型。
3.逻辑结构设计阶段:
将概念结构转换为DBMS所支持的数据模型,并将其性能进行优化。
4.数据库物理设计阶段:
为逻辑数据模型选取一个最适合应用环境的物理结构,包括数据存储结构和存取方法。
5.数据库实施阶段:
运用DBMS提供的数据操作语言和宿主语言,根据数据库的逻辑设计和物理设计的结果建立数据库、编制与调试应用程序、组织数据入库并进行系统试运行。
6.数据库运行和维护阶段:
不断地对其结构性能进行评价、调整和修改。
系统需求分析分析用户的要求,将分析结果用数据流程图和数据字典表示。
需求分析的任务和方法
任务:
调查现实世界要处理的对象;了解原系统的概况和发展;明确用户需求;收集基础数据及其处理方法;确定新系统的功能和边界。
1.系统需求调查的内容
(1)数据库中的信息内容
数据库中需存储哪些数据,包括用户将从数据库中直接获得或间接导出的信息内容和性质。
(2)数据处理内容
用户要完成什么数据处理功能;用户对数据处理响应时间的要求;数据处理的工作方式。
(3)数据安全性和完整性要求
数据的保密措施和存取控制要求;数据自身的或数据间的约束限制。
系统需求的调查步骤
(1)了解现实世界的组织机构情况
弄清所设计的数据库系统与哪些部门相关,这些部门以及下属各个单位的联系和职责是什么。
(2)了解相关部门的业务活动情况
各部门需要输入和使用什么数据;在部门中是如何加工处理这些数据的;各部门需要输出什么信息;输出到什么部门;输出数据的格式是什么。
(3)确定新系统的边界
哪些功能现在就由计算机完成;哪些功能将来准备让计算机完成;哪些功能或活动由人工完成。
由计算机完成的功能就是新系统应该实现的功能。
系统需求调查的方法
(1)跟班作业:
数据库设计人员亲身参加业务工作。
(2)开调查会:
通过与用户座谈的方式来了解业务活动情况及用户需求。
(3)请专人介绍:
请业务熟练的专家或用户介绍业务专业知识和业务活动情况,设计人员从中了解并询问相关问题。
(4)询问:
对某些调查中的问题,可以找专人询问。
(5)设计调查表请用户填写:
数据库设计人员可以提前设计一个合理的、详细的业务活动及数据要求调查表,并将此表发给相关的用户。
(6)查阅现实世界的数据记录:
查阅与原系统有关的数据记录,包括帐本、档案或文献等。
系统需求分析方法
常用的有结构化分析方法:
1)自顶向下的设计方法。
先定义全局概念结构的框架,然后逐步细化为完整的全局概念结构。
2)自底向上的设计方法。
先定义各局部应用的概念结构,后将它们集成,得到全局概念结构。
3)逐步扩张的设计方法。
先定义最重要的核心部分,后向外扩充,生成其他概念结构。
4)混合策略设计的方法。
即采用自顶向下与自底向上相结合的方法。
数据字典及其表示
数据字典是各类数据描述的集合
1.数据项:
数据项是不可再分的数据单位。
2.数据结构:
数据结构反映了数据之间的组合关系。
3.数据流:
据流是数据结构在系统内传输的路径。
4.数据存储:
数据存储是数据及其结构停留或保存的地方,也是数据流的来源和去向之一。
数据存储可以是手工文档、手工凭单或计算机文档。
5.处理过程:
用判定表或判定树来描述。
概念结构的设计
1.三种数据抽象方法
(1)分类:
定义类概念作为现实世界中对象的类型,这些对象具有某些共同的特性和行为。
在E-R模型中,实体集是该抽象。
(2)聚集:
定义某一类型的组成部分,它抽象了对象内部的类型和“组成部分”的语义。
(3)概括:
定义类型之间的一种子集联系,它抽象了类型之间的“所属”的语义。
2.设计分E-R图
概念结构设计是利用抽象机制对需求分析阶段收集到的数据分类、组织(聚集),形成实体集、属性和码,确定实体集之间的联系类型,进而设计分E-R图。
视图的集成
1.合并分E-R图,生成初步E-R图
(1)属性冲突
1)属性域冲突,即属性值的类型、取值范围或取值集合不同。
2)属性取值单位冲突。
(2)命名冲突
1)同名异义冲突:
不同的对象在不同的局部应用中具有相同的名字。
2)异名同义冲突:
意义相同的对象在不同的应用中有不同的名字。
(3)结构冲突
1)同一对象在不同的应用中具有不同的抽象。
2)同一实体在不同分E-R图中的属性组成不一致.
3)实体之间的联系在不同的分E-R图中呈现不同的类型。
2.消除不必要的冗余,设计基本E-R图
数据库逻辑结构的设计
.概念模型向网状模型转换
1.不同型实体集及其联系的转换规则
1)每个实体集转换成一个记录。
2)每个1:
n的二元联系转换成一个系,系的方向由1方实体记录指向n方实体记录。
3)每个m:
n的二元联系,在转换时要引入一个连结记录,并形成两个系,系的方向由实体记录方指向连结记录方。
4)K(>=3)个实体型之间的多元联系,在转换时也引入一个连结记录,并将联系转换成K个实体记录型和连结记录型之间的K个系,系的方向均为实体型指向连结记录。
概念模型向关系模型的转换
1.实体集的转换规则
一个实体集转换为关系模型中的一个关系,实体的属性就是关系的属性,实体的码就是关系的码,关系的结构是关系模式。
2.实体集间联系的转换规则
(1)1:
1联系的转换方法
1)将1:
1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 考试