第2次课-数据仓库new.pptx
- 文档编号:15122885
- 上传时间:2023-07-01
- 格式:PPTX
- 页数:80
- 大小:1.50MB
第2次课-数据仓库new.pptx
《第2次课-数据仓库new.pptx》由会员分享,可在线阅读,更多相关《第2次课-数据仓库new.pptx(80页珍藏版)》请在冰点文库上搜索。
第2章数据仓库,第2章数据仓库,主要内容,数据仓库基本概念,数据仓库体系结构,数据仓库元数据,数据仓库的数据模式,多维分析,高性能物理数据仓库设计,第2章数据仓库,主要内容,数据仓库基本概念,数据仓库体系结构,数据仓库元数据,数据仓库的数据模式,多维分析,高性能物理数据仓库设计,第2章数据仓库,数据仓库基本概念,随着数据库技术的应用普及和发展,人们不再仅仅满足于一般的业务处理,而对系统提出了更高的要求:
提供决策支持(DSS、OLAP),应用背景及需求,需求一种面向分析的环境;一种把相关的各种数据转换成有商业价值的信息的技术。
第2章数据仓库,数据仓库基本概念,从数据库到数据仓库,数据库系统能够很好的用于事务处理,但它对分析处理的支持一直不能令人满意。
特别是当以业务处理为主的联机事务处理(OLTP)应用和以分析处理为主的DSS应用共存于一个数据库系统时,就会产生许多问题。
例如,事务处理应用一般需要的是当前数据,主要考虑较短的响应时间;而分析处理应用需要是历史的、综合的、集成的数据,它的分析处理过程可能持续几个小时,从而消耗大量的系统资源。
人们逐渐认识到直接用事务处理环境来支持DSS是行不通的。
要提高分析和决策的有效性,分析型处理及其数据必须与操作型处理及其数据分离。
必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境。
数据仓库技术正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。
第2章数据仓库,数据仓库基本概念,主要通过以下五点区分开来。
用户和系统的面向性OLTP是面向顾客的,用于事务和查询处理;OLAP是面向市场的,用于数据分析数据内容OLTP系统管理当前数据;OLAP系统管理大量历史数据,提供汇总和聚集机制.数据库设计OLTP采用实体-联系ER模型和面向应用的数据库设计;OLAP采用星型或雪花模型和面向主题的数据库设计.视图OLTP主要关注一个企业或部门内部的当前数据,不涉及历史数据或不同组织的数据;OLAP则相反.访问模式OLTP系统的访问主要由短的原子事务组成.这种系统需要并行和恢复机制;OLAP系统的访问大部分是只读操作,OLTP(on-linetransactionprocessing)与OLAP(On-LineAnalyticalProcessing)区别,第2章数据仓库,第2章数据仓库,数据仓库基本概念,数据仓库与决策支持系统,用户在进行决策制定时需要得到企业各方面的信息,因此用户一般首先根据各个业务部门数据库中的数据,创建数据仓库,存储各种历史信息和汇总信息。
对数据仓库的进一步应用由功能强大的分析工具来实现。
现在主要有三类分析工具可用于决策支持。
第一类能够支持涉及分组和聚集查询,并能够对各种复杂的布尔条件、统计函数和时间序列分析提供支持的系统。
主要由上述查询组成的应用称为联机分析处理,即OLAP。
在支持OLAP查询的系统中,数据最好看成是一个多维数组,第2章数据仓库,数据仓库基本概念,数据仓库与决策支持系统,第二类系统仍为支持传统SQL查询的DBMS,但为了有效地执行OLAP查询而进行了特殊的设计。
这些系统可以看作是为决策支持应用进行了优化的关系数据库系统。
许多关系数据库厂商对他们的产品进行了扩展,并且随着时间的推移,专门的OLAP系统和支持决策支持的关系数据库系统之间的差别将逐渐取消,第2章数据仓库,数据仓库基本概念,第三类的分析工具可用于在大量的数据集合中,找到有意义的数据趋势或者模式,而不是上面提到的复杂数据查询。
在数据分析过程中,尽管分析者能够判定得到的数据模式是否有意义,但是生成查询来得到有意义的模式还是很困难的。
例如,分析者查看信用卡使用记录,希望从中找出不正常的信用卡使用行为,以表明是被滥用的丢失的信用卡;商人希望通过查看客户记录找出潜在的客户来提高收益。
许多应用涉及的数据量很大,很难用人工分析或者传统的统计分析方法进行分析,数据挖掘的目的就是对这种大量数据的分析提供支持。
数据仓库与决策支持系统,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,数据仓库理论的创始人W.H.Inmon在其BuildingtheDataWarehouse一书中,给出了数据仓库的四个基本特征:
面向主题,数据是集成的,数据是不可更新的,数据是随时间不断变化的,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,面向主题,主题是在较高层次上对数据抽象;面向主题的数据组织分为两步骤:
-抽取主题;-确定每个主题所包含的数据内容每个主题在数据仓库中都是由一组关系表实现的,数据仓库基本概念,数据仓库定义及特征,面向主题,第2章数据仓库,数据库,数据库,面向应用,面向主题,汽车,人寿,健康,意外伤害,主题-顾客,主题-保单,主题-索赔,主题-保费,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,集成的,数据仓库的数据是从原有的分散数据库数据中抽取来的需要消除数据表述的不一致性(数据的清洗)数据的综合,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,集成的,数据库环境,数据仓库环境,应用A1,0应用B男,女应用CY,N,集成,映射编码,多维数据库男,女,应用ACM应用BInches应用CCM,映射转换,多维数据库CM,第2章数据仓库,数据仓库基本概念,数据仓库的主要数据操作是查询、分析;不进行一般意义上的数据更新(过期数据可能被删除)数据仓库强化查询、淡化并发控制和完整性保护等技术,数据仓库定义及特征,不可更新的,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,不可更新的,Insert、Update、DeleteSelect,数据库环境数据的逐个记录方式处理,数据仓库环境数据的批量载加载,存取,ETL,访问,第2章数据仓库,数据仓库基本概念,不断增加新的数据内容;不断删除旧的数据内容;定时综合;数据仓库中数据表的键码都包含时间项,以标明数据的历史时期,数据仓库定义及特征,随时间变化的,第2章数据仓库,数据仓库基本概念,数据仓库定义及特征,随时间变化的,数据库环境,数据仓库环境,时间期限:
当前到30-60天记录更新包含或者不包含时间概念,时间期限:
年数据的复杂快照包含时间概念,第2章数据仓库,主要内容,数据仓库基本概念,数据仓库体系结构,数据仓库元数据,数据仓库的数据模式,多维分析,高性能物理数据仓库设计,第2章数据仓库,数据仓库体系结构,用户,可视化工具集,多维分析工具,数据挖掘工具,多维数据,数据仓库,源数据,源数据,源数据,源数据,源数据,数据来源,数据仓库层,数据仓库工具层,数据仓库层次结构,第2章数据仓库,RDBMS,数据文件,其他,综合数据,当前数据,历史数据,元数据,抽取、转换、装载,数据仓库,OLAP工具,DM工具,查询工具,分析工具,数据源,数据仓库体系结构,第2章数据仓库,数据仓库体系结构,数据仓库体系结构实例-税务数据仓库,增量抽取,完全抽取,计算,映射,清洗,业务要求,数据要求,抽取,转换,加载,数据仓库,数据加载,异常情况处理及回退机制,作业控制管理,第2章数据仓库,数据仓库体系结构,数据仓库体系结构实例-税务数据仓库-ETL,第2章数据仓库,OLTP系统,RDBMSSybase,ORACLE,SAP/ERP,5-10年,过去详细数据,当前详细数据,轻度汇总数据,高度汇总数据,数据集市,分析型CRM,业务指标分析,数据仓库,数据仓库/决策分析系统,EXCEL,数据仓库数据的组织,数据仓库体系结构,第2章数据仓库,数据由操作型环境(综合)导入数据仓库数据具有不同的细节早期细节级(过期数据)当前细节级轻度综合数据级(数据集市)高度综合数据级,数据仓库数据的组织,数据仓库体系结构,第2章数据仓库,数据仓库体系结构,采购子系统:
订单(订单号,供应商号,商品号,类别,单价。
数量,总金额,日期,)供应商(供应商号,供应商名,地址,电话,)销售子系统:
客户(客户号,姓名,地址,电话,)销售(客户号,商品号,数量,单价,日期,)库存子系统:
进库单(编号,商品号,数量,单价,日期,)出库单(编号,商品号,数量,单价,日期,)库存(商品号,库房号,类别,单价,库存数量,总金额,日期,),数据库系统模式(操作型数据),第2章数据仓库,数据仓库体系结构,商品固有信息:
商品号,类别,单价,颜色,商品采购信息:
商品号,类别,供应商号,供应日期,单价,数量,商品销售信息:
商品号,客户号,数量,单价,销售日期,商品库存信息:
商品号,库房号,库存数量,日期,),采购子系统,销售子系统,库存子系统,面向主题的数据仓库数据模式,第2章数据仓库,数据仓库体系结构,1996-2002年销售明细表,20032009年销售明细表,20032009年每月销售表,20032009年每季度销售表,数据仓库中的数据组织数据仓库中的数据分为四个级别:
早期细节级,当前细节级,轻度综合级,高度综合级。
第2章数据仓库,数据仓库体系结构,DW中还有一类重要的数据:
元数据(metedata)。
元数据是“关于数据的数据”(RDBMS中的数据字典就是一种元数据)。
数据仓库中的元数据描述了数据的结构、内容、索引、码、数据转换规则、粒度定义等,关于元数据,在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据。
在数据仓库系统中,元数据机制主要支持以下五类系统治理功能:
1描述哪些数据在数据仓库中;2定义要进入数据仓库中的数据和从数据仓库中产生的数据;3记录根据业务事件发生而随之进行的数据抽取工作时间安排;4记录并检测系统数据一致性的要求和执行情况;5衡量数据质量。
第2章数据仓库,数据仓库体系结构,元数据作用及功能,第2章数据仓库,数据仓库体系结构,粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别粒度级越小,细节程度越高,综合程度越低,回答查询的种类越多粒度影响数据仓库中数据量的大小粒度问题是设计数据仓库的一个重要方面双重粒度在数据仓库的细节级上创建两种粒度短期储存的低粒度(真实档案),满足细节查询具有综合的高粒度(轻度综合),做分析,数据仓库的数据组织,第2章数据仓库,数据仓库体系结构,第2章数据仓库,分割是指把数据分散到各自的物理单元中去,以便能分别独立处理,提高数据处理效率。
是粒度之后的第二个主要设计问题两个层次的分割系统层:
DBMS,一种定义应用层:
开发者,多种定义多种分割的标准日期:
最常用的地理位置组织单位.,第2章数据仓库,数据仓库体系结构,数据仓库的数据组织,第2章数据仓库,数据仓库体系结构,主要内容,数据仓库基本概念,数据仓库体系结构,数据仓库元数据,数据仓库的数据模式,多维分析,高性能物理数据仓库设计,第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持:
数据仓库内容的描述;定义数据抽取和转换;基于商业事件的抽取调度;描述数据同步需求;衡量数据质量指标,元数据对数据仓库功能的支持:
(一)数据仓库内容的描述描述数据仓库中的各种复杂关系;
(1)I/O对象:
支持数据仓库I/O操作的各种对象。
例如,装入到数据仓库中的源系统文件及可被用户访问表的数据均为I/O对象。
元数据要描述该I/O对象的定义、类型、状态、存档(刷新)周期以及引发初始存档的事件。
(2)关系:
两个I/O对象之间的关联。
这种关联分为一对一、一对多和多对多三种类型。
在实际工作中,一般只考虑两种类型。
即一对一和一对多的关系,多对多可以用多个一对多来表示。
(3)关系成员描述每个关系中I/O对象的具体角色(在一对多中是父亲还是儿子)、关系度(是一对一还是一对多)及约束条件(是必须满足还是可选关系)。
第2章数据仓库,数据仓库元数据管理,(4)关系关键字描述两个I/O对象是如何建立关联的。
每个关系都是通过I/O对象的关键字来建立的,元数据要指明建立每个关系相应对象的关键字。
(5)域分配将实际数据元素与I/O对象的某个域相关联。
除了常规的域特征外,还要说明每个域的所属源系统及访问日期。
这两个特征对数据仓库都是非常重要的(6)数据元素描述数据仓库中基本单元(字段级)的特征。
这些特征包括定义、类型、长度、值域标识等。
数据元素要能支持多媒体的大二进制对象。
元数据描述了数据仓库中有什么数据及数据间的关系,它们是用户使用和系统管理数据仓库的基础。
基于这种组织的元数据可以开发出各种通用的用户接口,用来支持用户从数据仓库中获取数据。
用户可以提出所需的表,系统从中选择表并得到表之间的关系,重复这个过程直到用户得到他们希望的数据。
不仅如此,系统还有对某一特殊表(I/O对象)及域信息的描述功能。
用这种形式组织的元数据有利于数据仓库的扩充,因此不必修改已存在的软件就可在数据仓库中增加新表。
第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持
(一)数据仓库内容的描述:
描述数据仓库中的各种复杂关系,
(二)定义数据抽取和转换,第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,从源系统数据到数据仓库中目标数据的转移是一项复杂工作,其工作量占整个数据仓库开发的80%。
这里主要涉及到以下两个问题:
(1)抽取工作间的复杂关系,一个抽取要经过许多步骤获取:
从外部或内部源数据系统中获取对决策支持系统用户有用的数据。
过滤:
过滤掉不需要的内容(如上次抽取后一直没有改变的数据)。
验证:
从DSS用户的角度验证数据的质量。
融合:
将本次抽取的数据与数据仓库中的数据进行融合;综合:
对数据进行综合,生成概要级数据。
装载:
把新数据装入到数据仓库中。
存档:
把新装入的数据单独存为一个文件,以便减少更新操作的数据量。
(2)源数据与目标数据之间的映射是一种复杂的多对多关系。
元数据要能够描述这些限制所带来的一系列问题。
这组元数据要定义的内容有以下几点:
抽取工作:
描述每个抽取工作,并为其标识源系统。
每一抽取都应有一个刷新类型代码,一般有四种刷新类型,包括全仓库替换、全仓库附加、更新替换、更新追加。
另外对每一抽取都要明确其刷新周期(两次抽取之间的间隔)和初始触发事件(系统环境中激活第一次抽取的事件)。
抽取工作步:
定义抽取工作中的步骤包括说明每一步的类型(如过滤、验证等)及其作业控制语言(JobControlLanguge,TCL),JCL用来初始化抽取工作步。
抽取表映射:
为每个抽取工作步建立输入文件/表和输出文件/表之间的关联。
它应提供两种类型的属性以满足抽取工作的特殊处理要求。
一类是过程的输入数据集合;另一类是数据处理过程标识及其参数。
这些属性用来自动生成程序代码以完成相应抽取工作步。
抽取域映射:
为每个抽取工作步建立输入表(文件)的域与输出表(文件)的域之间的关联。
其定义的内容与抽取表类似,但是处理的粒度是表中的每个域。
(二)定义数据抽取和转换,第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,记录筛选规则:
提供一种过滤机制,以在抽取工作的每一步骤中进行记录的筛选。
如下是一个规则的例子:
IFRecord.Last_Update_Date1996_11_01ORRecord.Create_Date1996_11_01THENReserve(保留)ELSEDelete(删除)这组元数据可以用来生成源代码以完成数据的转换工作,即完成由操作型数据转换生成以特殊形式存放的、面向主题的数据仓库数据。
元数据中的抽取表映射和抽取域映射定义了进行实际抽取转换工作的过程。
数据仓库管理核心是:
利用该组元数据所定义的抽取过程生成某种语言的源代码,然后编译成可执行的程序以完成数据的抽取工作。
其核心也可直接以解释的方式从元数据存储中读出每个抽取步的处理过程,从而进行数据转换。
(二)定义数据抽取和转换,第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,(三)基于商业事件的抽取调度,第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,抽取调度(ExtractSchedule)是指数据抽取的时间安排,即什么时间进行从源数据到数据仓库的抽取工作。
抽取调度的合理与否对整个数据仓库的有效正常运行影响很大。
元数据必须对数据的抽取安排加以说明。
基于商业事件抽取调度的元数据要定义的内容有以下几点:
事件:
指在公司中能够引发对数据进行处理的各种情况。
其中有些是周期性的,有些是预先安排的,而有些则是突发事件。
事件依赖:
事件之间的关系及描述这些关系的时间规律性和特征。
一般要指明主事件和从事件以及两者的时间间隔和最大容忍时间。
事件日志:
刻画了事件发生的时间安排,即指明事件的调度周期。
系统应允许用户定义事件及相应的调度。
抽取调度:
对一个事件响应后必须完成的对数据抽取工作的安排。
抽取调度把事件和相应的抽取工作联系起来。
抽取日志:
对每次抽取工作进行记录,并记下相关的引发抽取事件及抽取调度。
抽取日志可以用来维护系统工作,如输入和输出工作。
时间戳日志:
记录下各表被抽取的时间及表中被更新的数据。
时间戳日志可以用来与系统数据进行比较以引发抽取工作。
第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,(四)描述数据同步需求,在一个公司各部门间的数据协调中,时间是一个关键因素。
上述的抽取调度是针对熟悉公司各部门之间数据同步关系的用户而言的。
对不熟悉的用户,则需要进一步利用元数据来帮助用户理解数据及数据处理的同步关系,以免误用数据。
尤其当数据仓库中涉及到复杂关系的数据而且抽取调度受多个事件制约时,这种附加数据就更不可缺少。
时间的元数据要定义的内容主要有:
同步视图:
为支持不同级别用户而标识同步数据的时间规则。
同步视图可定义为一个特殊功能视图的名称和描述以及该视图中的一系列表,每个表与有关的事件相关联。
事件及抽取调度如前所述。
同步实例:
当实际事件发生时,记录下不同系统同步数据集合的更新轨迹。
当一个同步视图中的数据都已满足时,元数据管理机制就提醒用户可用的数据已经准备好,系统在抽取调度后生成同步实例。
第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,(五)衡量数据质量,数据仓库把数据从源事务系统移到数据仓库中的目的是用于决策支持。
这就对数据质量提出了新的要求。
若忽视这个问题,则意味着在坏数据上做决策,其风险可想而知。
保证质量的第一步是建立支持商业目标的数据质量期望标准,以及达不到该标准所需冒风险的大小。
下面是一组衡量数据质量的公共参数,包括准确性、完整性、一致性、相关性、时间性、唯一性、有效性。
在评价体系确定以后,问题往往变为是否把有质量问题的数据放进数据仓库中。
这一般由应用本身决定。
对甲用户有用的数据未必对乙用户也有用。
因此元数据必须提供一个机制,即针对特定应用并根据用户确立的数据容忍程度来提醒用户是否采用该数据进行决策。
数据质量的元数据要定义的内容有以下几点:
目标质量特征:
是针对DSS应用的某一数据域质量评价的期望尺度,其基本属性是目标特征值。
实际质量特征:
是针对DSS应用的某一数据域质量评价的实际尺度,其基本属性是实际特征值。
用户描述的VV&C:
针对DSS应用需求,从VV&C(验证、有效、证实)对数据质量进行衡量。
用户功能:
周期地检查针对某一应用的数据是否满足VV&C或目标质量的要求。
另外,这组元数据也应从结构上提供记录一级的管理,用以保证数据质量,消除因不适当使用数据所带来的不一致。
第2章数据仓库,数据仓库元数据管理,元数据对数据仓库功能的支持,(五)衡量数据质量,第2章数据仓库,数据仓库元数据管理,元数据分类,技术元数据业务元数据,技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和治理数据仓库使用的数据。
描述和设计如何访问和处理数据,包括查询、汇总、递交等。
它主要包括以下信息:
1数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;2业务系统、数据仓库和数据集市的体系结构和模式;3汇总用的算法,包括度量和维定义算法,数据粒度、主题领域、聚集、汇总、预定义的查询与报告;4由操作环境到数据仓库环境的映射,包括源数据和它们的内容、数据分割、数据提取、清理、转换规则和数据刷新规则、安全(用户授权和存取控制)。
第2章数据仓库,技术元数据,数据仓库元数据管理,技术元数据示例:
用户报表和查询访问模式、频率和执行时间;审计控制和负载平衡信息;数据的技术结构;提供给DSS的记录系统;源数据字段标识;从操作型记录系统到DSS的映射与转换;编码/引用表转换;物理和逻辑数据模型;DSS表名、键和索引;域值;DSS表结构和属性;数据模型和DSS之间的关系;操作型系统的表结构和属性;抽取历史;DSS表访问模式;DSS归档;工作相关性;程序名和描述;版本维护;安全性;清洗规则等。
第2章数据仓库,数据仓库元数据管理,业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。
业务元数据为DSS分析人员提供了访问DSS底层的数据仓库和数据集市中信息的线路图。
第2章数据仓库,业务元数据,数据仓库元数据管理,业务元数据主要包括以下信息:
使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:
1企业概念模型:
这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。
以这个企业模型为基础,不懂数据库技术和SQL语句的业务人员对数据仓库中的数据也能做到心中有数。
2多维数据模型:
这是企业概念模型的重要组成部分,它告诉业务分析人员在数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。
这里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。
3业务概念模型和物理数据之间的依靠:
以上提到的业务元数据只是表示出了数据的业务视图,这些业务视图与实际的数据仓库或数据库、多维数据库中的表、字段、维、层次等之间的对应关系也应该在元数据知识库中有所体现。
第2章数据仓库,业务元数据,数据仓库元数据管理,业务数据示例:
业务分析员了解的数据结构(与技术用户比较,产品体系对于业务用户的意义有所不同);DSS中信息的常见访问例程;主题领域(例如产品、客户、销售等);表名的业务定义;属性名和业务术语的定义;数据质量的统计信息;DSS字段映射、转换和概要;下钻、上钻、钻过和钻透的规则;域值;数据负责人;数据位置;DSS刷新日期等。
第2章数据仓库,业务元数据,数据仓库元数据管理,元数据源,元数据存储,元数据用户,ETL工具/处理过程,数据建模工具,业务人员/文档,生产系统应用,数据质量工具,其他元数据源,报表和OLAP工具,版本控制/权限管理,数据仓库元数据,技术元数据,业务元数据,操作元数据,业务用户,管理员,开发人员,第2章数据仓库,关于元数据,数据仓库元数据管理,第2章数据仓库,数据仓库元数据管理,元数据主要工具,主要内容,数据仓库基本概念,数据仓库体系结构,数据仓库元数据,数据仓库的数据模式,多维分析,高性能物理数据仓库设计,多维数据建模以直观的方式组织数据,并支持高性能的数据访问。
每一个多维数据模型由多个多维数据模式表示,每一个多维数据模式都是由一个事实表和一组维表组成的。
多维模型最常见的是星形模式。
在星形模式中,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接。
在星型的基础上,发展出雪花模式。
数据仓库的数据模式,第2章数据仓库,数据仓库的数据模式,第2章数据仓库,星型模式(StarSchema)事实表(facttable),存放基本数据,相关主题的数据主体(BCNF)维(dimension),影响、分析主体数据的因素量(measure),事实表中的数据属性维表(dimensiontable),表示维的各种表维是量的取值条件,维用外键表示以事实表为中心,加上若干维表,组成星型数据模式例:
产品-商店-销售额,CustSales,Loca
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 new