基于SQLServer2005的数据仓库构建及OLAP多维分析实验.pptx
- 文档编号:18923363
- 上传时间:2024-02-12
- 格式:PPTX
- 页数:49
- 大小:2.23MB
基于SQLServer2005的数据仓库构建及OLAP多维分析实验.pptx
《基于SQLServer2005的数据仓库构建及OLAP多维分析实验.pptx》由会员分享,可在线阅读,更多相关《基于SQLServer2005的数据仓库构建及OLAP多维分析实验.pptx(49页珍藏版)》请在冰点文库上搜索。
基于SQLServer2005的数据仓库构建与OLAP分析实验2内容提要内容提要一、背景概述一、背景概述基于基于NorthwindNorthwind数据库实现数据仓库构建与数据库实现数据仓库构建与OLAPOLAP分分析析二、准备数据源二、准备数据源三、根据业务需求设计数据仓库三、根据业务需求设计数据仓库四、使用四、使用IntegrationServicesIntegrationServices实现实现数据仓库与数据仓库与ETLETL五、使用五、使用AnalysisServiceAnalysisService实现数据分析实现数据分析3一一背景概述背景概述n20052005年年底底,微微软软公公司司正正式式推推出出SQLServerSQLServer20002000的的后后继继产产品品SQLServerSQLServer20052005。
与与前前一一代代相相比比,SQLServerSQLServer20052005不不仅仅提提供供了了更更加加优优秀秀的的数数据据库库管管理理功功能能,而而且且提提供供了了一一套套完完整整的的数数据据仓仓库库和和数数据据挖挖掘技术的解决方案。
掘技术的解决方案。
nSQLServer2005SQLServer2005负责底层的数据库和数据仓库管理,负责底层的数据库和数据仓库管理,nSQLSQLServerServer20052005集集成成服服务务(SSIS)(SSIS)负负责责数数据据的的抽抽取取、转转换换和和装装载载(ETL)(ETL)nSQLServer2005SQLServer2005分析服务负责分析服务负责OLAPOLAP分析和数据挖掘,分析和数据挖掘,nSQLServer2005SQLServer2005报表服务报表服务(SSRS)(SSRS)负责前端展示。
负责前端展示。
4SQLServerSQLServer数据仓库的数据仓库的BIBI架构架构数据转换数据转换中央数据仓库中央数据仓库信息展现信息展现业务用户业务用户源数据源数据数据数据获取取数据管理数据管理数据使用数据使用项目管理数据仓库实施指导方法论业务规划信息评估逻辑数据模型设计物理数据模型设计数据库管理元数据管理应用开发顾问咨询知识转移TMIS系统系统客运系统客运系统外部信息外部信息MIS系系统抽取转化过滤加载随即查询随即查询报表报表多维分析多维分析数据挖掘数据挖掘Portal集成集成RelationalTransformationOLAPDataMining数据集市SQLServer2005直接用户直接用户(客户端客户端)Olap用户用户Web用户用户应用应用服务器服务器决策者分析员研究员查询人员一一背景概述背景概述5一一背景概述背景概述SSISSSRS报表报表/随即查询随即查询SSASPortalTMIS系统系统客运系统客运系统外部信息外部信息RelationalTransformationOLAPDataMiningSQLServer2005MIS系系统多维分析多维分析/数据挖掘数据挖掘门户集成门户集成ETL工具工具数据转换数据转换中央数据仓库中央数据仓库信息展现信息展现应用系统应用系统源数据源数据数据数据获取取数据管理数据管理数据使用数据使用SQLServerSQLServer数据仓库的数据仓库的BIBI架构架构6一一背景概述背景概述Employee_DimEmployee_DimEmployeeKeyEmployeeID.EmployeeKeyEmployeeKeyTime_DimTime_DimTimeKeyTheDate.TimeKeyTimeKeyProduct_DimProduct_DimProductKeyProductIDProduceNameProductBrandProductCategory.ProductKeyProductKeyCustomer_DimCustomer_DimCustomerKeyCustomerID.CustomerKeyCustomerKeyShipper_DimShipper_DimShipperKeyShipperID.ShipperKeyShipperKeySales_FactSales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeyUnitsPrice.TimeKeyTimeKeyCustomerKeyCustomerKeyShipperKeyShipperKeyProductKeyProductKeyEmployeeKeyEmployeeKey多个外多个外多个外多个外键键事事事事实实维维度度度度键键数据仓库的星型结构数据仓库的星型结构数据仓库的星型结构数据仓库的星型结构7CubeCube多多多多维维数数数数据集据集据集据集源系源系源系源系统统客客客客户户端端端端设计设计数据数据数据数据仓库仓库导导入数据入数据入数据入数据仓库仓库建建建建设设CubesCubes查询查询数据数据数据数据113344查询查询工具工具工具工具报报表表表表分析分析分析分析数据挖掘数据挖掘数据挖掘数据挖掘22数据数据数据数据仓库仓库一一背景概述背景概述8设计设计数据数据数据数据仓库仓库导导入数据入数据入数据入数据仓库仓库建建建建设设CubesCubes查询查询数据数据数据数据11334422CubeCube多多多多维维数数数数据集据集据集据集数据数据数据数据仓库仓库源系源系源系源系统统客客客客户户端端端端查询查询工具工具工具工具报报表表表表分析分析分析分析数据挖掘数据挖掘数据挖掘数据挖掘一一背景概述背景概述9设计设计数据数据数据数据仓库仓库导导入数据入数据入数据入数据仓库仓库建建建建设设CubesCubes查询查询数据数据数据数据11334422CubeCube多多多多维维数数数数据集据集据集据集数据数据数据数据仓库仓库源系源系源系源系统统客客客客户户端端端端查询查询工具工具工具工具报报表表表表分析分析分析分析数据挖掘数据挖掘数据挖掘数据挖掘一一背景概述背景概述10设计设计数据数据数据数据仓库仓库导导入数据入数据入数据入数据仓库仓库建建建建设设CubesCubes查询查询数据数据数据数据11442233CubeCube多多多多维维数数数数据集据集据集据集数据数据数据数据仓库仓库源系源系源系源系统统客客客客户户端端端端查询查询工具工具工具工具报报表表表表分析分析分析分析数据挖掘数据挖掘数据挖掘数据挖掘一一背景概述背景概述11内容提要内容提要一、背景概述一、背景概述基于基于NorthwindNorthwind数据库实现数据仓库构建与数据库实现数据仓库构建与OLAPOLAP分分析析二、准备数据源二、准备数据源三、根据业务需求设计数据仓库三、根据业务需求设计数据仓库四、使用四、使用IntegrationServicesIntegrationServices实现实现数据仓库与数据仓库与ETLETL五、使用五、使用AnalysisServiceAnalysisService实现数据分析实现数据分析二二准备数据源准备数据源打开打开SqlServer2005ManegementStudioSqlServer2005ManegementStudiop查看是否已经存在查看是否已经存在NorthwindNorthwind数据库数据库p如果不存在,通过数据库任务如果不存在,通过数据库任务附加,创建并导入附加,创建并导入NorthwindNorthwind数据库数据库(或运行(或运行instnwnd.sqlinstnwnd.sql即可)即可)p创建新数据库创建新数据库Northwind_DWNorthwind_DW13内容提要内容提要一、背景概述一、背景概述基于基于NorthwindNorthwind数据库实现数据仓库构建与数据库实现数据仓库构建与OLAPOLAP分分析析二、准备数据源二、准备数据源三、根据业务需求设计数据仓库三、根据业务需求设计数据仓库四、使用四、使用IntegrationServicesIntegrationServices实现实现数据仓库与数据仓库与ETLETL五、使用五、使用AnalysisServiceAnalysisService实现数据分析实现数据分析二二根据业务需求设计数据仓库根据业务需求设计数据仓库详见详见“03“03联机分析处理联机分析处理.ppt”.ppt”中的数据仓库案例分析中的数据仓库案例分析包括:
包括:
p了解了解NorthwindNorthwind数据库数据库p明确业务需求(即数据仓库主题)明确业务需求(即数据仓库主题)p识别事实与维度识别事实与维度p设计事实表设计事实表p设计维度表设计维度表p在在Northwind_DWNorthwind_DW中创建相应的事实表与维度表中创建相应的事实表与维度表(或运行(或运行createnorthwinddw.sqlcreatenorthwinddw.sql即可)即可)15内容提要内容提要一、背景概述一、背景概述基于基于NorthwindNorthwind数据库实现数据仓库构建与数据库实现数据仓库构建与OLAPOLAP分分析析二、准备数据源二、准备数据源三、根据业务需求设计数据仓库三、根据业务需求设计数据仓库四、使用四、使用IntegrationServicesIntegrationServices实现实现数据仓库与数据仓库与ETLETL五、使用五、使用AnalysisServiceAnalysisService实现数据分析实现数据分析16三三IntegrationServicesIntegrationServices实现实现数据仓库数据仓库与与ETLETL数据从数据源向目标数据仓库抽取(数据从数据源向目标数据仓库抽取(ExtractExtract)、)、转转换(换(TransformTransform)、)、装载(装载(LoadLoad)的过程的过程p构建数据仓库的重要一环,用户从数据源抽取出所需的数据,构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
加载到数据仓库中去。
p抽取:
将数据从各种原始的业务系统中读取出来。
抽取:
将数据从各种原始的业务系统中读取出来。
p转换:
按照预先设计好的规则将抽取得数据进行转换、清洗,转换:
按照预先设计好的规则将抽取得数据进行转换、清洗,以及处理一些冗余、歧义的数据,使本来异构的数据格式能统以及处理一些冗余、歧义的数据,使本来异构的数据格式能统一起来。
一起来。
p装载:
将转换完的数据导入到数据仓库中。
装载:
将转换完的数据导入到数据仓库中。
17ETLETL举例举例导入合并计算查找二二IntegrationServicesIntegrationServices实现实现数据仓库数据仓库与与ETLETL使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包nSQLSQLServerServer商商务务智智能能开开发发平平台台是是一一个个图图形形工工具具,它它使使创创建建和和编编辑辑SSISSSIS包包的的工工作作变变得得更更加加简简单单和和轻轻松松,而而且且它它提提供供了了比比导导入入,导导出出向向导导更更为为强强大大的的功功能能。
可可以以向向SSISSSIS包包中中添添加加控控制制流流、数数据据流流任任务务和和事事件处理程序。
件处理程序。
nSQLSQLServerServer20052005集集成成服服务务包包(SSISSSIS包包)中中的的控控制制流流由由不不同同类类型型的的控控制制流流元元素素构构造造而而成成:
容容器器、任任务务和和优优先先约约束束。
容容器器提提供供包包中中的的结结构构并并给给任任务务提提供供服服务务,任任务务在在包包中中提提供供功功能能,优优先先约约束束将将容容器器和和任务连接成一个控制流。
任务连接成一个控制流。
nSQLSQLServerServer20052005SSISSSIS包包中中的的数数据据流流由由下下列列不不同同类类型型的的数数据据流流元元素素构构造造而而成成:
提提取取数数据据的的源源、修修改改和和聚聚合合数数据据的的转转换换、加加载载数数据据的的目标以及将数据流组件的输出和输入连接为数据流的路径。
目标以及将数据流组件的输出和输入连接为数据流的路径。
n事事件件处处理理程程序序与与包包类类似似。
事事件件处处理理程程序序可可以以像像包包一一样样为为变变量量提提供供作作用域,并且包含控制流和可选数据流。
用域,并且包含控制流和可选数据流。
使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包1.1.创建包创建包创建创建SSISSSIS包的步骤如下:
包的步骤如下:
(11)打开)打开SQLServerBusinessIntelligenceDevelopmentStudioSQLServerBusinessIntelligenceDevelopmentStudio,使用菜单项文件,使用菜单项文件新新建建项目,新建项目,新建IntegrationIntegrationServicesServices项目,将名称修改为项目,将名称修改为“订单订单数据集成数据集成”,并选择项目,并选择项目保存位置,创建同名解决方案。
保存位置,创建同名解决方案。
使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包1.1.创建包创建包(22)可使用菜单视图可使用菜单视图解决方案资源管理器,查看已经创建的解决方案。
右键删除解决方案资源管理器,查看已经创建的解决方案。
右键删除SSISSSIS包中包中的默认包,并右键创建新包的默认包,并右键创建新包“NorthwindtoDW”“NorthwindtoDW”“创建包创建包”对话框对话框使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包1.1.创建包创建包(33)在集成服务项目对话框中,可以向包中添加控制流、数据流任务和事件处理程序。
)在集成服务项目对话框中,可以向包中添加控制流、数据流任务和事件处理程序。
如如控制控制流设计器用来创建包中的控制流。
工具箱的流设计器用来创建包中的控制流。
工具箱的“控制流项控制流项”节点列出多种类型的任务和容器节点列出多种类型的任务和容器“创建包创建包”对话框对话框使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包2.2.定义和设置数据转换任务定义和设置数据转换任务(11)创建源数据连接:
创建源数据连接:
右键单击连接管理器区域中的任意位置,再单击右键单击连接管理器区域中的任意位置,再单击“新建新建OLEDBOLEDB连接连接”。
在在“配置配置OLEDBOLEDB连接管理器连接管理器”对话框中,单击对话框中,单击“新建新建”。
在。
在“服务器名称服务器名称”中,输入本地服务器名中,输入本地服务器名称或输入称或输入localhostlocalhost,在,在“配置配置OLEDBOLEDB连接管理器连接管理器”对话框的对话框的“数据连接数据连接”窗格中,确认选择了相窗格中,确认选择了相应的服务器及数据库应的服务器及数据库NorthwindNorthwind“SQLServer连接管理器连接管理器”对话框对话框配置配置OLEDB连接管理器窗口连接管理器窗口使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包2.2.定义和设置数据转换任务定义和设置数据转换任务(22)创建目标数据连接:
创建目标数据连接:
右键单击连接管理器区域中的任意位置,再单击右键单击连接管理器区域中的任意位置,再单击“新建新建OLEDBOLEDB连接连接”。
在。
在“配置配置OLEDBOLEDB连接管理器连接管理器”对话框中,单击对话框中,单击“新建新建”。
在。
在“服务器名称服务器名称”中,输入本地服务器中,输入本地服务器名称或输入名称或输入localhostlocalhost,在,在“配置配置OLEDBOLEDB连接管理器连接管理器”对话框的对话框的“数据连接数据连接”窗格中,确认选择了窗格中,确认选择了相应的服务器及数据库相应的服务器及数据库Northwind_DWNorthwind_DW“SQLServer连接管理器连接管理器”对话框对话框配置配置OLEDB连接管理器窗口连接管理器窗口使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包2.2.定义和设置数据转换任务定义和设置数据转换任务(33)为源数据和目标数据创建了连接管理器后,)为源数据和目标数据创建了连接管理器后,下一个任务是在包中添加一个数据流任务。
下一个任务是在包中添加一个数据流任务。
具体如下:
具体如下:
向包中添加一个向包中添加一个数据流源数据流源并对其进行配置并对其进行配置(必选)(必选)。
向包中添加一个向包中添加一个数据流转换数据流转换并对其进行配置并对其进行配置(可选)(可选)。
向包中添加一个向包中添加一个数据流目标数据流目标并对其进行配置并对其进行配置(必选)(必选)。
则数据流任务可表示为则数据流任务可表示为下图下图所示。
所示。
使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包2.2.定义和设置数据转换任务定义和设置数据转换任务(33)为源数据和目标数据创建了连接管理器后,)为源数据和目标数据创建了连接管理器后,一个数据流任务完成对一张表一个数据流任务完成对一张表/视图的转换操作视图的转换操作完成对多张表的转换操作需要多个数据流任务完成对多张表的转换操作需要多个数据流任务可在控制流中创建多个数据流任务,如下图所示可在控制流中创建多个数据流任务,如下图所示双击控制流中的某个数据流任务,可进入对应的数据流任务设计窗口双击控制流中的某个数据流任务,可进入对应的数据流任务设计窗口使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包2.2.定义和设置数据转换任务定义和设置数据转换任务(44)对对包进行调试和运行。
包进行调试和运行。
若执行控制流中的单个任务,则选中该任务,右键,执行任务若执行控制流中的单个任务,则选中该任务,右键,执行任务若运行整个包,则选中解决方案资源管理器中的若运行整个包,则选中解决方案资源管理器中的SSISSSIS包,右键,执行包任务;或点击工具栏中的包,右键,执行包任务;或点击工具栏中的绿色三角形按钮进行调试运行,运行成功则控制流中的任务显绿色,失败显红色,正在运行显黄色绿色三角形按钮进行调试运行,运行成功则控制流中的任务显绿色,失败显红色,正在运行显黄色使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包3.3.定义和设置多任务定义和设置多任务n如果包中包含两个或更多任务,如果包中包含两个或更多任务,则可以通过将它们的连接线从一则可以通过将它们的连接线从一项拖动到其他项而将它们连接成项拖动到其他项而将它们连接成控制流。
两个项之间的连接器表控制流。
两个项之间的连接器表示优先约束。
优先约束定义了两示优先约束。
优先约束定义了两个连接项之间的关系。
它指定了个连接项之间的关系。
它指定了运行时任务的执行顺序以及任务运行时任务的执行顺序以及任务的运行条件。
例如,优先约束可的运行条件。
例如,优先约束可以指定某任务必须成功,才能运以指定某任务必须成功,才能运行控制流中的下一个任务。
行控制流中的下一个任务。
n如果在前面的数据转换任务成功如果在前面的数据转换任务成功完成后,需要完成另一个任务完成后,需要完成另一个任务“执行执行T-SQLT-SQL语句语句”,则在控制流,则在控制流界面中,可将这两个任务连接成界面中,可将这两个任务连接成控制流,。
控制流,。
使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包3.3.定义和设置多任务定义和设置多任务n双击两个任务之间的连接线,打开双击两个任务之间的连接线,打开“优先约束编辑器优先约束编辑器”窗口。
在此窗口中可定义两个连接项之窗口。
在此窗口中可定义两个连接项之间的关系,例如前一个任务执行成功后,可执行后一个任务。
间的关系,例如前一个任务执行成功后,可执行后一个任务。
n双击双击“执行执行T-SQLT-SQL语句语句”任务图标,可编辑要执行的任务图标,可编辑要执行的T-SQLT-SQL语句。
点击语句。
点击“确定确定”按钮完成编辑。
按钮完成编辑。
“优先约束编辑器优先约束编辑器”窗口窗口编辑编辑“执行执行T-SQL语句语句”任务窗口任务窗口使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包44.实验任务要求实验任务要求n可在控制流设计中:
可在控制流设计中:
n首先,创建一个首先,创建一个“执行执行T-SQLT-SQL语句语句”任务任务,将任务重命名为,将任务重命名为“createTables”“createTables”;其;其T-SQLT-SQL语句语句,即为创建即为创建Northwind_DWNorthwind_DW中的各个表中的各个表(如果数据库中已创建表,这一步就不做如果数据库中已创建表,这一步就不做)n其次,创建一系列的针对维表的数据流转换任务,用于将其次,创建一系列的针对维表的数据流转换任务,用于将northwindnorthwind中的相应数据抽取到中的相应数据抽取到northwind_DWnorthwind_DW相应维表中。
相应维表中。
n最后,创建一个针对事实表的数据流流转换任务,用于将最后,创建一个针对事实表的数据流流转换任务,用于将northwindnorthwind中的相应数据抽取到中的相应数据抽取到northwind_DWnorthwind_DW相应事实中。
相应事实中。
n按照任务创建次序,顺序连接已创建的各个任务按照任务创建次序,顺序连接已创建的各个任务n调试并执行整个包调试并执行整个包使用使用SQLServerSQLServer图形设计界面来创建图形设计界面来创建SSISSSIS包包44.实验任务要求实验任务要求n实验结果:
实验结果:
31内容提要内容提要一、背景概述一、背景概述基于基于NorthwindNorthwind数据库实现数据仓库构建与数据库实现数据仓库构建与OLAPOLAP分分析析二、准备数据源二、准备数据源三、根据业务需求设计数据仓库三、根据业务需求设计数据仓库四、使用四、使用IntegrationServicesIntegrationServices实现实现数据仓库与数据仓库与ETLETL五、使用五、使用AnalysisServiceAnalysisService实现数据分析实现数据分析32CubeCube多维数多维数多维数多维数据集据集据集据集源系统源系统源系统源系统客户端客户端客户端客户端设计数据仓库设计数据仓库导入数据仓库导入数据仓库建设建设CubesCubes查询数据查询数据113344查询工具查询工具查询工具查询工具报表报表报表报表分析分析分析分析数据挖掘数据挖掘数据挖掘数据挖掘22使用使用AnalysisServiceAnalysisService实现数据分析实现数据分析33“嘿2003年4月份我在北京卖掉了价值十万美元的可乐”Region
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 SQLServer2005 数据仓库 构建 OLAP 多维 分析 实验