景淼淼毕业设计论文1610修改后2DOC.docx
- 文档编号:2668876
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:56
- 大小:744.05KB
景淼淼毕业设计论文1610修改后2DOC.docx
《景淼淼毕业设计论文1610修改后2DOC.docx》由会员分享,可在线阅读,更多相关《景淼淼毕业设计论文1610修改后2DOC.docx(56页珍藏版)》请在冰点文库上搜索。
景淼淼毕业设计论文1610修改后2DOC
密级
学号
080606126
院、(系)
计算机科学与
工程学院
题目:
数据仓库的多维分析展现技术
研究与应用
学位申请人:
景淼淼
指导教师:
王淑蓉
学科专业:
软件工程
学位类别:
工学学士
2012年06月
本科毕业设计(论文)
题目:
数据仓库的多维分析展现技术
研究与应用
院(系):
计算机科学与工程学院
专业:
软件工程
班级:
080606
学生:
景淼淼
学号:
080606126
指导教师:
王淑蓉
2012年6月
西安工业大学毕业设计(论文)任务书
院(系)计算机科学与工程学院专业软件工程班080606姓名景淼淼学号080606126
1.毕业设计(论文)题目:
数据仓库的多维分析展现技术研究与应用
2.题目背景和意义:
计算机网络与数据库技术的迅猛发展和广泛应用,各种类型、各行业的公司为适应激烈的市场竞争以及新经济的发展形式,纷纷利用互联网武装自己,不断地寻求企业的自我发展与壮大。
随着企业拥有的数据源不断的增多,如何对这些复杂的事务型数据进行在线分析处理,从中得到面向各个主题的统计信息和决策信息,并将查询分析结果以一种简单易懂的方式展现给管理人员,使得管理人员及时掌握企业运营情况制定出正确的决策,是企业迫切需要解决的问题。
随着中国电子商务的启动,电子商务己经成为企业加强资源整合和开拓国内外市场的重要手段。
目前国内具有商务智能分析的电子商务平台还为数不多,大多数的商务智能产品和解决方案多是由国外企业提供的。
按照国外大企业提供的解决方案和方法开发商务智能分析电子商务产品需要投入大量资金和人力资源,由于源代码是封装好的,无法实现与现有电子商务系统的按需改造和整合。
为了节约购买昂贵的国外商务智能分析产品的资金,更为了开发适合国内具体商业需求的多维分析产品,结合企业的具体商业应用需求,我们提出了电子商务平台下的多维分析理论和应用研究。
3.设计(论文)的主要内容(理工科含技术指标):
(1)结合实际项目的具体业务需求,提出从建立多维数据集进行数据多维分析到前端数据展现的一套OLAP管理及应用开发的解决方案,并开发和实现基于连锁超市的多维分析展现系统。
基于连锁超市的多维分析展现系统提供了完善的多维分析功能,基于Web环境下,用户可完成旋转、上卷/下钻、切片/切块等OLAP操作,并将结果以统计图表的形式展现,支持导出PDF、EXCEL等文件。
决策人员能够方便及时地对数据做查询分析处理,既实现了商务智能需求,也达到了为企业制定决策分析提供量化依据和数据支持的目的。
(2)书写1.5万字的论文,要求书写整齐规范,无从错误有创见。
(3)完成与专业相关的3000字以上的外文资料的翻译,翻译应与原文意思相一致,语通顺。
设计的基本要求及进度安排(含起始时间、设计地点):
基本要求:
(1)要求学生每周与指导教师联系一次,及时反映问题,及时解决。
(2)在校设计期间,遵守校纪校规,外出要请假。
(3)保持实验室卫生整洁,爱护设备。
_
进度安排:
_第1—4周:
搜集有关资料,通过对课题的论证,分析,确定总体设计方案。
_第5—7周:
学习相关技术。
_第8--14周:
完成《基于连锁超市的多维分析展现系统》。
第15--17周:
编写毕业论文。
第18周:
毕业论文答辩。
5.毕业设计(论文)的工作量要求
①实验(时数)*或实习(天数):
②图纸(幅面和张数)*:
③其他要求:
指导教师签名:
年月日
学生签名:
年月日
系(教研室)主任审批:
年月日
说明:
1本表一式二份,一份由学生装订入附件册,一份教师自留。
毕I-2
2带*项可根据学科特点选填。
数据仓库的多维分析展现技术研究与应用
摘要
由于信息技术的迅速发展和企业管理决策支持的迫切需要,基于Web的电子商务环境下的多维分析展现系统成为电子商务系统的重要组成部分。
如何设计出满足企业实际需求的电子商务多维分析展现系统,成为分析人员要解决的重要问题。
通过对数据仓库和联机分析处理(OnLineAnalysisprocessing,OLAP)技术的学习,提高在Web条件下OLAP分析的效率,增加系统的交互性、高效性、可维护性具有重大的现实意义。
由于企业数据量的增加,为了方便于企业决策人员制定方案,本课题主要采用数据仓库和联机分析处理技术,对企业数据进行分析;并通过Mondrian这个开源工具来实现web上的多维数据展现。
利用该方案设计实现多维分析展现系统,实现Web环境下联机分析处理,满足旋转、钻取、切片、切块等OLAP分析操作,提高多维分析展现系统的查询分析效率,并与现有办公自动化软件的无缝结合。
本课题主要研究OLAP联机分析处理技术,以及MDX多维查询语言,并学习开源的Mondrian前端展现技术。
本课题利用数据仓库和联机分析处理技术,结合商业的具体需求,设计了主题数据仓库,创建了用于多维分析的多维数据集。
重点对多维数据的展现做了研究,并通过平面以及三维图形展现了结果,为企业决策人员制定方案提供了依据。
关键词:
数据仓库;多维分析;联机分析处理
TheResearchandApplicationsonMultidimensionalAnalysisspreadtechnologyofDataWarehouse
Abstract
AnurgentneedfortherapiddevelopmentofITandbusinessmanagementdecisionsupport,becomeanimportantpartofe-commercesystemsbasedonthemulti-dimensionalanalysistoshowthesystemenvironmentofe-commerceWeb.Itbecomeanimportantproblemneededtobesolvedthathowtodesignthemulti-dimensionalanalysisdisplaysystemtosatisfyenterprise'spracticalrequirements.Throughthestudyofthebasictheoryofdatawarehouse,onlineanalyticalprocessing(OLAP),toimprovetheefficiencyofOLAPanalysisUndertheconditionsofweb,toincreasetheoftheInteractiveofthesystem、Efficiency、Maintainabilityisofgreatpracticalsignificance.
Fortheincreasmentintheamountofenterprisedata,Inordertofacilitatecorporatedecision-makerstodevelopprograms,Themainsubjectofdatawarehousingandonlineanalyticalprocessing,andanalysisofenterprisedata;ByMondrianopensourcetoolstoachievemulti-dimensionaldataispresentedontheweb.Thedatawarehousesystemofmulti-.dimensionalanalysisshowisimplementedbasedontheprevioussolution,whichcanachieveonlineanalyticalprocessingtoconduct,rotation,drilldown.slice,scrollerandotheroperationsbasedonWeb.Thesystemimprovedtheefficiencyofqueryandintegratedwithofficeautomationsoftwareseamlessly.Themainsubjectofonlineanalyticalprocessing(OLAP)technology,MDX,andLearningtheopensourceMondrianfront-enddisplaytechnology.
Basedondatewarehouse,on-lineanalyticalprocessingtechnologyandspecific
businessrequirements,designingthedatawarehouse,creatingthecubeofmulti-dimensionalanalysis.Thisthesismainlystudiedmulti-dimensionaldatashow.Andthroughthe2Dand3Dgraphicpresentationofthemulti-dimensionalanalysisoperationresults,thesystemprovidesthesupportforenterprisedecisionmakers.
Keywords:
DataWarehouse;MultidimensionalAnalysis;OLAP
1绪论
1.1课题设计的背景
信息技术和数据库技术的迅猛发展,推动了数据仓库技术在电子商务中的广泛应用,使得企业管理进入了崭新的时代。
然而,越来越多的企业认识到,只有充分利用挖掘现有的数据,才能最大的实现企业效益。
大多数企业并不缺乏数据,而是受阻于数据冗余和不一致。
因此,各个企业为了在竞争日益激烈的市场环境下保持自己的竞争优势,纷纷利用互联网武装自己,不断地寻求企业的自我发展与壮大。
数据仓库技术在电子商务中便获得了大的发展空间。
数据仓库技术的发展将我们从简单的批处理、联机事务处理的信息处理时代带入了联机分析处理、数据仓库和数据挖掘的信息分析时代。
联机分析处理(OnLineAnalysisprocessing,OLAP)等应用推动了数据仓库技术更好的发展,反过来,数据仓库技术的发展又促进了OLAP的发展。
由于企业拥有的数据源不断的增多,如何对这些复杂的数据进行在线分析处理,并从中得到面向各个主题的统计信息和决策信息,最终将查询分析结果以简单易懂方式展现给决策人员,使得决策人员及时掌握企业运营情况,以便制定出正确的决策。
传统的联机事物处理(On-lineTransactionProcessing,OLTP)不能满足管理决策人员的这种需求,在这种情况下,联机分析处理(OLAP)技术发展起来了。
OLAP是针对特定问题的联机数据访问和数据分析而产生的一种技术,具有快速性、可分析性、多维性、信息性等特点。
OLAP侧重于数据仓库中数据分析,并将其转化成辅助决策新信息,满足决策支持以及多维环境的特定查询和报表需求,因此,OLAP既可以说是一种软件技术也可以说是多维数据分析工具的集合。
OLAP在数据仓库基础上进行的数据分析处理,它与数据仓库结合为解决从数据到信息这个难题提供了理论支持,使用户能够从多维度、多层次深入理解数据,实现了对决策人员的决策支持。
1.2课题设计的目的和意义
数据仓库的目的是为了更好的支持决策过程,建立一个体系化的数据存储环境,将分析决策的大量数据从传统的操作环境中分离出来,是分散的、不一致的操作数据转换成集成的、统一的信息,存储在数据仓库中。
OLAP具有广阔的市场前景,各企业纷纷利用OLAP技术对各种业务进行数据多维分析。
OLAP可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并以直观的、容易理解的形式将查询结果提供给各种决策人员,使他们能够迅速、准确地掌握企业的运营情况,了解市场的需求。
从系统结构上说,目前比较流行的是B/S结构的应用系统。
B/S结构的应用系统不需要预先安装客户端软件,不同语言编
写的程序、运行在不同平台上的应用程序都可以直接从Web上访问数据,具有高效的系统可维护性。
因此,对于构建一个基于Web环境的电子商务多维分析展现系统,解决在Web条件下OLAP分析的效率,增加系统的交互性、高效性、可维护性的应用与研究具有重大的现实意义。
1.3课题的主要研究工作
本课题结合实际项目的具体业务需求,提出从建立多维数据集进行数据多维分析到前段数据展现一套OLAP管理及应用开发的解决方案,并开发和实现基于连锁超市的多维分析展现系统。
本课题主要研究数据仓库的多维分析展现技术,使用sql2008作为数据库服务器,采用开源的Mondrian作为OLAP引擎,并且使用Jpivot前端展现技术进行数据的多维展现,对企业进行多角度的分析决策。
系统的应用层采用B/S结构,主要结合OLAP(联机分析处理)技术以及OLAP中的上卷、下钻、旋转、切片、切块等操作。
2课题中涉及的关键技术
2.1数据仓库的介绍
2.1.1数据仓库的概念及特点
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。
数据仓库研究和解决从数据库中获取信息的问题。
数据仓库的特征在于面向主题、集成性、稳定性和时变性。
数据仓库之父WilliamH.Inmon在1991年出版的“BuildingtheDataWarehouse”一书中所提出的定义被广泛接受——数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、随时间变化的(TimeVariant)、非易失性(Non-Volatile)的数据集合,用于支持管理层的决策(DecisionMakingSupport)过程。
从WilliamH.Inmon关于数据仓库的定义中可以发现,数据仓库具有这样一些重要的特征:
面向主题性、数据集成性、数据的时变性、数据的非易失性、数据的集合性和支持决策作用。
面向主题性表示了数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一个主题组织展开的。
由于数据仓库的用户大多是企业的管理决策者,这些人所面对的往往是一些比较抽象的、层次较高的管理分析对象。
数据仓库的集成性是指根据决策分析的要求,将分散于各个处的源数据进行抽取、筛选、清理、综合等工作,使数据仓库中的数据具有集成性。
数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
2.1.2数据仓库的体系结构
数据仓库的不同部分组合在一起就组成了数据仓库的体系结构。
体系结构提供了开发和部署数据仓库的整体框架结构;它是一个全面的蓝图。
体系结构定义了标准、衡量指标、通用设计和支持的技术。
从数据仓库的概念结构来看,应该包含:
数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种
管理工具和应用工具,如图2.1所示。
数据仓库创建以后,首先要从数据源中抽取所需要的数据到数据准备区,在数据准备区中经过数据的净化处理,再加载到数据仓库数据库中,最后再根据用户的需求将数据发布到数据集市/知识挖掘中。
当用户使用数据仓库时,可以通过OLAP等数据仓库应用工具向数据集市/知识挖掘库或数据仓库进行决策查询分析或知识挖掘。
图2.1数据仓库的概念结构
2.1.3数据仓库的数据模型
数据仓库模型在数据仓库中,你可以在两种基本的数据建模方式中选择一种:
关系型的或者多维型的。
关系模型能够满足数据仓库给定的所有主要需求,最适合用于反映企业的业务规则。
关系模型可以被构造成面向主题的,并且能提供支持未来集成的结构。
同时,还可以将“时间”这一元素添加到实体键中,从而轻松地处理历史信息。
而且,关系型结构能够中立地为所有类型的数据集市提供数据源,而不仅仅是支持OLAP数据集市。
而多维型降低了范式化,通过维模型开发分析主题并以分析主题作为框架组织数据,系统实施过程短,取得投资回报快,还可以在取得实际效果的基础上,继续增加应用主题,逐步建立起企业级数据仓库。
多维数据模型包括星型模型和雪花模型。
星型模型是最常用的数据仓库设计结构的实现模式。
使数据仓库形成了一个集成系统,为用户提供分析服务对象。
核心是事实表,围绕事实表的是维度表。
通过事实表将各种不同的维度表连接起来,各个维度表都连接到中央事实表,如图2.2所示。
雪花模型是对星型模型的扩展,每一个维度都可以向外连接到多个详细类别表。
在这种模式中,如图2.3所示,维度表除了具有星型模型中维表的功能外,还连接上对事实表进行详细描述的详细类别表,详细类别表通过对事实表在有关维上的详细描述达到了缩小事实表、提高查询效率的目的。
雪花模型对星型模型的维度表进一步标准化,对星型模型中的维度表进行了规范化处理。
图2.2星型模型的结构示意图
图2.3雪花模型的结构示意图
2.2联机分析处理技术
2.2.1OLAP概念及特点
在线分析处理或联机分析处理(线分析的处理上的OLAP)是一个应用广泛的数据仓库使用技术。
它可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并以直观的、容易理解的形式将查询结果提供给各种决策人员,是他们能够迅速、准确地掌握企业的运营情况,了解市场的需求。
OLAP技术主要有两个特点:
一是在线性(On-Line),表现为对用户请求的快速响应和交互式操作,它的实现是由客户机/服务器体系结构完成的;二是多维分析(Multi_Analysis),这也是OLAP技术的核心所在。
系统能够提供对数据分析的多维视图和多维分析,包括对层次维和多重层次维的支持。
事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。
此外OLAP还具有快速性、可分析性、信息性的特点。
因为用户对OLAP的快速反应能力有很高的要求,需求系统能在数秒内对用户的多数分析要求作出反应。
因此快速性也是OLAP的一个重要特点。
此外OLAP还具有良好的可分析性,OLAP系统能处理与应用有关的逻辑及统计分析。
而不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大量信息。
2.2.2OLAP的数据结构
OLAP的具体实现方案通常采用三层客户/服务器结构如图2.4所示。
第一层是数据仓库服务器,它实现与基层运营的数据库系统的连接,完成企业级数据一致和数据共享的工作;第二层是OLAP服务器,它根据最终客户的请求实现分解成OLAP分析的各种分析动作,并使用数据仓库中的数据完成这些动作;第三层是前端的展现工具,用于将OLAP服务器处理得到的结果用直观的方式,如多位报表、饼图、柱状图、三维图形等展现给最终用户。
图2.4OLAP的三层客户/服务器结构图
这种三层体系结构使用数据、应用逻辑和客户应用分离开,有利于系统的维护和升级。
当系统需要修改功能或者增加功能时,可以只修改三层中的某些部分,而不需要向两层的客户/服务器体系那样做整体的改动。
2.2.3OLAP操作
OLAP的操作是指对多维数据集中的数据用切片、切块和旋转、上卷、下钻等方式分析数据,使用户能够多角度、多侧面地去观察数据仓库中的数据。
这样才能深入地了解数据仓库中数据所蕴含的信息,才能使用户深入地挖掘隐藏在数据背后的商业模式。
在多维分析过程中,如果对多维数据集的某一个维选定一位成员,这种选择操作,就可以称为切片(slice)。
也就是说如果有多维数据集,对维i选定了某个维成员,那么就是多维数据集在维i上的一个切片。
这种切片的数量完全取决于维i上维成员的个数,如果维数越多,可以做的切片也就越多。
在切片的概念中,有两个重要的概念必须掌握:
一个是多维数据集的切片数量的多少是由所选定的那个维的维成员数量的多寡所决定的;另一个是进行切片操作的目的是使人们能够更好地了解多维数据集,通过切片的操作可以降低多维数据集的维度,使人们能够将注意力集中在较少的维度上进行观察,也就是说能够将注意力集中在经营管理中所感兴趣的影响因素上对经营管理中的问题进行分析。
与切片类似,如果在一个多维数据集上对两个及两个以上的维选定为成员的操作可以成为切块。
切块操作也可以看成是进行了多次切片操作之后,将每次切片操作所得到的切片重叠在一起形成的。
在对数据仓库中的多维数据集进行显示操作过程中,用户常常希望能够对多维数据集改变其显示的维方向,也就是说进行多维数据集的旋转(rotate)操作。
在OLAP分析中,还有“上卷”(roll_up)、“下钻”(drill_down)、“钻过”(drill_across)和“钻透”(drill_through)等钻取操作。
“上卷”是指沿某一个维的概念分层向上归约;“下钻”是上卷的逆操作,它是沿某一个维的概念分层向下或引入新的维来实现;“钻过”是指对多个事实表进行查询;“钻透”是指对立方体操作时,利用数据库关系,钻透立方体的底层,进入后端的关系表。
2.3Schema
Schema定义了一个多维数据库。
包含了一个逻辑模型,而这个逻辑模型的目的是为了书写MDX语言的查询语句。
这个逻辑模型实际上提供了这几个概念:
Cubes(立方体)、维度(Dimensions)、层次(Hierarchies)、级别(Levels)、和成员(Members)。
而一个schema文件就是编辑这个schema的一个xml文件。
在这个文件中形成逻辑模型和数据库物理模型的对应。
Cubes:
一个Cube是一系列维度(Dimension)和度量(Measure)的集合区域。
在Cube中,Dimension和Measure的共同地方就是共用一个事实表。
Cube中的有以下几个属性:
属性名
含义
name
Cube的名字
caption
标题,在表示层显示的
cache
是否对Cube对应的实表用mondrian进行存储,默认为true
enabled
是布尔型的,如果是被激活,Cubes就执行,否则就不予理
睬,默认为true
Cube里面有一个全局的标签定义了所用的事实表的表名。
Dimensions:
他是一个层次(Hierarchies)的集合,维度一般有其相对应的维度表,他的组成是由层次(Hierarchies)而层次(Hierarchies)又是由级别(Level)组成。
其属性如下:
属性名
含义
name
Dimen
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 景淼淼 毕业设计 论文 1610 修改 DOC
![提示](https://static.bingdoc.com/images/bang_tan.gif)