大数据教学课件:第7章 大数据可视化工具.pptx.pptx
- 文档编号:18905752
- 上传时间:2024-02-10
- 格式:PPTX
- 页数:55
- 大小:4.92MB
大数据教学课件:第7章 大数据可视化工具.pptx.pptx
《大数据教学课件:第7章 大数据可视化工具.pptx.pptx》由会员分享,可在线阅读,更多相关《大数据教学课件:第7章 大数据可视化工具.pptx.pptx(55页珍藏版)》请在冰点文库上搜索。
高级大数据人才培养丛书之一,大数据挖掘技术与应用BIGDATA大数据可视化第七章大数据可视化工具高级大数据人才培养系列教材of6227.17.2Processing7.3NodeXL7.4ECharts习题7.5TableauExcel7.1Excel第七章大数据可视化工具大数据可视化工具有很多种,本章从使用者的角度介绍一些常见的、便于使用的数据可视化工具,如Excel、Processing、NodeXL、ECharts、Tableau等。
众所周知,Excel是MicrosoftOffice中的一款电子表格软件。
该软件通过工作簿(电子表格集合)来存储数据和分析数据。
Excel可生成诸如规划、财务等数据分析模型,并支持编写公式来处理数据和通过各类图表来显示数据。
在Excel2016后,更是有内置PowerQuery插件、管理数据模型、预测工作表、PowerPrivot、PowerView和PowerMap等数据查询分析工具。
在此,仅以PowerMap软件为例,来进行简要介绍。
of6237.1Excel第七章大数据可视化工具of6247.1.1PowerMap简介Excel是典型的入门级数据可视化工具,但同时,它也支持3D的可视化展示。
微软发布了一款叫做GeoFlow的插件,它是结合Excel和Bing地图所开发出来的3D数据可视化工具。
GeoFlow的概念最早提出于2011年6月,据悉可以支持的数据行规模最高可达100万行,并可以直接通过Bing地图引擎生成可视化3D地图。
曾经引起广泛讨论的PowerMap(原名为GeoFlow)最近进行了更新,3D视觉插件如今可视化已经成为MicrosoftPowerBIinExcel核心商业智能功能。
新版本PowerMap提供Bing地图自动数据采集,并可生成更为人性化的细节分类。
目前,PowerMap已经开放了CreateVideo功能,可以将3D画面演示过程记录下来。
7.1Excel第七章大数据可视化工具of625启动Excel,在插入菜单的“演示”功能区中,选择“三维地图”功能,启动PowerMap窗口。
PowerMap窗口组成:
(1)地图可视化区域
(2)任务面板(3)演示编辑区(4)PowerMap功能区(5)PowerMap信息条PowerMap窗口7.1.2PowerMap使用7.1Excel第七章大数据可视化工具of626数据加载:
(1)在打开PowerMap的窗口后,在Excel的Sheet中选择所要进行可视化的数据。
(2)点击“三维地图”下方的“将选定数据添加到三维地图”功能项,将数据加载到地图区域中。
这时,在三维地图中的字段列表中,就可以看到所要可视化的字段。
(3)将地理位置字段拖动到“任务面板”的“位置”框内,或者在“位置”框内点击添加字段,选择所要添加的地区。
并在地区后的位置下拉列表中,选择经度、纬度、x坐标、y坐标、城市、国家/地区、县市、省/市/自治区、街道等某一选项。
若是经度和纬度等多项地理位置坐标,可继续添加字段。
7.1Excel第七章大数据可视化工具of627数据加载:
(4)在任务面板的“高度”框内,选择所要可视化的数值字段。
(5)若所要表达的数据中有“类别”和“时间”信息,可在任务面板的“类别”和“时间”框内,继续添加字段。
当然,出于数据筛选的需要,可以在任务面板中对某一个字段添加筛选器。
由于PowerMap采用图层方式管理和展现数据,因此可以根据数据的实际情况添加图层,同时,可以设置所在图层的大小、不透明度、颜色、显示值等属性。
7.1Excel第七章大数据可视化工具of628数据显示:
(1)堆积柱形图
(2)簇状柱形图(3)气泡图(4)热度地图(5)区域图7.1Excel第七章大数据可视化工具of629动态显示:
若PowerMap所获取的数据字段中有日期、时间类型的数据,可以将这些数据拖动到“时间”框中,就可以在地图可视化区域内形成一个时间进度条。
点击“播放”按钮,则可按照时间将数据的变化情况逐一显示出来。
地图可视化区域控制:
在该区域中,可以利用鼠标点击箭头实现三维地球的转动,也可以利用+和-按钮,实现三维地球的放大和缩小。
另外,通过地图功能模块中的“平面地图”功能,可将三维球状模式的地图改为平面模式的地图,以便数据的观察。
7.1Excel第七章大数据可视化工具of6210数据可视化示例:
以2002年-2013年的中国各省人口数量为例
(1)下载数据,并在Excel中整理为“地区”、“人口数”、“日期”三个字段,存储数据
(2)打开三维地图,点击“三维地图”下方的“将选定数据添加到三维地图”功能项,将所有数据加载到地图区域中(3)相关设置,选择区域图显示数据,添加地区字段到“位置”框内,添加人口数字段到“值”框内,添加日期到“时间”框内(4)在地图可视化区域内,设置为平面地图模式,通过点击箭头和鼠标拖动,调节角度,以区域显示数据值(5)点击时间轴,可以沿时间观察数据值的变化情况。
7.1Excel第七章大数据可视化工具of6211Excel原始数据数据可视化结果第七章大数据可视化工具高级大数据人才培养系列教材of62127.17.2Processing7.3NodeXL7.4ECharts习题7.5TableauExcel7.2Processing第七章大数据可视化工具of62137.2.1Processing开发环境简介Processing最初的目标是用来形象地教授计算机科学的基础知识,之后它逐渐演变成了可用于创建图形可视化项目的一种环境,实现对各类数据的可视化。
Processing开发环境Processing开发环境包括:
(1)一个简单的文本编辑器
(2)一个消息区(3)一个文本控制台(4)管理文件的标签(5)工具栏按钮(6)菜单7.2Processing第七章大数据可视化工具of62147.2.2Processing绘制功能坐标系:
2D图形:
原点在左上角,x轴正方向指向右,y轴正方向指向下3D图形:
原点仍在左上角,x轴正方向指向右,y轴正方向指向下,Z轴负方向指向屏幕内Processing绘制功能涉及到PDE窗口和显示窗口。
当运行PDE草图时,显示窗口将自动弹出并显示程序所绘制的各种图形数据(线、点、图片等),包括2D图形和3D图形。
7.2Processing第七章大数据可视化工具of6215显示窗口相关函数:
简单形状绘制:
(1)尺寸设置
(2)背景颜色设置(3)像素点操作
(1)绘制点
(2)绘制线(3)绘制矩形(4)绘制圆(椭圆)7.2Processing第七章大数据可视化工具of6216颜色:
采用RGB来描述颜色,R是red红色、G是green绿色、B是blue蓝色。
通过三原色混合得出其他各种颜色。
除了RGB三原色外,色彩透明度也是色彩的一个重要组成部分,用alpha表示。
Alpha取值从0到255,0表示完全透明,255表示完全不透明。
RGB颜色描述绘制曲线:
Processing提供了三个曲线绘制函数。
(1)绘制圆弧
(2)绘制样条曲线(3)绘制Bzier曲线7.2Processing第七章大数据可视化工具of6217其他绘制图形方法:
Processing还提供了绘制四边形、多边形等图形函数。
(1)绘制四边形:
quad(x1,y1,x2,y2,x3,y3,x4,y4)函数接受八个参数,代表的是这个四边形四个顶点的坐标。
(2)绘制多边形:
在beginShape()和endShape()函数之间,加入若干顶点vertex(x,y),可绘制任意多边形。
(3)除基本绘制功能之外,Processing还可支持文本处理、面向对象编程、声音处理、图像过滤、像素处理、三维图形绘制等功能,为数据的可视化奠定了良好的程序设计环境。
7.2Processing第七章大数据可视化工具of62187.2.3Processing应用程序的结构Processing应用程序有着自身的特点,其中setup()和draw()这两个函数最为重要。
setup()函数:
该函数用于初始化,只在程序启动时执行一次。
通常,setup()函数主要完成程序变量的初始化、窗口的设置等功能。
draw()函数:
该函数用于绘制窗口,被Processing循环调用。
每次draw()函数结束后,就会在显示窗口绘制一个新的画面,默认绘制速度为每秒60个画面。
7.2Processing第七章大数据可视化工具of62197.2.3数据可视化举例森林火灾模型的2-D元胞自动机的构建规则定义如下:
(1)在一个空场地(灰色),一棵树以pGrowth的机率成长。
(2)如果其相邻树中有至少有一棵树正在燃烧,那么这颗树也会成为一棵燃烧树(红色)。
(3)一棵燃烧树(红色)成为一个空场地(灰色)。
(4)如果周围没有任何燃烧树,那么这个树成为燃烧树的可能性为pBurn。
比如由雷击导致的燃烧,就是其中的一种可能。
7.2Processing第七章大数据可视化工具of6220模型构建代码如下:
intpix=newint2400400;inttoDraw=0;inttree=0;intburningTree=1;intemptySite=2;intx_limit=400;inty_limit=400;colorbrown=color(80,50,10);/browncolorred=color(255,0,0);/red;colorgreen=color(0,255,0);/greenfloatpGrowth=0.01;floatpBurn=0.00006;booleanprob(floatp)if(random(0,1)p)returntrue;elsereturnfalse;voidsetup()size(400,400);frameRate(60);/*Initializetoallemptysites*/for(intx=0;xx_limit;x+)for(inty=0;yy_limit;y+)pixtoDrawxy=emptySite;voiddraw()update();for(intx=0;xx_limit;x+)for(inty=0;yy_limit;y+)if(pixtoDrawxy=tree)stroke(green);7.2Processing第七章大数据可视化工具of6221elseif(pixtoDrawxy=burningTree)stroke(red);elsestroke(brown);point(x,y);toDraw=(toDraw=0)?
1:
0;voidupdate()intx,y,dx,dy,cell,chg,burningTreeCount;inttoCompute=(toDraw=0)?
1:
0;for(x=1;xx_limit-1;x+)for(y=1;yy_limit-1;y+)cell=pixtoDrawxy;/SurveyareaforburningtreesburningTreeCount=0;for(dx=-1;dx2;dx+)for(dy=-1;dy0)chg=burningTree;elsechg=cell;pixtoComputexy=chg;7.2Processing第七章大数据可视化工具of6222基于Processing绘制的森林火灾模型time=0time=20time=40time=60time=80time=100第七章大数据可视化工具高级大数据人才培养系列教材of62237.17.3NodeXL7.4ECharts习题7.5TableauExcel7.2Processing7.3NodeXL第七章大数据可视化工具of62247.3.1NodeXL简介目前,NodeXL软件包括Basic版本和Pro版本。
1、NodeXLBasic版本为免费版,可自由下载使用,但其功能较少。
2、NodeXLPro版本除涵盖NodeXLBasic版本的基础功能外,还包括GraphML的导出和导入、高级网络计算,内容分析和动画等功能。
注:
NodeXL以Excel2006/2010模板的形式使用,当加载该模板后,使用者可以在Excel工作表中对基础数据、属性数据进行添加和编辑,并选用一定的表现形式构造视图。
为了体现其基本使用功能,本书以NodeXLBasic版本为例进行介绍。
7.3NodeXL第七章大数据可视化工具of62257.3.2系统界面NodeXL功能卡界面7.3NodeXL第七章大数据可视化工具of62267.3.3数据获取与编辑1.数据导入NodeXLPro版可以直接导入多种网络分析工具(如UCINET、GraphML、Pajek等)生成的文件,图形数据文件等。
2.数据录入对于NodeXL的所有版本,均可在左侧的数据界面中直接录入网络的基础数据。
这些数据包括边(Edges)、节点(Vertices)、群组(Groups)、群组节点(GroupVertices)等。
7.3NodeXL第七章大数据可视化工具of62277.3.4数据可视化基本数据录入绘制效果在Edges工作表中输入一条边的两个节点数据后,Vertices工作表的数据将随之更新。
7.3NodeXL第七章大数据可视化工具of62287.3.4数据可视化属性设置后网络绘制效果为了能更突出显示各项信息,可以对各节点进一步录入可视化属性的数据、标签数据及分组数据,让其呈现出较好的网络结构图7.3NodeXL第七章大数据可视化工具of62297.3.4数据可视化拖拽后网络绘制效果对图形的布局进行调整,并可以通过拖拽达到满意效果。
7.3NodeXL第七章大数据可视化工具of62307.3.4数据可视化组群设置后网络绘制效果NodeXL支持群组方式,可以在Groups工作表和GroupVertices工作表中编辑数据、可视化属性等,为群组设置相应的节点颜色、形状、是否可见、是否折叠等信息,使得群组信息更为突出。
7.3NodeXL第七章大数据可视化工具of62317.3.5图形分析与数据过滤提供了复杂网络数据的绘制功能,还提供了图形分析和数据过滤功能。
其中,图形分析功能可以实现出度、入度、相邻性、中心性、聚类等等常见网络计算。
输入边,节点相关信息点击图形度量点击动态过滤器计算出这些值并填充到OverallMetrics数据表中对网络图形进行过滤,呈现符合特定条件的节点和边第七章大数据可视化工具高级大数据人才培养系列教材of62327.17.4ECharts习题7.5TableauExcel7.2Processing7.3NodeXL7.4Echarts第七章大数据可视化工具of62337.4.1ECharts架构及特点ECharts基本架构7.4Echarts第七章大数据可视化工具多种坐标系ECharts特点移动端交互优化支持多维数据的显示动态数据展现数据筛取视图缩放展示细节大规模数据显示。
of62347.4.1ECharts架构及特点7.4Echarts第七章大数据可视化工具of62357.4.2基本组成组件名称描述chart是指一个完整的图表,如折线图,饼图等“基本”图表类型或由基本图表组合而成的“混搭”图表,可能包括坐标轴、图例等axis直角坐标系中的一个坐标轴,坐标轴可分为类目型、数值型或时间型xAxis直角坐标系中的横轴,通常并默认为类目型yAxis直角坐标系中的纵轴,通常并默认为数值型grid直角坐标系中除坐标轴外的绘图网格,用于定义直角系整体布局legend图例,表述数据和图形的关联dataRange值域选择,常用于展现地域数据时选择值域范围dataZoom数据区域缩放,常用于展现大量数据时选择可视范围roamController缩放漫游组件,搭配地图使用toolbox辅助工具箱,辅助功能,如添加标线,框选缩放等tooltip气泡提示框,常用于展现更详细的数据timeline时间轴,常用于展现同一系列数据在时间维度上的多份数据series数据系列,一个图表可能包含多个系列,每一个系列可能包含多个数据7.4Echarts第七章大数据可视化工具of62367.4.2基本组成图表类型描述line包括折线图,堆积折线图,区域图,堆积区域图。
bar包括柱形图(纵向),堆积柱形图,条形图(横向),堆积条形图。
scatter包括散点图,气泡图。
当多维数据加入时,散点数据可以映射为颜色或大小,当映射到大小时则为气泡图k包括K线图,蜡烛图。
常用于展现股票交易数据。
pie包括饼图,圆环图,南丁格尔玫瑰图。
radar包括雷达图,填充雷达图。
高维度数据展现的常用图表。
chord和弦图。
常用于展现关系数据,外层为圆环图,可体现数据占比关系,内层为各个扇形间相互连接的弦,可体现关系数据。
force力导布局图。
常用于展现复杂关系网络聚类布局。
map地图。
内置世界地图、中国及中国34个省市自治区地图数据、可通过标准GeoJson扩展地图类型。
支持svg扩展类地图应用,如室内地图、运动场、物件构造等。
heatmap热力图。
用于展现密度分布信息,支持与地图、百度地图插件联合使用。
gauge仪表盘。
用于展现关键指标数据,常见于BI类系统。
funnel漏斗图。
用于展现数据经过筛选、过滤等流程处理后发生的数据变化,常见于BI类系统。
evnetRiver事件河流图。
常用于展示具有时间属性的多个事件,以及事件随时间的演化。
treemap矩形式树状结构图,简称:
矩形树图。
用于展示树形数据结构,优势是能最大限度展示节点的尺寸特征。
venn韦恩图。
用于展示集合以及它们的交集。
tree树图。
用于展示树形数据结构各节点的层级关系。
wordCloud词云。
词云是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。
7.4Echarts第七章大数据可视化工具of62377.4.3引入EChartsECharts2提供了多种接口供使用者调用,包括模块化包引入、模块化单文件引入、标签式单文件引入等几种。
而ECharts3不再强制使用AMD方式按需引入,而是采用script标签引入。
在此,简要介绍一下ECharts3的script标签引入方法。
7.4Echarts第七章大数据可视化工具of62387.4.4图表绘制1.图表绘制方法varoption=title:
text:
柱状图示例1,tooltip:
legend:
data:
分数,xAxis:
data:
数学,英语,语文,政治,体育,音乐,yAxis:
series:
name:
分数,type:
bar,data:
60,80,76,90,100,65;myChart.setOption(option);运行7.4Echarts第七章大数据可视化工具of62397.4.4图表绘制2.异步数据加载varmyChart=echarts.init(document.getElementById(main);$.get(data.json).done(function(data)myChart.setOption(title:
text:
柱状图示例2,tooltip:
legend:
data:
分数,xAxis:
data:
数学,英语,语文,政治,体育,音乐,yAxis:
series:
name:
分数,type:
bar,data:
60,80,76,90,100,65););ECharts提供了一个loading的动画来提示用户。
该动画只需要调用showLoading()方法显示。
当数据加载完成后,再调用hideLoading()方法隐藏加载动画。
其代码如下所示。
myChart.showLoading();$.get(data.json).done(function(data)myChart.hideLoading();myChart.setOption(.););7.4Echarts第七章大数据可视化工具of6240内置型数据区域缩放组件(dataZoomInside):
内置于坐标系中。
滑动条型数据区域缩放组件(dataZoomSlider):
有单独的滑动条操作。
框选型数据区域缩放组件(dataZoomSelect):
全屏的选框进行数据区域缩放。
7.4.4图表绘制3.加入交互组件dataZoom组件支持3种子组件:
7.4Echarts第七章大数据可视化工具of62417.4.4图表绘制option=xAxis:
type:
value,yAxis:
type:
value,dataZoom:
/这个dataZoom组件默认控制x轴。
type:
slider,/slider型dataZoom组件start:
10,end:
35,series:
type:
scatter,itemStyle:
normal:
opacity:
0.7,symbolSize:
function(val)returnval2*80;,data:
14,7.,0.8,3,5,0.9,2.,8,0.6,9,9.,0.1,14,4,0.5,12,1,0.9,4,8,0.1,0,4,0.7,7,2,0.6,14,5,0.3运行7.4Echarts第七章大数据可视化工具of62427.4.4图表绘制4.数据的视觉映射ECharts提供了visualMap组件来解决从数据到视觉元素的映射问题。
visualMap组件包括连续型视觉映射组件(visualMapContinuous)分段型视觉映射组件(visualMapPiecewise)第七章大数据可视化工具高级大数据人才培养系列教材of62437.17.4ECharts习题7.5TableauExcel7.2Processing7.3NodeXL7.5Tableau第七章大数据可视化工具of6244通过拖放式界面快速的生成各种图表、坐标图、仪表盘与报告,通过各种视角来展现业务领域数据及其内在关系。
TableauDesktop01TableauServer02该软件基于浏览器提供数据的分析和图表的生成。
TableauReader03用来打开TableauDesktop所创建的报表、视图、仪表盘文件等。
7.5.1Tableau简介7.5Tableau第七章大数据可视化工具of62457.5.2Tableau的使用1.数据获取按照类型的不同,数据源可分为文件数据和存储在服务器上的数据库文件两类。
(1)文件数据的获取点击连接到文件选择数据源类型TableauDesktop软件主界面7.5Tableau第七章大数据可视化工具of6246打开Excel工作簿连接窗口Excel工作簿连接窗口选择文件和数据表拖动工作表到相应区域,就可以将数据显示在下方列表处7.5Tableau第七章大数据可视化工具of6247数据连接包括实时、数据提取两种方式。
当数据量不大的情况下,可选择“实时”;当数据量很大的情况下,可以根据实际需要,将数据数据导入到Tableau数据引擎中,从而加快数据分析和处理的速度。
当分析海量数据时,由于导入数据引擎有所限制,也可采用实时连接方式。
数据分析主界面7.5Tableau第七章大数据可视化工具of6248
(2)数据库数据的获取在TableauDesktop软件的主界面中点击“连接到服务器”中的“更多服务器”。
在其中选择MySQL数据源类型,打开MySQL连接窗口。
连接更多服务器MySQL连接窗口输入所要分析数据所在的服务器名称和端口,登录服务器的用户名和密码。
在点击“确定”后,确定服务器连接成功。
和数据文件连接一样,选择连接方式后,出现Tableau的主工作区。
7.5Tableau第七章大数据可视化工具of62497.5.2Tableau的使用2.数据显示在Tableau的右侧工作区内,可以通过拖拽形成图表来显示数据。
具体来说,拖拽左侧“纬度”列表框和“度量”列表框内的字段项到右侧视图区内的行、列变量框内(横轴变量框、纵轴变量框)。
即可形成一个对应的图表,默认是条形图。
Tableau包括表、条形图、折线图、散点图、区域图、饼图、热图、地图、气泡图、甘特图、文字云等22种不同类型的图形。
在默认情况下,系统会根据数据字段自动选择合适的图形作为展示。
另外,很多情况下,单张图表不能满足分析的需要,需要维护图表之间的交互。
在Tablea
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据教学课件:第7章 大数据可视化工具.pptx 数据 教学 课件 可视化 工具 pptx