欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    R语言学习系列19基本统计图形Word下载.docx

    • 资源ID:4906013       资源大小:408.83KB        全文页数:23页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    R语言学习系列19基本统计图形Word下载.docx

    1、若beside=TRUE,则矩阵中的每一列都表示一个分组,各列中的值将并列而不是堆砌。library(vcd) #使用数据集Arthritis- table(Arthritis$Improved, Arthritis$Treatment) Placebo Treated None 29 13 Some 7 7 Marked 7 21Stacked Bar PlotTreatment, col = c(red, yellowgreen),legend = rownames(counts) #堆砌条形图Grouped Bar Plot),legend = rownames(counts), bes

    2、ide = TRUE) #分组条形图注:棘状图可对堆砌条形图进行重缩放library(vcd)attach(Arthritis)- table(Treatment, Improved)spine(counts, main = Spinogram Example)detach(Arthritis)3. 均值条形图条形图并不一定要基于计数数据或频率数据,也可以使用数据整合函数并将结果传递给函数barplot(),来创建表示均值、中位数、标准差等的条形图。states- data.frame(state.region, state.x77)means- aggregate(states$Illite

    3、racy, by = list(state.region), FUN = mean)means - meansorder(means$x), #均值从小到大排序means Group.1 x3 North Central 0.7000001 Northeast 1.0000004 West 1.0230772 South 1.737500barplot(means$x, names.arg=means$Group.1)#参数2设置标签title(Mean Illiteracy Rate4. 条形图的微调par(mar = c(5, 8, 4, 2)par(las = 2)#旋转图形标签Trea

    4、tment Outcome, horiz = TRUE, cex.names = 0.8, names.arg = c(No ImprovementSome ImprovementMarked Improvement)#cex.names缩小字体二、饼图饼图的功能同条形图,每一个扇形的角度与相应频数成比例。基本函数为:pie(x, labels)其中,x为非负数值向量,表示每个扇形的面积;labels表示各扇形标签的字符型向量。attach(mtcars)piedata-table(cyl)percent-as.vector(piedata)/sum(as.vector(piedata)*10

    5、0 #计算百分比pie(piedata,labels=paste(c(4,68),cylinders: , percent, %)detach(mtcars)饼图不容易比较各扇形的大小,plotrix包中的fan.plot()函数可以绘制扇形图。library(plotrix)slices- c(10, 12, 4, 16, 8)lbls- c(USUKAustraliaGermanyFrancefan.plot(slices, labels = lbls, main = Fan Plot三、直方图对于定量变量(数值型变量),常用直方图来展示某个变量取值的分布,利用直方图可以估计总体的概率密度

    6、。将变量取值的范围分成若干区间。直方图是用面积而不是用高度来表示数,总面积是100%. 每个区间矩形的面积恰是落在该区间内的百分数(频率),所以矩形的高 = 频率 / 区间长度 = 密度特别地,若区间是等长的,则“矩形的高”就是频率。注意:直方图矩形之间是没有间隔的。函数hist()用于绘制直方图,基本格式为:hist(x, breaks=Sturges,freq=NULL, probability=., main=.)其中,x为数值向量; breaks为分段区间:各区间端点构成的向量、分段数、计算划分区间的算法名称、划分区间个数的函数(方法);freq默认为TRUE表示绘制频数直方图,若为F

    7、ALSE则绘制频率直方图;probability与freq对立,设置是否以概率密度作图,默认为FALSEpar(mfrow = c(2, 2)hist(mpg) #简单直方图hist(mpg, breaks = 12, col = Miles Per Gallon, main = Colored histogram with 12 bins) #指定组数和颜色hist(mpg, freq = FALSE, breaks = 12, col = Histogram, rug plot, density curverug(jitter(mpg) #添加轴须lines(density(mpg), c

    8、ol = blue, lwd = 2) #添加密度曲线x - mpghist(x, breaks = 12, freq=FALSE, col = Histogram with normal curve and boxlines(density(rnorm(1e+6,mean(mpg),sd(mpg),lty=2,col=) #添加正态密度曲线box()sm包中的函数pare()也用于绘制核密度图,可以堆放多条密度曲线,用于组间差异的比较。基本格式为:pare(x, group, h, .)group为分组变量(因子型数据);h为光滑参数。示例:library(sm)pare(wt,factor

    9、(cyl)legend(topright,levels(factor(cyl),lty=1:3,col=2:4,bty=n四、箱线图在一条数轴上,以数据的上下四分位数(Q1-Q3)为界画一个矩形盒子(中间50%的数据落在盒内);在数据的中位数位置画一条线段为中位线;用标记数据的均值;默认延长线不超过盒长的1.5倍,之外的点认为是异常值(用标记)。箱线图的主要应用就是,剔除数据的异常值、判断数据的偏态和尾重、可视化组间差异。用函数boxplot()绘制箱线图,单独的箱线图调用格式:boxplot(x, range=1.5, width=NULL, varwidth=FALSE,notch=FAL

    10、SE, horizontal=FALSE, .)其中,x为一系列数值向量,依次做出箱线图;range设置延长线长度:几倍盒长,默认1.5;width设置盒长;varwidth设置盒宽与样本量的平方根是否成比例,默认FALSEnotch设置是否绘制带刻槽的凹形盒,默认FALSEhorizontal设置箱线图的方向,默认FALSE垂直作图,TURE为水平作图;2. 组间比较的箱线图调用格式:boxplot(formula, data=NULL, subset, .)其中,formula为一个公式,例如ygrp,表示y为数值向量,grp为分组变量;data为提供数据的数据框;boxplot(mpg

    11、cyl, data = mtcars, main = 不同汽缸数量车型油耗的箱线图,xlab = Number of Cylinders, ylab = 可见,随着汽缸数的减少,油耗明显降低。mtcars$cyl.f- factor(mtcars$cyl, levels = c(4, 6, 8), labels = c(mtcars$am.f- factor(mtcars$am, levels = c(0, 1), labels = c(autostandardboxplot(mpg am.f * cyl.f, data = mtcars, varwidth = TRUE, col = c(g

    12、olddarkgreen), main = 两个交叉因子的箱线图Auto Type可见,对于四缸和六缸车型,标准变速箱的油耗更高。但是对于八缸车型,油耗似乎没有差别。将核密度图以镜像方式在箱线图上的叠加,可得到小提琴图。白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计。library(vioplot)x1- mtcars$mpgmtcars$cyl = 4x2- mtcars$mpgmtcars$cyl = 6x3- mtcars$mpgmtcars$cyl = 8vioplot(x1, x2, x3, names = c(4 cyl6 cyl8 cy

    13、l), col = Violin Plots of Miles Per Gallon五、点图点图提供了一种在简单水平刻度上绘制大量有标签值的方法。用dotchart()函数绘制点图,基本格式为:dotchart(x, labels=, groups=, cex=, pt.cex=,pch=, gpch=, color=, gcolor=.)labels为各个点的标签组成的向量;groups指定用来对x中元素进行分组的因子(参数gcolor可以控制不同组标签的颜色,cex可控制标签的大小);pch, pt.cex, color指定绘图符号,及其大小、颜色;dotchart(mtcars$mpg,

    14、 labels=row.names(mtcars), cex=0.7, Gas Milage for Car Models展示了同一个水平轴上观察每种车型的每加仑汽油行驶英里数,通常点图在经过排序并且分组变量被不同的符号和颜色区分开的时候最有用。- mtcarsorder(mtcars$mpg), x$cyl- factor(x$cyl)x$colorx$cyl = 4 - x$colorx$cyl = 6 x$colorx$cyl = 8 dotchart(x$mpg, labels = row.names(x), cex = 0.7, pch = 19, groups = x$cyl, g

    15、color = black, color = x$color, Gas Milage for Car Modelsngrouped by cylinder六、散点图1.一般散点图以两个定量变量的数值在二维坐标系中描点,生成的图形就是散点图。散点图能直观地显示出因变量随自变量变化而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。用函数plot()绘制散点图,基本格式为:plot(x, y, type, main=, )其中,x为自变量数据;y为因变量数据;main设置标题。x-seq(from=0,to=2*pi,length=10)y=sin(x)type=c(plbochsSop=p

    16、ar(mfrow=c(3,3),mar=c(4,4,1,1)for(i in 1:9)plot(x,y,type=typei, main=paste(type:, typei)par(op)两组数据的关系用散点图可以清楚地描述,在散点图中加入一条拟合曲线有助于更好地把握变量间的关系。lowess()函数通过加权多项式回归对散点图进行平滑拟合一条非线性的曲线,但只能处理二维情形,类似的函数loess()可处理多维。lowess(x, y=NULL, f=2/3, iter=3)其中,x, y为两个向量;f为平滑的跨度,值越大曲线越平滑;iter为迭代次数。attach(cars)plot(dis

    17、t,speed)lines(lowess(dist,speed),col=,lwd=1.5)detach(cars)注1:要克服散点图中数据点重叠的问题,可以绘制向日葵散点图,它在有重叠的地方,用一朵“向日葵花”的花瓣数目来表示数据重叠的个数,基本格式:sunflowerplot(x,y,number,rotate=,size=,seg.col=,seg.lwd=)注2:plot(图类名(x), )可以绘制相应类型的图形,例如plot(density(wt)绘制数据变量wt的核密度图;plot(data.frame数据)绘制两两列的散点图矩阵;2. 散点图矩阵即多个变量的两两散点图以矩阵的形式

    18、排列起来,矩阵中每个散点图的行、列的长度都是固定的。使用函数pairs()绘制散点图矩阵,绘图对象为数据框的调用格式:pairs(x, labels, panel=points, .)其中,x为数据框的若干列数据;labels设置变量名标签;panel面板函数。或者绘图对象为公式的调用格式:pairs(formula, data=NULL, subset, .)其中,公式为x+y+z的形式,设置要绘制的变量;data为数据框名;subset可选取部分子集。如下两种代码效果相同:pairs(mtcars,c(1,3,5,6), col=as.integer(factor(cyl)+1, main

    19、=Scatter Plot Matrixpairs(mpg+disp+drat+wt,data=mtcars,col=as.integer(factor(cyl)+1,main=七、相关图相关图是对相关系数矩阵的可视化,散点图矩阵只能显示两两变量间的相关关系,变量数增加将不再适用。使用corrgram包中的函数corrgram(),基本格式为:corrgram(x, type=, order=FALSE, labels, panel=panel.shade, lower.panel=, upper.panel=, diag.panel=NULL, text.panel=textPanel, c

    20、or.method=pearson, .)其中,x为数据框;type=data或cor/corr,设置x是数据框还是相关矩阵;order设置变量排序,默认FALSE,相关矩阵按数据框名对变量排序,若为TRUE,相关矩阵将用主成分分析法对变量重排序,这将使得二元变量的关系模式更为明显;lower.panel, upper.panel设置主对角下方、上方的元素类型:panel.pie用饼图的填充比例表示相关性大小,panel.shade用阴影的深度表示相关性大小,panel.ellipse绘制置信椭圆和平滑拟合曲线,panel.pts绘制散点图;text.panel取值panel.txt时输出变量

    21、名字;diag.panel控制主对角线元素类型,panel.minmax输出变量的最大、最小值;cor.method设置计算相关性的方法,默认是,可选项还有spearmankendall以mtcars为例,绘制相关图。library(corrgram)#相关图,主对角线上方绘制置信椭圆和平滑拟合曲线,主对角线下方绘制阴影corrgram(mtcars,order=TRUE,upper.panel=panel.ellipse,main=Correlogram of mtcarsintercorrelations#相关图,主对角线上方绘制散点图,主对角线下方绘制饼图corrgram(mtcars,

    22、order=TRUE,upper.panel=panel.pts,lower.panel=panel.pie,main=运行结果:八、QQ图QQ图用来检查数据是否服从某种分布。其原理是,若一批数据服从某种理论分布,看其经验分布和理论分布是否一致。将排序后的数据与理论分布的分位数进行比较,若大致相等,则说明经验分布和理论分布相似。用函数qqplot(), qqline(), qqnorm()绘制QQ图,基本格式为:qqnorm(y, ylim, .)qqline(y, .)qqplot(x, y, .)以mtcars的wt为例,绘制正态和t分布的QQ图。qqnorm(wt)qqline(wt)q

    23、qplot(qt(ppoints(length(wt),df=5),wt,xlab=Theoretical Quantiles,ylab=Sample Quantiles, main=Q-Q plot for tdsn#QQ图中,函数ppoints()用来生成一组概率值,以估计逆分布#函数qt()为t分布的分位数函数九、等高线图对三维数据(x, y, z),其中 (x, y) 表示坐标位置,z值为每个坐标位置上的高度值构成的矩阵。将z值相等的点连接起来形成的线就是等高线。估计x,y的核密度,得到一个密度值矩阵,然后用x, y以及密度值矩阵做等高图,由于密度值反映的是某个位置上数据的密集程度,所

    24、以,这样的等高线图展示了一个聚类现象。用函数contour()绘制等高线图,基本格式为:contour(x,y,z,nlevels=10, levels=,labels=,xlim,ylim,zlim, drawlabels=TRUE, method=)其中,x,y,z为坐标位置和高度值;nlevels为等高线条数,调整等高线的疏密;levels为一系列等高线的z值,只有这些值或者附近的点才被连起来;labels为等高线上的标记字符串,默认是高度数值;xlim,ylim,zlim设置坐标轴范围;drawlabels设置是否绘制标签,默认TRUE;method为等高线标签的画法:默认flatte

    25、st值等高线平缓的地方加标签,嵌在等高线内;simple在等高线末端加标签,标签与等高线重叠;edge值等高线末端加标签,嵌在等高线内。library(KernSmooth)datas-data.frame(wt,mpg)est-bkde2D(datas,apply(datas,2,dpik) #估计二维核密度contour(est$x1,est$x2,est$fhat, nlevels=15, col=,xlab=wtmpgpoints(datas)#加上数据散点十、热图热图将数值用颜色表达,颜色越深表示数值越大。热图不只是简单的显示数值的分布状况,而且对数据进行层次聚类,以聚类的顺序排列。用函数heatmap()绘制热图,基本格式为:heatmap(x, Rowv=, Colv=,distfun=dist, hclustfun=hclust, scale=, revC=, .)其中,x为数据矩阵;R


    注意事项

    本文(R语言学习系列19基本统计图形Word下载.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开