数据分析与R语言_003.pdf
- 文档编号:3433779
- 上传时间:2023-05-05
- 格式:PDF
- 页数:27
- 大小:1.09MB
数据分析与R语言_003.pdf
《数据分析与R语言_003.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言_003.pdf(27页珍藏版)》请在冰点文库上搜索。
DATAGURU专业数据分析网站2012.5.28数据分析与R语言第4周DATAGURU专业数据分析网站2012.5.28假设检验原理2DATAGURU专业数据分析网站2012.5.28假设检验的原理3DATAGURU专业数据分析网站2012.5.28假设检验的原理4DATAGURU专业数据分析网站2012.5.28否定域5DATAGURU专业数据分析网站2012.5.28不否定正确6DATAGURU专业数据分析网站2012.5.28T分布密度函数7DATAGURU专业数据分析网站2012.5.28T分布密度函数8DATAGURU专业数据分析网站2012.5.28T检验法9DATAGURU专业数据分析网站2012.5.28lm()线性模型函数y1+x或yx均表示y=a+bx有截距形式的线性模型通过原点的线性模型可以表达为:
yx-1或yx+0或y0+x参见help(formula)10DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数建立数据:
身高-体重x=c(171,175,159,155,152,158,154,164,168,166,159,164)y=c(57,64,41,38,35,44,41,51,57,49,47,46)建立线性模型a=lm(yx)求模型系数coef(a)(Intercept)x-140.364361.15906提取模型公式formula(a)yx11DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数计算残差平方和(什么是残差平方和)deviance(a)164.82657绘画模型诊断图(很强大,显示残差、拟合值和一些诊断情况)plot(a)计算残差residuals(a)1234567-0.83495441.5288044-2.9262307-1.2899895-0.81280861.23282962.8690708891011121.27846782.6422265-3.03965293.0737693-3.721532212DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数打印模型信息print(a)Call:
lm(formula=yx)Coefficients:
(Intercept)x-140.3641.15913DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数计算方差分析表14DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数提取模型汇总资料15DATAGURU专业数据分析网站2012.5.28与线性模型有关的函数作出预测z=data.frame(x=185)predict(a,z)174.0618predict(a,z,interval=prediction,level=0.95)fitlwrupr174.061865.986282.13739课后阅读:
薛毅书,p308,计算实例16DATAGURU专业数据分析网站2012.5.28多元线性相关分析研究多个变量之间的关系例子:
iris数据集,研究花瓣和花萼的长度、宽度之间的联系准备数据:
x=iriswhich(iris$Species=setosa),1:
4画出散点图集:
plot(x)17DATAGURU专业数据分析网站2012.5.28多元线性相关分析计算相关系数矩阵,cor()函数暂时没有发现可以在多元情况下进行相关性检验的函数,只能对变量两两进行检验18DATAGURU专业数据分析网站2012.5.28多元线性回归Swiss数据集:
SwissFertilityandSocioeconomicIndicators(1888)Data19DATAGURU专业数据分析网站2012.5.28多元线性回归建立多元线性模型20DATAGURU专业数据分析网站2012.5.28多元线性回归模型汇总信息21DATAGURU专业数据分析网站2012.5.28多元线性回归多元线性回归的核心问题:
应该选择哪些变量?
一个非典型例子(薛毅书p325)RSS(残差平方和)与R2(相关系数平方)选择法:
遍历所有可能的组合,选出使RSS最小,R2最大的模型AIC(Akaikeinformationcriterion)准则与BIC(Bayesianinformationcriterion)准则AIC=nln(RSSp/n)+2pn为变量总个数,p为选出的变量个数,AIC越小越好22DATAGURU专业数据分析网站2012.5.28多元线性回归逐步回归向前引入法:
从一元回归开始,逐步增加变量,使指标值达到最优为止向后剔除法:
从全变量回归方程开始,逐步删去某个变量,使指标值达到最优为止逐步筛选法:
综合上述两种方法23DATAGURU专业数据分析网站2012.5.28多元线性回归step()函数24DATAGURU专业数据分析网站2012.5.28多元线性回归是否还有优化余地?
使用drop1作删除试探,使用add1函数作增加试探25DATAGURU专业数据分析网站2012.5.28多元线性回归薛毅书,p330例子26DATAGURU专业数据分析网站FAQ时间27
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 语言 _003