欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    数据分析与R语言_004资料下载.pdf

    • 资源ID:5967495       资源大小:716.16KB        全文页数:22页
    • 资源格式: PDF        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据分析与R语言_004资料下载.pdf

    1、生物物种 预测:天气预报 决策:yes or no 分类的传统模型 分类(判别分析)与聚类有什么差别?2 DATAGURU专业数据分析网站 2012.6.28 常见分类模型与算法 线性判别法 距离判别法 贝叶斯分类器 决策树 支持向量机(SVM)神经网络 3 DATAGURU专业数据分析网站 2012.6.28 线性判别法(Fisher)例子:天气预报数据 G=c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2)x1=c(-1.9,-6.9,5.2,5.0,7.3,6.8,0.9,-12.5,1.5,3.8,0.2,-0.1,0.4,2.7,2.1,-4.6,-

    2、1.7,-2.6,2.6,-2.8)x2=c(3.2,0.4,2.0,2.5,0.0,12.7,-5.4,-2.5,1.3,6.8,6.2,7.5,14.6,8.3,0.8,4.3,10.9,13.1,12.8,10.0)a=data.frame(G,x1,x2)plot(x1,x2)text(x1,x2,G,adj=-0.5)4 DATAGURU专业数据分析网站 2012.6.28 线性判别法的原理 用一条直线来划分学习集(这条直线一定存在吗?)然后根据待测点在直线的哪一边决定它的分类 5 DATAGURU专业数据分析网站 2012.6.28 MASS包与线性判别函数lda()library

    3、(MASS)ld=lda(Gx1+x2)ld 6 DATAGURU专业数据分析网站 2012.6.28 分类判断 z=predict(ld)newG=z$class newG 1 1 1 1 1 1 2 1 1 1 1 2 2 2 2 1 2 2 2 2 2 Levels:1 2 cbind=(G,z$x,newG)y=cbind(G,z$x,newG)y 7 DATAGURU专业数据分析网站 2012.6.28 距离判别法 原理:计算待测点与各类的距离,取最短者为其所属分类 马氏距离(薛毅书p445,为什么不用欧氏距离?),计算函数mahalanobis()8 DATAGURU专业数据分析网

    4、站 2012.6.28 算法 情形一(薛毅书p445)9 DATAGURU专业数据分析网站 2012.6.28 算法 情形二(薛毅书p447)例子(薛毅书p449)10 DATAGURU专业数据分析网站 2012.6.28 贝叶斯分类器 原理(薛毅书p455)11 DATAGURU专业数据分析网站 2012.6.28 结果 对于总体协方差矩阵相同的情形 12 DATAGURU专业数据分析网站 2012.6.28 结果 对于总体协方差矩阵不同的情形 13 DATAGURU专业数据分析网站 2012.6.28 程序与例子 薛毅书P457 利用贝叶斯分类器判断垃圾邮件 14 DATAGURU专业数据

    5、分析网站 2012.6.28 多分类的情况 多分类下的距离判别法(薛毅书p452)多分类下的贝叶斯(薛毅书p460)15 DATAGURU专业数据分析网站 2012.6.28 决策树 decision tree 什么是决策树 输入:学习集 输出:分类规则(决策树)16 DATAGURU专业数据分析网站 2012.6.28 例子 用SNS社区中不真实账号检测的例子说明如何使用ID3算法构造决策树。为了简单起见,我们假设训练集合包含10个元素。其中s、m和l分别表示小、中和大。17 DATAGURU专业数据分析网站 2012.6.28 信息增益 设L、F、H和R表示日志密度、好友密度、是否使用真实

    6、头像和账号是否真实,下面计算各属性的信息增益。18 DATAGURU专业数据分析网站 2012.6.28 根据信息增益选择分裂属性 因此日志密度的信息增益是0.276。用同样方法得到H和F的信息增益分别为0.033和0.553。因为F具有最大的信息增益,所以第一次分裂选择F为分裂属性,分裂后的结果如下图表示:19 DATAGURU专业数据分析网站 2012.6.28 递归+分而治之 在上图的基础上,再递归使用这个方法计算子节点的分裂属性,最终就可以得到整个决策树。这个方法称为ID3算法,还有其它的算法也可以产生决策树 对于特征属性为连续值,可以如此使用ID3算法:先将D中元素按照特征属性排序,

    7、则每两个相邻元素的中间点可以看做潜在分裂点,从第一个潜在分裂点开始,分裂D并计算两个集合的期望信息,具有最小期望信息的点称为这个属性的最佳分裂点,其信息期望作为此属性的信息期望。20 DATAGURU专业数据分析网站 2012.6.28 R语言实现决策树:rpart扩展包 以鸢尾花数据集作为算例说明 iris.rp=rpart(Species.,data=iris,method=class)plot(iris.rp,uniform=T,branch=0,margin=0.1,main=“Classification TreenIris Species by Petal and Sepal Length)text(iris.rp,use.n=T,fancy=T,col=blue)21 Rule 1:if Petal.Length=2.45&Petal.Width=2.45&Petal.Width=1.75,then it is virginica(0/1/45)Rule 3:if Petal.Length2.45,then it is setosa(50/0/0)DATAGURU专业数据分析网站 FAQ时间 22


    注意事项

    本文(数据分析与R语言_004资料下载.pdf)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开