R~语言的历史背景、发展历程及现状.pptx
- 文档编号:18924307
- 上传时间:2024-02-13
- 格式:PPTX
- 页数:34
- 大小:271.08KB
R~语言的历史背景、发展历程及现状.pptx
《R~语言的历史背景、发展历程及现状.pptx》由会员分享,可在线阅读,更多相关《R~语言的历史背景、发展历程及现状.pptx(34页珍藏版)》请在冰点文库上搜索。
欢迎走入欢迎走入R语言世界!
语言世界!
谢益辉、郑冰谢益辉、郑冰2008年12月13日R语言的概述语言的概述R语言的背景语言的背景R语言的发展语言的发展R语言的运用语言的运用RR语言的概述语言的概述语言的概述语言的概述RR语言的背景语言的背景RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用R语言的概述R是一门用于统计计算和作图的语言,受S语言和Scheme语言影响发展而来。
R语言最初由新西兰奥克兰大学统计系的RobertGentleman和RossIhaka合作编写。
RR语言的概述语言的概述语言的概述语言的概述RR语言的背景语言的背景RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用R语言的概述R语言具有免费、开源及统计模块齐全的特征,已被国外大量学术和科研机构采用,其应用范围涵盖了数据挖掘、机器学习、计量经济学、实证金融学、统计遗传学、自然语言处理、心理计量学和空间统计学诸多领域。
RR语言的概述语言的概述语言的概述语言的概述RR语言的背景语言的背景RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用R语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNUGNU是一套完全由自由软件构成的计算机操作系统.其名称是“GNUsNotUnix的递归缩写。
GNU由RichardStallman发起,后来在“GNU计划”下开发,目前已经包含大量的自由软件。
RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNURR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNU“自由”:
以任何目的运行此程序的自由;以学习程序工作机理为目的,对程序进行修改的自由;再发行复制件的自由;改进此程序,并公开发布改进的自由;RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNU对统计的意义:
能够对现实生活中复杂的数据一步步的去处理,并且随时以数值或图形的形式观察中间结果,以便我们决定下一步分析应该朝怎样的方向进行。
RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNU对统计的意义:
避免了像商业软件在固定的分析过程中存在的问题无法得到取截尾均值作为统计量统计分析方法的归类不清RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNU对统计的意义:
避免了像商业软件一样源代码不被公开,其中的具体程序过程只有内部人员清楚,用户对此毫不知情。
用户可以得知其中的计算会暗含着何种漏洞或错误。
Excel为例,有时能计算出负的方差,有时能产生有严重缺陷的随机数等等。
RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用自由的GNU总之:
一是可自由计算任何想计算的统计量(包括图形);二是保证用户能够使用正确的计算机程序,或换句话说,保证用户清楚他们利用计算机究竟在做什么。
如果用户被剥夺了这种自由,那么统计分析工作的效率和信度都将大打折扣。
RR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用S语言的荣耀RfatherRR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用S语言的荣耀棕皮书:
RichardA.BeckerandJohnM.Chambers(1984),S.AnInteractiveEnvironmentforDataAnalysisandGraphics,Monterey:
WadsworthandBrooks/Cole.蓝皮书:
RichardA.Becker,JohnM.ChambersandAllanR.Wilks(1988),TheNewSLanguageLondon:
ChapmanHall.白皮书:
JohnM.ChambersandTrevorJ.Hastie(1992),StatisticalModelsinSLondon:
Chapman&Hall.这本书中开始介绍S3,即第3代S绿皮书:
JohnM.Chambers(1998),ProgrammingwithData,NewYork:
Springer,ISBN0-387-98503-4这本书介绍了S4,即第4代S。
RfatherRR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用Scheme语言的荣耀Scheme语言是LISP语言的一个方言(或说成变种),与其他lisp不同的是scheme是可以编译成机器码的。
它诞生于1975年的MIT,对于这个有近三十年历史的编程语言来说,在国外广泛运用,就像国内的C+,Java,C那样受到商业领域的青睐。
RmotherRR语言的背景语言的背景语言的背景语言的背景RR语言的概述语言的概述RR语言的发展语言的发展语言的发展语言的发展RR语言的运用语言的运用语言的运用语言的运用Scheme语言的荣耀Scheme的一个主要特性是可以像操作数据一样操作函数调用。
Scheme其的主要目的是训练人的机器化思维。
以其简洁的语言环境和大量的脑力思考而著称。
主要的Scheme环境有:
MITScheme、DrScheme.RmotherRR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用萌萌芽芽诞诞生生婴婴儿儿期期成成长长发发展展期期现现状状思思想想火火花花胚胚胎胎时时期期RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用思想火花思想火花最早的时候,RossIhaka从一本书了解到了Scheme语言,Ross对Scheme非常感兴趣;大约与此同时,他获得了一版新S语言(见蓝皮书)的源代码,此时他注意到了Scheme和S语言二者之间的异同点。
后来Ross开始准备用Scheme向别人演示词法作用域,但是由于手边没有Scheme的书,就用S来演示却失败了,这让他萌生了改进S语言的想法。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用萌芽萌芽相当长一段时间之后,RossIhaka和RobertGentlemen在奥克兰大学成了同事,他们都对统计计算十分感兴趣,而且试图为他们的实验室寻找一个更好的软件。
因为在商业软件中找不到他们想要的,这使Ross想到当初改进S语言的想法,于是他们决定自己开发一种语言。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用胚胎时期胚胎时期1993年,Ross和Robert将R的部分二进制文件放到了卡耐基梅隆大学统计系的Statlib中,并在S语言的新闻列表上发布了一个公告。
随后有些人开始下载使用并给他们反馈,其中以苏黎世理工学院的MartinM最为突出。
Martin极力劝说两位原作者公布源代码,让R成为自由软件。
于是1995年6月R的源代码正式发布到了自由软件协会的FTP上。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用诞生婴儿期诞生婴儿期随着开发的进行,程序版本的归档又成为问题。
维也纳工业大学的KurtHornik承担了这份任务,在维也纳建立了R程序的归档,使得程序版本的发布变得更加规范。
同时在世界各地也出现了R程序的镜像(如Statlib等)。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用成长发展期成长发展期于是1997年中期R核心团队成立了,成员包括:
DouglasBates美国威斯康辛大学统计系教授PeterDalgaard丹麦哥本哈根大学公共卫生所副教授RobertGentleman美国西雅图哈清森肿瘤研究中心公共卫生部计算生物学项目带头人KurtHornik奥地利维也纳工业大学统计与数学系教授、主席RossIhaka新西兰奥克兰大学统计系副教授FriedrichLeisch德国慕尼黑大学统计系教授ThomasLumley美国华盛顿大学生物统计系副教授MartinMaechler苏黎世理工学院数学系高级研究员PaulMurrell新西兰奥克兰大学统计系高级讲师HeinerSchwarte原在德国杜伊斯堡埃森大学(现已非核心成员)LukeTierney爱荷华大学统计与精算系教授RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状1)R源程序源程序截止到本文写作时,R源程序已经更新了约70个版本,目前是2.8.0版,源程序大小由1997年的959K增大到了今天的大约16M(Window二进制安装程序文件约30M);从版本更新以及文件大小来看,R的发展速度的确非常快,而且整个软件系统的体积也保持着非常小的优势,这几乎是任何一门商业软件都无法比拟的。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状2)邮件列表)邮件列表现今R的邮件列表仍然由苏黎世理工学院的MartinMachler提供支持,这些邮件列表分四大类:
消息发布(R-announce)、附加包(R-help)、帮助(R-help)和R程序开发(R-devel)。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状3)R核心团队核心团队2008年R核心团队成员数目增加到了19位,成员主要来自世界各地的大学如牛津大学、加拿大西安大略大学、意大利米兰大学等,也有来自公司企业的成员,如AT&T实验室的SimonUrbanek等。
由于R的扩展性非常强,因此也吸引了大量用户编写自定义的函数包供更多人使用,这些附加包都可以从世界各地的CRAN镜像上下载。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状4)R刊物刊物R也有其刊物“RNews”,创办于2001年,至今已经发行23期,共发表论文205篇。
该刊物主要介绍R的最新特征、CRAN的动态、附加包的说明短文、编程技巧、手册和FAQ中没有介绍的小提示以及R在数据分析中的应用示例。
自2009年起,“RNews”将更名为“TheRJournal”。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状5)R书籍书籍据R官方网站不完全统计,与R语言相关的出版书籍已达68本,内容包括S语言介绍、统计编程、统计学相关领域的应用、统计模型、数据分析、统计图示和与R相关的其它软件应用等。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用现状现状6)R会议会议从2004年起至今(2005年除外),R团队每年都会举办一次useR!
会议,过去已经在奥地利、美国和德国举办了4次会议,每年参会人数和演讲篇数都在增多,例如最近一次在德国多特蒙德大学举办的useR!
一共有超过400人参加、报告多达170场左右。
此外,R团队每两年也会举办一次DSC会议(DirectionsinStatisticalComputing),讨论以R语言为重心的统计计算问题。
RR语言的发展语言的发展语言的发展语言的发展RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景RR语言的运用语言的运用语言的运用语言的运用虽虽说说R语语言言诞诞生生于于新新西西兰兰,但但后后来来服服务务器器架架设设到到了了奥奥地地利利,而而现现在在Windows主主程程序序的的维维护护者者在在加加拿拿大大、Windows附附加加包包的的维维护护者者在在德德国国、MacOS版版程程序序的的维维护护者者在在美美国国、邮邮件列表维护者在瑞士件列表维护者在瑞士这这样样一一个个形形式式松松散散却却有有着着共共同同目目标标的的群群体体,十十年年来来以以志志愿愿者者的的身身份份坚坚持持不不懈懈推推动动着着R语语言言的的发发展展;众众多多统统计计学学或或者者相相关关领领域域的的程程序序员员也也纷纷纷纷贡贡献献自自己己的的力力量量,将将大大量量统统计计方方法法以以附附加加包包的的形形式式发发布布出出来来,使使其其他他不不擅擅长长编编程程的的用用户户也也可可以以以以最最快快的的速速度度用用上上最最新新的的统统计计方方法法,而而封封闭闭源源代代码码的的商商业业软软件件则则很很难难拥拥有有如如此此强强劲劲的的推推动动力力量量:
现现有有的的统统计计软软件件可可能能没没有有哪哪一一种种能能够够拥拥有有超超过过1500个个附附加加程程序序包。
包。
RR语言的运用语言的运用语言的运用语言的运用RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景语言的发展语言的发展语言的发展语言的发展小例子例如,我们用函数ttest对一批样本量为10、来自正态分布的样本数据作t检验。
RR语言的运用语言的运用语言的运用语言的运用RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景语言的发展语言的发展语言的发展语言的发展R语言的运用R继承了S语言关于向量化操作以及数据结构等诸多优势,加上它面向对象的特点,所以R语言在统计编程和统计图形方面显得非常灵活。
传统商业软件的统计模型在R中都是以对象的形式存在,我们通常看到的大篇幅统计报告输出对R来说只是对象的某种特定表现形式。
RR语言的运用语言的运用语言的运用语言的运用RR语言的概述语言的概述RR语言的背景语言的背景语言的背景语言的背景语言的发展语言的发展语言的发展语言的发展R语言的运用希望通过本文的介绍,让更多中国用户了解R语言,并利用它在统计分析上的优势为自己的专业问题提供灵活的解答,而不是千篇一律陷在固定分析过程中降低数据利用效率。
同时我们也希望有更多擅长计算机编程的人士为这片“开源的海洋”贡献自己的力量,打造出一个多样化的统计分析世界。
总结ThankYou!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 历史背景 发展 历程 现状