欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    讲义3数据管理.docx

    • 资源ID:1167792       资源大小:673.46KB        全文页数:12页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    讲义3数据管理.docx

    1、讲义3数据管理数 据 管 理 基 础1.数据步运行机制DATA 数据库标识.数据集名;(标志数据步的开始,命名将要创建的SAS数据集。如省略库标识名,则默认为work临时库。)infile “外部文件的所在位置及名称” ;(读入外部数据,必须出现在INPUT语句之前。另外的途径是读取cards后面的数据块。)input 变量名 $ 开始列-结束列 .小数位.;例:input name $ 1-6 score 7-10 .2 ;input后列出变量名及格式名,通常用来读入各种各样写法的日期。注意日期是用数值存储的,若要显示则要用format语句,指定特殊的日期输出格式。数据步执行过程:运行下面三

    2、则程序分析数据读取过程:2.attrib 语句指定变量属性变量属性有:字符型或数值型:input语句中字符型变量名后面要加$符号变量标签(lable):最长40个字符存储长度(length):数值型数据一般长度为8个字,字符型变量默认为8个字符输出格式(format):指定如何显示变量值输入格式(informat):指定如何把外部数据转换为SAS数据attrib 变量名 属性=属性值 变量名 属性=属性值;(可以指定多个变量的属性,也可为一个变量同时指定多个属性)3.array 数组读取数据定义格式: array 数组名 (维数说明) 数组元素名列表(初始值表);例如: array test(

    3、3) math Chinese English (0,0,0);说明:数组名为一个合法的SAS名字且不能与同一数据步中的其它变量重名;“维数说明”说明元素个数,这时下标从1开始。“数组元素名列表”列出这个数组的各个元素实际代表的变量名,它们之间用空格隔开; “初始值表”给数据中各元素赋初值,按顺序对应;如果省略初始值,这时初始值为相应数组元素的值(如果数据元素没有值,则初始值为缺失值);定义二维数组,只要在维数说明中指定用逗号分开的两个下标界说明,如:Array table(2,2) x11 x12 x21 x22;字符型数组在数组名(维度说明)后面加 $ 符号,如:array name(3)

    4、 $ 10 child father mother;4.set语句实现数据的复制与修改Set语句可以实现数据集的复制,与其它语句配合使用可以实现对数据集的修改。(1)与if语句配合使用例:将数据集work.c9501复制为数据集c9501a,并把超过100分的语文成绩都改为100分。程序中有一个隐含循环,直到读取输入数据集的最后一个观测。(2)与droop或keep语句配合使用keep语句指定复制数据集时要保留的变量,drop语句指定复制数据集时要删除的变量。例:复制数据集c9501生成c9501b,但只包含name和avg两个变量。(3)与子集if语句配合使用根据指定的条件,取出数据集的某些

    5、行组成的子集。例:只将数据集c9501中数学90分以上,语文100分以上的学生观测取出生成数据集c9501c(4)与数据集选项配合使用功能:用set语句引入数据集时可以给引入的数据集加选项,选项放在数据集名后面的括号内。选择包括:Keep=,指定要保留的变量;Drop=,指定要删除的变量;Obs=,表示读取观测到指定的序号为止;firobs=,表示从指定的序号的观测开始往后读取。例:下面的程序生成一个大数据集huge,然后用数据步从中复制了前100行和前两个变量。5.数据的拆分与合并(1)数据拆分用set语句与output语句联合使用,可以根据某一原则将一个数据集拆分成几个不同的数据集。例:把

    6、数据集c9501中的所有男生的观测放到数据集c9501m中,所有女生的观测放到数据集c9501f中。(2)数据纵向合并有时需要将几个数据集上下纵向合并起来,生成一个大数据集,可以在set语句后列出要合并的数据集名。如果要合并的数据集中含有的变量名都相同,则新数据集不产生新变量;如果不同数据集含有不同的变量名表,则新数据集包含所有数据集中所有不重复变量,其中原数据集没有的变量将赋予缺失值。例:建立score1 和score2数据集,并合并成score数据集。有时在set语句的每一个数据集名后面加一个括号,里面写上in=变量名,此变量可以用来指示每一个观测原来来自于哪一个小数据集,变量取值为1表示

    7、来源于此数据集。例:程序3.5-1把 c9501数据集按男、女拆分成了两个数据集c9501m和c9501f并摒弃了性别变量,下面来上下连接这两个数据集并恢复性别变量信息。(3)数据横向合并a)一对一合并(无by 语句合并)不使用by语句时,merge将一个数据集中的第一个观测值和另一个数据集中的第一个观测值合并,依此类推。在合并时,若某一数据集已没有观测,则其相应变量值为缺失值。如果合并的各个数据集含有相同变量,则在合并后新数据集中此变量只出现一次,其值为merge语句数据集列表中最后一个数据集中的数值。例:将新数据集num 与之前建立的数据集score横向合并。b)匹配合并(带by语句合并)将原来自于不同数据集中具有至少一个变量是共同变量(匹配变量),按照匹配变量取相同数值的观测横向合并起来。要求每个数据集事先必须按照匹配变量排序。其它原则同前。例:将person和language两个数据集按number变量横向合并。


    注意事项

    本文(讲义3数据管理.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开