欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    统计学第七章第八章课后题答案doc.docx

    • 资源ID:11941994       资源大小:720.35KB        全文页数:31页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学第七章第八章课后题答案doc.docx

    1、统计学第七章第八章课后题答案doc统计学复习笔记第七章参数估计一、思考题1解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。根据一个具体的样本计算出来的估计量的数值称为估计值。2简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。3怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间

    2、的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。4解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总

    3、体参数。5简述样本量与置信水平、总体方差、估计误差的关系。1.估计总体均值时样本量n为2.样本量n与置信水平1-、总体方差、估计误差E之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。二、练习题1从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。1)样本均值的抽样标准差等于多少?2)在95%的置信水平下,估计误差是多少?解:已知总体标准差=5,样本容量n=40,为大样本

    4、,样本均值=25,(1)样本均值的抽样标准差=0.7906(2)已知置信水平1=95%,得 =1.96,于是,允许误差是E =1.960.7906=1.5496。2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。1)假定总体标准差为15元,求样本均值的抽样标准误差。2)在95%的置信水平下,求估计误差。3)如果样本均值为120元,求总体均值的95%的置信区间。解:(1)已假定总体标准差为=15元, 则样本均值的抽样标准误差为 =2.1429(2)已知置信水平1=95%,得 =1.96,于是,允许误差是E =1.962.1429=4.2000。

    5、(3)已知样本均值为=120元,置信水平1=95%,得 =1.96, 这时总体均值的置信区间为 =1204.2=可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。3从一个总体中随机抽取n =100的随机样本,得到 =104560,假定总体标准差 = 85414,试构建总体均值的95%的置信区间。解: 已知n =100, =104560, = 85414,1-95% ,由于是正态总体,且总体标准差已知。总体均值在1-置信水平下的置信区间为 104560 1.9685414100 = 104560 16741.144 4从总体中抽取一个n =100的简单随机样本

    6、,得到 =81,s=12。要求:1)构建的90%的置信区间。2)构建的95%的置信区间。3)构建的99%的置信区间。解:由于是正态总体,但总体标准差未知。总体均值在1-置信水平下的置信区间公式为 8112100 = 811.21)1-90%,1.65 其置信区间为 81 1.982)1-95% , 其置信区间为 81 2.3523) 1-99%,2.58 其置信区间为 81 3.0965利用下面的信息,构建总体均值的置信区间。1)= 25, = 3.5,n =60,置信水平为95%2)=119,s =23.89,n =75,置信水平为98%3)=3.149,s =0.974,n =32,置信水

    7、平为90%解: 1) 1-95% , 其置信区间为:251.963.560 = 250.885 2) 1-98% ,则=0.02, /2=0.01, 1-/2=0.99,查标准正态分布表,可知: 2.33 其置信区间为: 1192.3323.8975 = 1196.3453) 1-90%,1.65 其置信区间为: 3.1491.650.97432 = 3.1490.2846利用下面的信息,构建总体均值的置信区间:1)总体服从正态分布,且已知 = 500,n = 15, =8900,置信水平为95%。解: N=15,为小样本正态分布,但已知。则1-95%,。其置信区间公式为 置信区间为:8900

    8、1.9650015=(8646.7 , 9153.2)2)总体不服从正态分布,且已知 = 500,n = 35, =8900,置信水平为95%。解:为大样本总体非正态分布,但已知。则1-95%,。其置信区间公式为 置信区间为:89001.9650035=(8733.9 9066.1)3)总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为90%。解:为大样本总体非正态分布,且未知,1-90%,1.65。 其置信区间为: 89001.6550035=(8761 9039)4)总体不服从正态分布,未知,n = 35, =8900,s =500,置信水平为99%。解:为大样

    9、本总体非正态分布,且未知,1-99%,2.58。其置信区间为:89002.5850035=(8681.9 9118.1)7.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。8.从一个正态总体中随机抽取样本量为8的

    10、样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值的95%置信区间。解:本题为一个小样本正态分布,未知。先求样本均值: = 808=10再求样本标准差:= 84/7 = 3.4641于是 , 的置信水平为 的置信区间是 , 已知 ,n = 8,则 ,/2=0.025,查自由度为n-1 = 7的 分布表得临界值 2.45所以,置信区间为: 102.453.464179.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,

    11、求职工上班从家里到单位平均距离的95%的置信区间。10.从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是1.93。2)求确定该种零件平均长度的95%的置信区间。3)在上面估计中,你使用了统计中的哪一个重要定理?请解释。解:1) 这是一个大样本分布。已知N=36, = 149.5,S =1.93,1-=0.95,。 其置信区间为:149.51.961.93362)中心极限定理论证:如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量 的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布

    12、则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量 充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论基础。11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量如下:(略) 已知食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。12.假设总体服从正态分布,利用下面的数据构建总体均值的99%的置信区间。解: 样本均值 样本标准差: 尽管总体服从正态分布,但是样本n=

    13、25是小样本,且总体标准差未知,应该用T统计量估计。1-=0.99,则=0.01, /2=0.005,查自由度为n-1 = 24的 分布表得临界值 2.8 的置信水平为 的置信区间是 , 13. 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工。得到他们每周加班的时间数据如下(单位:小时):63218171220117902182516152916假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%的置信区间。解:小样本,总体方差未知,用t统计量均值=13.56,样本标准差s=7.801置信区间:=0.90,n=18,=1.7369=(

    14、10.36,16.75)14.利用下面的样本数据构建总体比例丌的置信区间:3)n =44,p = 0.51 ,置信水平为99%4)n =300,p = 0.82 ,置信水平为95%5)n =1150,p = 0.48,置信水平为90%解: 1) 1-= 99%, = 0.01,/2= 0.005,1-/2= 0.995,查标准正态分布表,则2.58 2)1-95%, 3)1-90%,1.65 分别代入15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。已知样本容量n =2

    15、00,为大样本,拥有该品牌电视机的家庭比率p =23%,拥有该品牌电视机的家庭比率的抽样标准误差为 =2.98%双侧置信水平为90%时,通过21=0.90换算为单侧正态分布的置信水平=0.95,查单侧正态分布表得 =1.64, 此时的置信区间为 =23%1.642.98%=可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。双侧置信水平为95%时,得 =1.96, 此时的置信区间为 =23%1.962.98%=可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,28.84%)。16.一位银行的管理人员想估计每

    16、位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信水平为99%。应选取多大的样本?解: 已知 1- = 99%,则2.58。E = 200,= 1000元。 则 N = ()E= (2.581000)200167(得数应该是166.41,不管小数后是多少,都向上进位取整,因此至少是167人)17.要估计总体比例丌,计算下列条件下所需的样本量。6)E=0.02,丌=0.40,置信水平96%7)E=0.04,丌未知,置信水平95%8)E=0.05,丌=0.55,置信水平90%解: 1)已知 1- = 96%,/2 =0.02 ,则2.06

    17、N = 丌(1-丌)E=2.060.40.60.022547 2) 已知 1- = 95%,/2 =0.025 ,则1.96 丌未知,则取使丌(1-丌)最大时的0.5。 N = 丌(1-丌)E=1.960.50.50.046013)置信水平90%,1-90%,1.65, N = 丌(1-丌)E=1.650.550.450.0527018.某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。9)求总体中赞成该项改革的户数比例的置信区间(=0.05)10)如果小区管理者预计赞成的比例能达到80%,估计误

    18、差不超过10%,应抽取多少户进行调查(=0.05)(1)赞成比率的抽样标准误差为 =6.788%由双侧正态分布的置信水平1=95%,得 =1.96, 计算得此时总体户数中赞成该项改革的户数比率的置信区间为 = 64%1.966.788%=可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为(50.70%,77.30%)。(2)如预计赞成的比率能达到80%,即 p=80%, 由 =6.788%,即=6.788% 得样本容量为 n = 34.72 取整为35,即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。19根据下面的样本结果,计算总体标准差的90%的置信区

    19、间:1)=21,S=2,N=502)=1.3,S=0.02,N=153)=167,S=31,N=22解:1)大样本,未知,置信水平90%,1-90%,1.65 211.65250 2)小样本,未知,置信水平90%,1-90%,则查自由度为n-1 = 14的 分布表得临界值 1.761 , = 1.31.7610.0215 3) 大样本, 未知,置信水平90%,1-90%,1.65 1671.65312220 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:

    20、所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66.76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310 要求:(1)构建第一种排队方式等待时间标准差的95的置信区间。解:估计统计量经计算得样本标准差=3.318置信区间:=0.95,n=10,=19.02,=2.7=(0.1075,0.7574)因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待

    21、时间标准差的95的置信区间。解:估计统计量经计算得样本标准差=0.2272置信区间:=0.95,n=10,=19.02,=2.7=(1.57,11.06)因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小!第八章假设检验一、思考题1假设检验和参数估计有什么相同点和不同点?解:参数估计与假设检验是统计推断的两个组成部分。相同点:它们都是利用样本对总体进行某种推断。不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对的值提出一个假设,然后利用样本信息去检

    22、验这个假设是否成立。2什么是假设检验中的显著性水平?统计显著是什么意思?解:显著性水平用表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。(我理解的统计学意义,统计显著是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显著,达不到为统计上水平不显著)3什么是假设检验中的两类错误?解:弃真错误(错误):当原假设为真时拒绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作。取伪错误(错误):当原假设为假时没有拒绝原假设,所犯的错误称为第II类错误,

    23、又称取伪错误。犯第II类错误概率常记作。发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性水平,记作。4两类错误之间存在什么样的数量关系?在样本容量n一定的情况下,假设检验不能同时做到犯和两类错误的概率都很小。若减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。要使和同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。5解释假设检验中的P值。解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为

    24、P值。也称为观察到的显著性水平。P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致程度就越大。6显著性水平与P值有何区别?解: (显著性水平)是一个判断的标准(当原假设为真,却被拒绝的概率),而P是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。可以通过计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的p值,然后与值比较判断。7假设检验依据的基本原理是什么?解: 假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可

    25、以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。8你认为在单侧检验中原假设和备择假设的方向应该如何确定?解: 假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右单侧检验或上限检验),临界值和拒绝域均在右侧。二、练习题1已知某炼铁厂的含碳量服从正态分布N(4.55,0.108),现在测定了9炉铁水,

    26、其平均含碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4.55(=0.05)?解: 已知0=4.55,=0.108,N=9,=4.484,这里采用双侧检验,小样本,已知,使用Z统计。假定现在生产的铁水平均含碳量与以前无显著差异。则,H0 : =4.55 ; H1 : 4.55=0.05,/2 =0.025 ,查表得临界值为1.960 计算检验统计量: = (4.484-4.55)/(0.108/9) = -1.833 决策:Z值落入接受域,在 =0.05的显著性水平上接受H0。结论:有证据表明现在生产的铁水平均含碳量与以前没有显著差异,可以认为现在生产的铁水平均含碳

    27、量为4.55。2一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。解: 已知N=36,=60,=680,0 =700 这里是大样本,已知,左侧检验,采用Z统计量计算。 提出假设:假定使用寿命平均不低于700小时 H0:700 H1: 700 = 0.05,左检验临界值为负,查得临界值: -Z0.05=-1.645计算检验统计量: = (680-700)/(60/36) = -2 决策:Z值落入拒绝域,在 =0.05的显著性水平上拒绝H0,接受H1 结论:

    28、有证据表明这批灯泡的使用寿命低于700小时,为不合格产品。3某地区小麦的一般生产水平为亩产250公斤,其标准差是30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。这种化肥是否使小麦明显增产(=0.05)?解:已知0 =250, = 30,N=25,=270这里是小样本分布,已知,用Z统计量。右侧检验, =0.05,则Z=1.645提出假设:假定这种化肥没使小麦明显增产。即 H0:250 H1: 250计算统计量: Z = (-0)/(/N)= (270-250)/(30/25)= 3.33结论:Z统计量落入拒绝域,在 =0.05的显著性水平上,拒绝H0,接受H1。决策:有证据表明,这种化肥可以使小麦明显增产。4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 已知包重服从正态分布,试检验该日打包机工作是否正常。( =0.05)解:已知N=9,这里是小样本正态分布,未知,双侧检验,采用t统计量,自由度为N-1=8。 =0.05,则T/2=2.37= 99.98 1.22提出假设,假设打包机工作正常:即 H0:=


    注意事项

    本文(统计学第七章第八章课后题答案doc.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开