欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    研-统计3抽样误差t分布参数估计.pptx

    • 资源ID:18858199       资源大小:2.49MB        全文页数:48页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    研-统计3抽样误差t分布参数估计.pptx

    1、均数的抽样误差,均数的抽样误差,t 分布,参数估计分布,参数估计Sampling error of mean,t-distribution,parameters estimation 张建军张建军汕大医学院预防医学教研室汕大医学院预防医学教研室Tel:0754-88900445Email: 主要内容主要内容 均数的抽样误差均数的抽样误差t 分布分布 参数估计参数估计概念:频数分布以均数为中心,左右两侧基本对称概念:频数分布以均数为中心,左右两侧基本对称,靠近均数两侧频数较多,离均数愈远,频数愈少,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多,两侧逐渐减少的对称分布。,形成一个中间

    2、多,两侧逐渐减少的对称分布。是一种连续型分布。又称高斯分布是一种连续型分布。又称高斯分布.回:正分布顾态(normal distribution)正态分布用正态分布用 N(,)表示,其位置与均数有关,表示,其位置与均数有关,形状与标准差有关。形状与标准差有关。医学现象许多呈正态分布,或近似正态分布:如医学现象许多呈正态分布,或近似正态分布:如正常人的生理,生化指标变量,等正常人的生理,生化指标变量,等2s正态分布的密度函数:式中正态分布的密度函数:式中 为均数;为均数;为为标准差;标准差;为圆周率;为圆周率;为自然对数的底,为自然对数的底,即即 2.71828。以上均为常数,仅。以上均为常数,

    3、仅 x 为变量。为变量。x-+2()1()21()2xf xemssp-=(1)标准正态分布标准正态分布:为了应用方便,常将式进行变量变换,即:为了应用方便,常将式进行变量变换,即:u 变换变换.所得到的新变量所得到的新变量 u 的分布即为标准的分布即为标准正态分布。正态分布。u 的含义:变量到均数间的距离相当于标准的含义:变量到均数间的距离相当于标准差的倍数。差的倍数。xuxms-=-+标准正态分布的概率密度函数:(2)u-+2()21()2uuejp-=正态分布的特征和分布规律:正态分布的特征和分布规律:(1)曲线在)曲线在 x 轴的上方,与轴的上方,与 x 轴不相交,当轴不相交,当x=时

    4、,曲线位于最高点。时,曲线位于最高点。f(u=0)=0.3989(2)曲线关于直线)曲线关于直线 x=左右对称。左右对称。(3)正态分布有两个参数)正态分布有两个参数:均数均数,标准差标准差;标标准正态的参数分别为准正态的参数分别为:0,1(4)正态分布的面积分布有一定规律。)正态分布的面积分布有一定规律。正态分布正态分布标准正态分布标准正态分布面积面积(或概或概率率)-1 _ +1-1_+168.27%1.96 _+1.96-1.96_+1.9695.00%2.58 _+2.58-2.58_+2.5899.00%正态分布和标准正态分布曲线下面积分布规律(-1,1),68.27%(-1.96,

    5、1.96),95%(-2.58,2.58),99%双侧概率双侧概率单侧概率单侧概率请思考:请思考:抽样?抽样?统计量?统计量?抽样分布?抽样分布?一、均数的抽样误差和标准误一、均数的抽样误差和标准误均数的抽样误差均数的抽样误差 sampling error of mean 由于总体中存在个体变异,抽样研由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,(或率),样本均数之间也互不相等,这种由这种由抽样引起的差异称为均数的抽

    6、样误差的体现抽样引起的差异称为均数的抽样误差的体现。即:即:iXmijXX 如何估计抽样误差如何估计抽样误差?标准误 标准误 standard error,SE以样本均数为例:以样本均数为例:SE 越大,均数的抽样误差越大,样本均数与越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。总体均数间的差异越大。XSSn=Xnss=当样本例数一定时,样本均数的标准误与原当样本例数一定时,样本均数的标准误与原始数据的标准差成正比;当标准差一定时,始数据的标准差成正比;当标准差一定时,标准误与样本含量 标准误与样本含量 n 的平方根成反比。增的平方根成反比。增加样本含量可以减小抽样误差。加样本含量

    7、可以减小抽样误差。与标准差的区别:与标准差的区别:标准差:表示一般个体值的离散程度;标准差:表示一般个体值的离散程度;标准误:特别说明统计量的离散程度。标准误:特别说明统计量的离散程度。再思考一个问题:再思考一个问题:其它的统计量有抽样误差吗?其它的统计量有抽样误差吗?它们的计算公式怎样?它们的计算公式怎样?Xnss=XSSn=标准误的应用标准误的应用1、用来衡量抽样误差的大小、用来衡量抽样误差的大小:标准误越小,样本均数与总体均数越接近标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;,样本均数的可信度越高;2、结合标准正态分布与、结合标准正态分布与 t 分布曲线下的面积分布曲线下

    8、的面积规律,估计总体均数的置信区间。规律,估计总体均数的置信区间。3、用于假设检验。、用于假设检验。假定假定 2003 年汕头市年汕头市 15 岁女学生的身高服从岁女学生的身高服从均数均数 155.4cm、标准差、标准差 5.3cm 的正态分布。的正态分布。用计算机做抽样模拟试验,从用计算机做抽样模拟试验,从 N(155.4,5.32)的总体中,每次抽出的总体中,每次抽出 10 个数字(样本含量为个数字(样本含量为10),组成一个样本,求出样本均数 ),组成一个样本,求出样本均数 、样本标准差 、样本标准差 S。再求得此。再求得此 100 个样本均个样本均数的均数、样本均数的标准差。数的均数、

    9、样本均数的标准差。抽样分布抽样分布X 样本均数的标准差是什么?样本均数的标准差是什么?.标准误标准误 100 个样本均数构成一个新的分布,也是个样本均数构成一个新的分布,也是正态分正态分布。布。即使原分布为偏态分布,当样本含量足够大时,即使原分布为偏态分布,当样本含量足够大时,新分布也新分布也近似正态分布近似正态分布)。新分布的集中趋势用)。新分布的集中趋势用均数的均数均数的均数来表示,离散趋势用来表示,离散趋势用标准误标准误表示表示 N(,)。各样本均数的均数等于总体均数各样本均数的均数等于总体均数。m2Xs正态总体中抽样正态总体中抽样(样本量(样本量 5)正态总体中抽样正态总体中抽样(样本

    10、量(样本量 10)正态总体中抽样正态总体中抽样(样本量(样本量 30)抽样时样本量抽样时样本量大小决定了样大小决定了样本均数分布的本均数分布的形状,当样本形状,当样本量足够大时,量足够大时,均数分布趋向均数分布趋向正态分布。正态分布。050100150200250300350400450均数频数050100150200250300350400450均数频数050100150200250300350400450500均数频数二、二、t 分布(分布(t-distribution)还记得吗?还记得吗?xums-=u 转换将正态分布转换为标准正态转换将正态分布转换为标准正态,N(0,1)。同理:将样本

    11、均数的分布也可以转换为标准正态同理:将样本均数的分布也可以转换为标准正态分布。分布。即:即:2,()(0,1)XNNmsXXums-=实际工作中,总体标准差往往未知,常用实际工作中,总体标准差往往未知,常用 S 代替代替 计计算标准误,因此:为了和算标准误,因此:为了和 u 分布区别,就变为:分布区别,就变为:/XXXtSSnmm-=均数的分布也是这样均数的分布也是这样如果我们采用另一个正态变量如果我们采用另一个正态变量:于是,均数的分布变成了标准正态分布于是,均数的分布变成了标准正态分布:XXums-=2,()(0,1)XNNmsxums-=但是,条件发生了变化我们通常用代替我们通常用代替

    12、然而,然而,随着样本量的变化而变化,所以,我随着样本量的变化而变化,所以,我们称之为们称之为 t-分布,虽然它是正态分布,但只有分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,准正态分布,此时,u=t/XXXtSSnmm-=XXums-=XsXSXSt t 分布曲线分布曲线t t 分布是一簇分布是一簇对称于对称于 0 的单峰分布曲线。的单峰分布曲线。自由度越小(相当于标准差大),曲线的中间越自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,低,两边越高;随自由度增大,t t 分布曲线逐分布曲线逐

    13、渐逼近于标准正态分布曲线。渐逼近于标准正态分布曲线。当自由度无穷大时,当自由度无穷大时,t t 分布就是标准正态分布分布就是标准正态分布曲线。曲线。每一条每一条 t t 分布曲线,都对应于相应的自由度。分布曲线,都对应于相应的自由度。t t 分布模拟试验分布模拟试验t t 分布曲线下的面积规律分布曲线下的面积规律 与标准正态曲线下的面积规律相似:与标准正态曲线下的面积规律相似:在某一个自由度下,两侧外部总面积为在某一个自由度下,两侧外部总面积为 5%5%的的界限的界限的 t t 值称为值称为 t0.05/2(),t0.05/2(),把两侧外部总把两侧外部总面积为面积为 1%1%的界限的的界限的

    14、 t t 值称为值称为 t0.01/2()t0.01/2()。因此,中部占因此,中部占 95%95%面积的面积的 t t 值范围:值范围:t0.05/2()-t0.05/2(),t0.05/2()-t0.05/2(),中部占中部占 99%99%面积的面积的 t t 值范围:值范围:-t0.01/2()-t0.01/2()-t0.01/2()-t0.01/2()。当自由度确定时,占一定面积的当自由度确定时,占一定面积的 t 界限值界限值,可以查表得出。,可以查表得出。例如:查当自由度例如:查当自由度=20,两侧概率之和为,两侧概率之和为0.05 时,对应的时,对应的 t 值:值:t0.05/2(

    15、20)=2.086,单侧概率为单侧概率为 0.05 时,对应的时,对应的 t 值:值:t0.05(20)=1.725,一般,一般,t 0.05/2(v)1.96,t 0.01/2(v)2.58自由度越小,曲线越低平,自由度越小,曲线越低平,t 比比 1.96,2.58大的多;自由度变大,大的多;自由度变大,t 接近于接近于 1.96,2.58;自由度无穷大,;自由度无穷大,t=1.96,2.58使用使用 t 值表注意:值表注意:同一自由度下同一自由度下,P 越小,越小,t 值越大;值越大;P 值相同时值相同时,自由度越大,自由度越大,t 越小;当自由度无穷大时,越小;当自由度无穷大时,t值与值

    16、与 u 值相等。这也是值相等。这也是 u 分布与分布与 t 分布的区别。分布的区别。t t 分布的主要应用:分布的主要应用:总体均数置信区间估计;总体均数置信区间估计;t t 检验;检验;三、总体均数置信区间的估计三、总体均数置信区间的估计统计推断:参数估计,假设检验统计推断:参数估计,假设检验参数估计:参数估计:点估计(点估计(point estimation):用样本统计量作为用样本统计量作为对总体参数的估计值对总体参数的估计值()。比如均数的估计。比如均数的估计。区间估计区间估计(interval estimation):根据选定的置:根据选定的置信度估计总体均数所在的区间(信度估计总体

    17、均数所在的区间(a 50)足够大足够大 也可参考也可参考 u 分布进行分布进行 95%置信区间:置信区间:99%置信区间:置信区间:2.58,2.58XXXSXS-+1.96,1.96XXXSXS-+3、总体标准差未知,样本例数较小、总体标准差未知,样本例数较小按按 t 分布原理,依据自由度,查出某个概率相分布原理,依据自由度,查出某个概率相应的应的 t 界值,界值,中部占中部占 95%95%面积的面积的 t t 值范围:值范围:-t0.05/2()_ t0.05/2(),-t0.05/2()_ t0.05/2(),占占 99%99%面积的面积的 t t 值范围:值范围:-t0.01/2()_

    18、 t0.01/2()-t0.01/2()_ t0.01/2()进行估计。进行估计。因为:因为:95%95%的样本满足:的样本满足:95%95%置信区间:置信区间:99%99%置信区间:置信区间:XXtSm-=0.05/2,0.05/2,XXXtSXtSnn-+0.01/2,0.01/2,XXXtSXtSnn-+0.05/2|,vXXtSm-95%置信区间的意义:置信区间的意义:理论上,用一次抽样所得的样本均数估计总体理论上,用一次抽样所得的样本均数估计总体均数,犯错误的概率为均数,犯错误的概率为 5%.或进行或进行 100 次抽样,可算得次抽样,可算得 100 个置信区间,个置信区间,平均有平

    19、均有 95 个置信区间包括客观存在的总体均个置信区间包括客观存在的总体均数,只有数,只有 5 个置信区间未包括总体均数。个置信区间未包括总体均数。估计置信区间的注意事项:估计置信区间的注意事项:(1)区间是以上、下可信限为界的一个范围)区间是以上、下可信限为界的一个范围。通常用 表示置信通常用 表示置信限,用 限,用 表示置信区间表示置信区间/2,*/2,*(,)-+XXXtSXtSanan/2,*XXtSan(2)置信区间与正常值范围:)置信区间与正常值范围:95%正常值范围一般是指同质总体内包括正常值范围一般是指同质总体内包括 95%个体值的估计范围,若总体为正态分布,常用个体值的估计范围,若总体为正态分布,常用:计算;计算;95%置信区间是指按照置信区间是指按照 95%置信度估计的总体置信度估计的总体参数的可能范围,常按照下式计算。参数的可能范围,常按照下式计算。前者用标准差,后者用标准误。前者用标准差,后者用标准误。1.96XS0.05/2,0.05/2,XXXtSXtSnn-+以上是均数抽样误差的相关内容。以上是均数抽样误差的相关内容。这是针对某个总体进行的参数估计这是针对某个总体进行的参数估计,对多个总体的参数推断又是什么,对多个总体的参数推断又是什么呢?呢?且听下回!且听下回!谢谢谢谢


    注意事项

    本文(研-统计3抽样误差t分布参数估计.pptx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开