欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    高考复习正态分布与线性回归Word格式文档下载.doc

    • 资源ID:6845987       资源大小:1.67MB        全文页数:15页
    • 资源格式: DOC        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    高考复习正态分布与线性回归Word格式文档下载.doc

    1、当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 奎屯王新敞新疆 相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系 奎屯王新敞新疆 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系 回归分析一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析 奎屯王新敞新疆通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 奎屯王新敞新疆 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行

    2、统计分析的方法。两个变量具有相关关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度 奎屯王新敞新疆粗略地看,散点分布具有一定的规律奎屯王新敞新疆 回归直线 设所求的直线方程为,abxy+=,其中 a、b 是待定系数 1122211()()()nnii

    3、iiiinniiiixxyyx ynxybxxxnxaybx=,=niixnx11,=niiyny11 相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 奎屯王新敞新疆 相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量 y 与 x 的一组观测值,把=niniiiniiiyyxxyyxxr11221)()()(=niniiiniiiynyxnxyxnyx1122221)(叫做变量 y 与 x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.相关系数的性质:r1,且r越接近 1,相关程度越大;且r越接近 0,相关程度越小.显著性水平:显著性水平是统计

    4、假设检验中的一个概念,它是公认的小概率事件的概率值 奎屯王新敞新疆它必须在每一次统计检验之前确定 奎屯王新敞新疆 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取 0.01 和 0.05,自由度为,其中是数据的个数 奎屯王新敞新疆在“相关系数检验的临界值表”查出与显著性水平 0.05 或 0.01 及自由度 n-2(n 为观测值组数)相应的相关数临界值 r0 奎屯王新敞新疆05或 r0 奎屯王新敞新疆01;例如时,0.050.754,0.010.874 奎屯王新敞新疆 求第 3 页 共 15 页 得的相关系数和临界值0.05比较,若0.05,上面与是线性相

    5、关的,当rr0 奎屯王新敞新疆05或 r0 奎屯王新敞新疆01,认为线性关系不显著奎屯王新敞新疆 讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到 奎屯王新敞新疆 题型讲解题型讲解新疆王新敞特级教师源头学子小屋http:/ 例例 1 已知连续型随机变量的概率密度函数+=)2(0)20(1)0(0)(xxkxxxf,且 f(x)0,求常数 k 的值,并计算概率 P(1.52.5)。分析分析

    6、:凡是计算连续型随机变量的密度函数 f(x)中的参数、概率 P(ab)都需要通过求面积来转化而求得。若 f(x)0 且在a,b上为线性,那么 P(ab)的值等于以 b-a 为高,f(a)与 f(b)为上、下底的直角梯形的面积,即1()()()()2P abf af bba=+。解解:1()(0)(02)(2)PPPP=+=+0(02)0P=+1(0)(2)(20)(0)(2)222ffffk=+=+=+21=k;1(1.52.5)(1.52)(22.5)(1.52)16PPPP=+=。例例 2 设),(2NX,且总体密度曲线的函数表达式为:412221)(+=xxexf,xR。(1)求,;(2

    7、)求)2|1(|xP及)22121(+xP的值。分析:根据表示正态曲线函数的结构特征,对照已知函数求出和。利用一般正态总体),(2N与标准正态总体 N(0,1)概率间的关系,将一般正态总体划归为标准正态总体来解决。解:(1)由于222)2(2)1(41222121)(+=xxxeexf,根据一般正态分布的函数表达形式,可知=1,2=,故 XN(1,2)。(2)2121()2|1(|+=xPxP 2121(12)(12)()()22(1)(1)2(1)12 0.8413 1FF+=+=6826.0=。又)21()221()22121(+=+FFxP 2 2121()()(2)(1)22(2)(1

    8、)10.97720.8413 1+=+=+8185.0=。点评:在解决数学问题的过程中,将未知的,不熟悉的问题转化为已知的、熟悉的、已解决了的问题,是我们常用的手段与思考问题的出发点。通过本例我们还可以看出一般正态分布与标准正态分布间的内在关联。第 4 页 共 15 页 例例 3 某中学有 1000 人参加并且高考数学成绩近似地服从正态分布()210,100N,求此校数学成绩在 120 分以上的考生人数。(2)0.977)解:用表示此中学数学高考成绩,则)10,100(2N()()120 100120112010.02310PP=120 分以上的考生人数为 10000.02323 点评:通过公

    9、式)()(=xxF转化成标准正态总体,然后查标准正态分布表即可 奎屯王新敞新疆 例例 4 将温度调节器放置在贮存着某种液体的容器内,调节器设定在 d,液体的温度(单位:)是一个随机变量,且N(d,0.52).(1)若 d=90,求89 的概率;(2)若要保持液体的温度至少为 80 的概率不低于 0.99,问 d 至少是多少?(其中若N(0,1),则(2)=P(2)=0.9772,(2.327)=P(2.327)=0.01).分析:(1)要求 P(89)=F(89),N(d,0.5)不是标准正态分布,而给出的是(2),(2.327),故需转化为标准正态分布的数值.(2)转化为标准正态分布下的数值

    10、求概率 p,再利用 p0.99,解 d.解:(1)P(89)=F(89)=(5.09089)=(2)=1(2)=10.9772=0.0228.(2)由已知 d 满足 0.99P(80),即 1P(80)10.01,P(80)0.01.(5.080d)0.01=(2.327).5.080d2.327.d81.1635.故 d 至少为 81.1635.点评:(1)若N(0,1),则=N(0,1).(2)标准正态分布的密度函数 f(x)是偶函数,x0 时,f(x)为减函数.例例 5 在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是:(1)提出统计假设:某种指标服从正态分布 N(,2);

    11、(2)确定一次试验中的取值 a;(3)作出统计推断:若 a(3,+3),则接受假设,若 a(3,+3),则拒绝假设.某砖瓦厂生产的砖的“抗断强度”服从正态分布 N(30,0.8),质检人员从该厂某一天生产的 1000 块砖中随机抽查一块,测得它的抗断强度为 27.5 kg/cm2,你认为该厂这天生产的这批砖是否合格?为什么?由于在一次试验中落在区间(3,+3)内的概率为 0.997,故几乎必然落在上述区间内.于是把=30,=0.8 代入,算出区间(3,+3)=(27.6,32.4),而 27.5(27.6,32.4).据此认为这批砖不合格.例例 6 已知测量误差N(2,100)(cm),必须进

    12、行多少次测量,才能使至少有一次测量误差的绝对值不超过 8 cm 的频率大于 0.9?第 5 页 共 15 页 解:设表示 n 次测量中绝对误差不超过 8 cm 的次数,则B(n,p).其中 P=P(|0.9,n 应满足 P(1)=1P(=0)=1(1p)n0.9,n)5671.01lg()9.01lg(=4329.0lg1=2.75.因此,至少要进行 3 次测量,才能使至少有一次误差的绝对值不超过 8 cm 的概率大于 0.9.例例 7 已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:年份 1985 1986 1987 1988 1989 199

    13、0 1991 1992 x(kg)70 74 80 78 85 92 90 95 y(t)5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 年份 1993 1994 1995 1996 1997 1998 1999 x(kg)92 108 115 123 130 138 145 y(t)11.5 11.0 11.8 12.2 12.5 12.8 13.0 (1)求 x 与 y 之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量 y 与使用氮肥量之间的回归直线方程,并估计每单位面积施肥 150kg 时,每单位面积蔬菜的年平均产量。分析分析:(1)使用样本相关系数

    14、计算公式来完成;(2)查表得出显著性水平 0.05 与自由度 15-2 相应的相关系数临界05.0r比较,若05.0rr 则线性相关,否则不线性相关。解解:(1)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ix 70 74 80 78 85 92 90 95 92 108 115 123 130 138 145 iy 5.1 6.0 6.8 7.8 9.0 10.2 10.0 12.0 11.5 11.0 11.8 12.2 12.5 12.8 13.0 iiyx 357 444 544 608.4 765 938.4 90

    15、0 1140 1058 1188 1357 1500.6 1625 1766.4 1885 101151515=x,11.10157.151=y,1611251512=iix,55.16281512=iiy,8.16076151=iiiyx。故蔬菜产量与放用氮肥量的相关系数 8643.0)11.101555.1628)(10115161125(11.10101158.1607622=r。由于 n=15,故自由度 15-2=13。由相关系数检验的临界值表查出与显著水平 0.05 及自由度 13 相关系数临界值514.005.0=r,则05.0rr,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。

    16、(2)设所求的回归直线方程为abxy+=,则0937.01011516112511.10101158.160761515221512151=xxyxyxbiiiii,6463.01010937.011.10=xbya,回归直线方程为)(701.146463.00937.0txy=+=。求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用第 6 页 共 15 页 含统计的科学计算器,能简单得到=niix1,=niiy1,=niiy12,=niiy12,=niiiyx1这些量,也就无需有制表这一步,直接算出结果就行了。另外,利用计算机中有关应用程序也可以对这些数

    17、据进行处理。例例 8 假设关于某设备的使用年限 x 和所支出的维修费用 y(万元),有如下的统计资料:x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 若由资料可知 y 对 x 呈线性相关关系。试求:(1)线性回归方程;(2)估计使用年限为 10 年时,维修费用是多少?本题为了降低难度,告诉了 y 与 x 间呈线性相关关系,目的是训练公式的使用。(1)列表如下:i 1 2 3 4 5 ix 2 3 4 5 6 iy 2.2 3.8 5.5 6.5 7.0 iiyx 4.4 11.4 22.0 32.5 42.0 2ix 4 9 16 25 36 4=x,5=y,90512=i

    18、ix,3.11251=iiiyx 于是23.145905453.112552251251=xxyxyxbiiiii,08.0423.15=bxya。线性回归方程为:08.023.1+=+=xabxy。(2)当 x=10 时,38.1208.01023.1=+=y(万元)即估计使用 10 年时维修费用是 12.38 万元。本题若没有告诉我们 y 与 x 间是呈线性相关的,应首先进行相关性检验。如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。小结小结:1.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大

    19、且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.2.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.学生练习学生练习新疆王新敞特级教师源头学子小屋http:/ 1.下面哪有个数不为总体特征数的是(D)A.总体平均数 B.总体方差 C.总体标准差 D.总体样本 答案:D 2.设随机变量服从二项分布 B(6

    20、,21),则 P(=3)=(A)A.165 B.163 C.85 D.83 第 7 页 共 15 页 答案:A 3.设随机变量N(,),且 P(C)=P(C),则 C 等于 A.0 B.C.D.解析:由正态曲线的图象关于直线 x=对称可得答案为 D.答案:D 4.如果随机变量N(,2),且 E=3,D=1,则 P(11)等于 A.2(1)1 B.(4)(2)C.(2)(4)D.(4)(2)解析:对正态分布,=E=3,2=D=1,故P(11)=(13)(13)=(2)(4)=(4)(2).答案:B 5.某厂生产的零件外直径N(8.0,1.52)(mm),今从该厂上、下午生产的零件中各随机取出一个

    21、,测得其外直径分别为 7.9 mm 和 7.5 mm,则可认为 A.上、下午生产情况均为正常 B.上、下午生产情况均为异常 C.上午生产情况正常,下午生产情况异常 D.上午生产情况异常,下午生产情况正常 解析:根据 3原则,在 8+31.5=8.45(mm)与 831.5=7.55(mm)之外时为异常.答案:C 6.随机变量服从正态分布 N(0,1),如果 P(1)=0.8413,求 P(10).解:N(0,1),P(10)=P(05)=1P(x5)=1F(5)=1(385)=1(1)=11(1)=(1)=0.8413.对第二个方案,有 xN(6,22),于是 P(x5)=1P(x5)=1F(

    22、5)=1(265)=1(0.5)=(0.5)=0.6915.相比之下,“利润超过 5 万元”的概率以第一个方案为好,可选第一个方案.9.为考虑广告费用 x 与销售额 y 之间的关系,抽取了 5 家餐厅,得到如下数据:广告费用(千元)1.0 4.0 6.0 10.0 14.0 销售额(千元)19.0 44.0 40.0 52.0 53.0 现要使销售额达到 6 万元,则需广告费用为_(保留两位有效数字)解析:先求出回归方程y=bx+a,令y=6,得 x=1.5 万元.答案:1.5 万元 第 8 页 共 15 页 10.设随机变量服从 N(0,1),求下列各式的值:(1)P(2.55);(2)P(

    23、-1.44);(3)P(|1.52)。一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。但在标准正态分布表中只给出了00 x,即)()(00 xxxP=的情形,对于其它情形一般用公式:(-x)=1-(x);p(axb)=(b)-(a)及)(1)(00 xxPxxP=等来转化。(1)55.2(1)55.2(=PP 1(2.55)1 0.99460.0054;=(2)44.1(1)44.1()44.1(=P 0749.09251.01=;(3)1)52.1(2)52.1()52.1()52.152.1()52.1|(|=PP 8714.019357.02=说明:说明:从本题可知,

    24、在标准正态分布表中只要给出了00 x的概率,就可以利用上述三个公式求出其它情形下的概率。11某厂生产的圆柱形零件的外径N(4,0.25)。质检人员从该厂生产的 1000 件零件中随机抽查一件,测得它的外径为 5.7cm。试问该厂生产的这批零件是否合格?欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸是在(-3,+3)内,还是在(-3,+3)之外。由于圆柱形零件的外径N(4,0.25),由正态分布的特征可知,正态分布 N(4,0.25)在区间(4-30.5,4+30.5)即(2.5,5.5)之外取值的概率只有 0.003,而)5.5,5.2(7.5,这说明在一次试

    25、验中,出现了几乎不可能发生的小概率事件,根据统计中假设检验的基本思想,认为该厂这批产品是不合格的。判断某批产品是否合格,主要运用统计中假设检验的基本思想。(二)习题(二)习题+答案答案 一、选择题一、选择题 某 市 组 织 一 次 高 三 调 研 考 试,考 试 后 统 计 的 数 学 成 绩 服 从 正 态 分 布,其 密 度 函 数 为)(1021)(200)80(2Rxexfx=,则下列命题不正确的是 (B )A该市这次考试的数学平均成绩为 80 分;B分数在 120 分以上的人数与分数在 60 分以下的人数相同;C分数在 110 分以上的人数与分数在 50 分以下的人数相同;D该市这次

    26、考试的数学成绩标准差为10.设随机变量服从标准正态分布()0,1N,若()1Pp=,则()10P=(D)A.2p B.1p C.1 2p D.12p 设随机变量),(2N,且)()(cPcP=,则 c 等于(D).0.DCBA 设的概率密度函数为2)1(221)(=xexf,则下列结论错误的是(C )(A)1()1(=pp (B)11()11(=pp(C)(xf的渐近线是0=x (D)1=)1,0(N 设随机变量服从正态分布()0,1N,记()()xPx=,则下列结论不正确的是(D)A()102=B()()1xx=第 9 页 共 15 页 C()()()21 0Paaa=D()()()1 0P

    27、aaa=【解】()()010=,()102=,A 正确,B显然正确 1)(2)(1)()()()()()()(=aaaaaaPaPaaPaP ,C 正确()()()()112122PaPaaa=D 为不正确 设随机变量),(2N,且1,3=DE,则)11(P=(B )1)2(2.)4()2(.)2()4(.1)1(2.DCBA 如果随机变量)1,0(N,),(2N,那么=(C)(.+DCBA 已知随机变量服从正态分布2(2)N,(4)0.84P=,则(0)P=(A )A0.16 B0.32 C0.68 D,0.84 设随机变量服从正态分布(2,9)N,若(1)(1)PcPc+=,则c=(B)A

    28、.1 B.2 C.3 D.4 已知随机变量服从正态分布N(3,a2),则P(3)(D)(A)15 (B)14 (C)13 (D)12 如果随机变量 N(,2),且 E3,D1,那么 P(24)等于 (B )(其中 N(,2)在(,)内的取值概率为 0.683;在(2,2)内的取值概率为 0.954;在(3,3)内的取值概率为 0.997)A0.5 B0.683 C0.954 D0.997 若(3)=0.9987,则标准正态总体在区间(3,3)内取值的概率为 (B)A 0.9987 B0.9974 C0.944 D 0.8413 下图是正态分布 N(0,1)的正态分布曲线图,下面 4 个式子中,

    29、能表示图中阴影部分面积的有(C)个 1()2a ()a 1()2a 1()()2aa (A)1 (B)2 (C)3 (D)4 某学校在一次数学基础测试统计中,所有学生成绩服从正态分布(100,4)N(单位:分),现任选一名学生,该生成绩在96分到104 分内的概率是(D )A(2)(2)FF B1(2)C2(1)1 D2(2)1 2、设随机变量服从正态分布 N(0,1),p(1)P,则 P(11)(C )A12P B1P C12P D12P y O-a x 第 10 页 共 15 页 设两个正态分布2111()(0)N,和2222()(0)N,的密度函数图像如图所示。则有(A)A1212,B1

    30、212,C1212,D1212,设随机变量 服从正态分布 N(,2)(0),若 P(0)P(1)1,则 的值为(D )A1 B1 C12 D12 (07 安徽卷,10)以()x表示标准正态总体在区间(),x内取值的概率,若随机变量服从正态分布()2,N,则概率()P等于(B )A.()()+B.()()11 C.1 D.()2+解析:考查()2,N 与()0,1N的关系:若()2,N,则()2112xxP xxx=解:或1)1(2 答案为 B (07 全国卷,14):在某项测量中,测量结果服从正态分布()()21,0N.若在()0,1内取值的概率为 0.4,则在()0,2内取值的概率为-。解法一:()21,N()()()()11PP=+=第 11 页 共 15 页 0 2 1 y 0.4 0.4-1.96 1.96 y 0 0.025 0.475 0.025 0.475()()1 10 1110100.50.4P


    注意事项

    本文(高考复习正态分布与线性回归Word格式文档下载.doc)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开