高中数学第一章统计8最玄乘估计教案北师大版必修.docx
- 文档编号:15579553
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:18
- 大小:77.69KB
高中数学第一章统计8最玄乘估计教案北师大版必修.docx
《高中数学第一章统计8最玄乘估计教案北师大版必修.docx》由会员分享,可在线阅读,更多相关《高中数学第一章统计8最玄乘估计教案北师大版必修.docx(18页珍藏版)》请在冰点文库上搜索。
高中数学第一章统计8最玄乘估计教案北师大版必修
2019-2020年高中数学第一章统计8最玄乘估计教案北师大版必修
教学分析
教材通过思考交流引入了最小二乘法,进一步提出了线性回归方程.教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使同学们了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.
三维目标
经历用不同估算方法描述两个变量线性相关的过程.了解最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.
重点难点
教学重点:
求线性回归方程,以及线性回归分析.
教学难点:
确定线性回归系数.
课时安排
1课时
教学过程
导入新课
思路1.客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:
某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上,数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关——回归直线及其方程.
思路2.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:
气温/℃
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
如果某天的气温是-5℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?
为解决这个问题,我们接着学习两个变量的线性相关——回归直线及其方程.
推进新课
新知探究
提出问题
(1)画散点图的步骤是什么?
(2)正、负相关的概念?
(3)什么是线性相关?
(4)观察下面人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?
图1
(5)什么叫作回归直线?
(6)如何求回归直线的方程?
什么是最小二乘法?
(7)利用计算机如何求线性回归方程?
活动:
学生回顾,再思考或讨论,教师及时提示指导.
讨论结果:
(1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫作散点图.
(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.
(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.
(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来进一步分析.
(5)从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.
(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线.
那么,我们应当如何具体求出这个回归方程呢?
有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗?
有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗?
还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距.
同学们不妨去实践一下,看看这些方法是不是真的可行?
(学生讨论:
1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:
分别分析各方法的可靠性.如图2、3、4:
图2
图3
图4
上面这些方法虽然有一定的道理,但总让人感到可靠性不强.
实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式
①
这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的系数.
推导以上公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.
假设我们已经得到两个具有线性相关关系的变量的一组数据
(x1,y1),(x2,y2),…,(xn,yn),且所求回归方程是y=a+bx,其中a、b是待定参数.当变量x取xi(i=1,2,…,n)时可以得到y=a+bxi(i=1,2,…,n),
它与实际收集到的yi之间的偏差是yi-y=yi-(a+bxi)(i=1,2,…,n).
图5
这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi-y)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用
Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2②
来刻画n个点与回归直线在整体上的偏差.
这样,问题就归结为:
当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.
通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法(methodofleastsquare).
(7)见课本本节信息技术应用中利用计算机求线性回归方程的具体操作步骤.
应用示例
思路1
例1在上一节练习中,从散点图可以看出,某小卖部6天卖出热茶的杯数(y)与当天气温(x)之间是线性相关的.数据如下表:
气温(xi)/℃
26
18
13
10
4
-1
杯数
20
24
34
38
50
64
(1)试用最小二乘法求出线性回归方程.
(2)如果某天的气温是-3℃,请预测这天可能会卖出热茶多少杯.
解:
(1)从散点图中可以看出,表中的两个变量是线性相关的.
图6
先列表求出,其他数据如下表.
i
xi
yi
xi2
xiyi
1
26
20
676
520
2
18
24
324
432
3
13
34
169
442
4
10
38
100
380
5
4
50
16
200
6
-1
64
1
-64
合计
70
230
1286
1910
进而,可以求得b=
≈-1.648,
a≈57.557.
于是,线性回归方程为y=57.557-1.648x.
(2)由上面的最小二乘估计得出的线性回归方程知,当某天的气温是-3℃时,卖出热茶的杯数估计为57.557-1.648×(-3)=62.501≈63.
变式训练
下表为某地近几年机动车辆数与交通事故数的统计资料.
机动车辆数x/千台
95
110
112
120
129
135
150
180
交通事故数y/千件
6.2
7.5
7.7
8.5
8.7
9.8
10.2
13
(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,请说明理由;
(2)如果具有线性相关关系,求出线性回归方程.
解:
(1)在直角坐标系中画出数据的散点图,如图7.
图7
直观判断散点在一条直线附近,故具有线性相关关系.
(2)计算得b≈0.0774,a=-1.0241,
所以,所求线性回归方程为y=-1.0241+0.0774x.
思路2
例1给出施化肥量对水稻产量影响的试验数据:
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
(1)画出上表的散点图;
(2)求出回归直线的方程.
解:
(1)散点图如图8.
图8
(2)计算得b≈4.75,a≈257.
从而得回归直线方程是y=257+4.75x.
变式训练
1.一个车间为了规定工时定额,需要确定加工零件所花费的时间.为此进行了10次试验,测得数据如下:
零件个数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间y(分)
62
68
75
81
89
95
102
108
115
122
请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程.
解:
在直角坐标系中画出数据的散点图,如图9.
图9
直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:
b≈0.668,a=-b≈54.96.
因此,所求线性回归方程为y=bx+a=54.96+0.668x.
2.已知10只狗的血球体积及红血球数的测量值如下:
血球体积x(mL)
45
42
46
48
42
35
58
40
39
50
红血球数y(百万)
6.53
6.30
9.52
7.50
6.99
5.90
9.49
6.20
6.55
8.72
(1)画出上表的散点图;
(2)求出回归直线的方程.
解:
(1)散点图如图10.
图10
(2)(45+42+46+48+42+35+58+40+39+50)=44.50,
(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37.
设回归直线方程为y=a+bx,则b=0.175,a==-0.418,
所以所求回归直线的方程为y=-0.418+0.175x.
点评:
对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a,b的计算公式,算出a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:
计算平均数;计算xi与yi的积,求∑xiyi;计算∑xi2;将结果代入公式求b;用a=求a;写出回归直线方程.
知能训练
1.下列两个变量之间的关系哪个不是函数关系()
A.角度和它的余弦值B.正方形边长和面积
C.正n边形的边数和它的内角和D.人的年龄和身高
答案:
D
2.三点(3,10),(7,20),(11,24)的线性回归方程是()
A.y=5.75-1.75xB.y=1.75+5.75x
C.y=1.75-5.75xD.y=5.75+1.75x
答案:
D
3.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
设y对x呈线性相关关系.试求:
(1)线性回归方程y=bx+a的回归系数a,b;
(2)估计使用年限为10年时,维修费用是多少?
答案:
(1)b=1.23,a=0.08;
(2)12.38.
4.我们考虑两个表示变量x与y之间的关系的模型,δ为误差项,模型如下:
模型1:
y=6+4x;模型2:
y=6+4x+e.
(1)如果x=3,e=1,分别求两个模型中y的值;
(2)分别说明以上两个模型是确定性模型还是随机模型.
解:
(1)模型1:
y=6+4x=6+4×3=18;
模型2:
y=6+4x+e=6+4×3+1=19.
(2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因δ的不同,所得y值不一定相同,且δ为误差项是随机的,所以模型2是随机性模型.
5.以下是收集到的新房屋销售价格y与房屋大小x的数据:
房屋大小x(m2)
80
105
110
115
135
销售价格y(万元)
18.4
22
21.6
24.8
29.2
(1)画出数据的散点图;
(2)用最小二乘法估计求线性回归方程;
(3)计算此时Q(a,b)和Q(2,0.2)的值,并作比较.
解:
(1)散点图如图11.
图11
(2)计算得b≈0.1962,a≈1.8166,所以,线性回归方程为y=1.8166+0.1962x.
(3)Q(1.8166,0.1962)≈5.171,Q(2,0.2)≈7.0,由此可知,求得的a=1.8166,b=0.9162是函数Q(a,b)取最小值的a,b值.
拓展提升
某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统计资料如下表:
科研费用支出(Xi)与利润(Yi)统计表单位:
万元
年份
科研费用支出
利润
xx
xx
xx
xx
xx
xx
5
11
4
5
3
2
31
40
30
34
25
20
合计
30
180
要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型.
解:
设线性回归模型直线方程为Yi=β0+β1Xi,
因为
=30,
求解参数β0、β1的估计值:
β1=2,β0=20.
所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为Yi=20+2Xi.
课堂小结
1.求线性回归方程.
2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
作业
习题1—82、3.
设计感想
本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.
2019-2020年高中数学第一章统计从普查到抽样教学设计北师大版必修3
一、教学目标
1.了解普查的意义.
2.结合具体的实际问题情境,理解随机抽样的必要性和重要性.
二、设计思路与教学建议
首先,教科书从我国第五次人口普查展开讨论,并通过对人口普查的了解,说明普查的工作量大,要耗费大量的时间和资金.从某种意义来说,人口普查虽然规模大,还是可以实现的,但有时候,即使有时间、精力和财力也难以完成普查.因此,教科书通过几个现实生活中的例子来说明这一点,进而让学生体会到抽样的必要性.更进一步,教科书通过学生的思考与交流,总结出抽样调查的优点,让学生了解样本和总体的概念.
【问题提出】P3
通过我国第五次人口普查的有关数据,让学生体会到统计对政府决策的重要作用――统计数据可以提供大量的信息,为国家的宏观决策提供有关的支持.教科书通过对人口普查的有关新闻报道,让学生体会人口普查的规模是何等的宏大与艰辛.
教科书提出了三个有代表性的问题.第一个问题主要是针对人口普查的作用,人口普查可以了解一个国家人口全面情况,比如,人口总数、男女性别比、受教育状况、增长趋势等.人口普查是对国家的政府决策实行情况的一个检验,比如,国家计划生育政策,经济发展战略,国家“普及九年义务教育”政策,人民群众的生活水平等.第二个问题是针对普查本身存在的问题提出的,以加深学生对于普查的理解.学生可能有一个误解,普查就是100%的准确,其实不然,即使是最周全的调查方案,在实际执行时都会产生一个误差.教科书通过这个问题,目的是让学生理解在人口普查中出现漏登是正常情况,调查方案的设计是尽可能让这个误差降低到最小.同时,也要让学生理解人口普查的工作,即使出现漏登现象,人口普查的数据对国家的宏观决策依然具有重要的作用.第三个问题是针对人口普查工作的艰辛而提出的,让学生体会人口普查数据得来不易,要尊重人口普查人员的劳动,对人口普查工作要大力支持.
如果有条件,教学时教师可以利用多媒体动态地展示我国第五次人口普查的有关信息,教师也可以借助当时电视、广播等媒体的有关报道,让学生更加直观、形象地了解我国人口普查的历史.(本书在备用课程资源中有这方面的内容,教师备课时可以参考)
【阅读材料】P4
“阅读材料”是课堂阅读,目的是让学生了解普查工作的特点和重要性,以及我国目前主要的一些普查工作.进而,总结出普查的主要不足之处,这是从一个方面说明了抽样调查的必要性.【例1和其后的“思考交流”】P4~5
紧接着,教科书通过例1和“思考交流”的两个问题,让学生了解普查有时候难以实现.这主要有两个方面的原因,其一,被调查对象的量大;其二,普查对被调查对象本身具有一定的破坏性.这从另一个方面说明了抽样调查的必要性.然后,教科书通过抽象概括总结出抽样调查的两个主要优点.
【例2和其后的“思考交流”】P5~6
主要是讨论在抽样调查时,什么样的样本才具有代表性.在抽样时,如果抽样不当,那么调查的结果可能会出现与实际情况不符,甚至是错误的结果,导致对决策的误导.在抽样调查时,一定要保证随机性原则,尽可能地避免人为因素的干扰;并且要保证每个个体以一定的概率被抽取到;同时,还要注意到要尽可能地控制抽样调查中的误差.
对于“思考交流”,在教学时,教师要引导学生先独立思考,然后再进行交流,讨论一定要充分.对于样本的代表性问题,教师要求学生用具体的实例来说明,不要抽象地来讨论这个问题,要让学生体会到在一个具体的问题中,什么样的样本才具有代表性,如何避免人为的因素.
【练习】P6
练习中的第3题是有关家庭收入问题,是一个社会敏感问题,可能有些被调查对象不愿意被调查,所以在设计调查问卷时要考虑到这一点.一个最简单而且有效的解决方法,就是在问卷上不要求写工作单位和姓名之类的信息.
【习题1―1】P6
1.目的是让学生回顾与总结课堂的学习内容,同时也是对通常生活中所说的药品疗效的一个反思.通常情况下,如果是发放问卷进行调查,那么收回来的问卷不具有代表性,原因是愿意交回问卷的人,通常是对这种药品感兴趣,或这种药品对他确实有效,否则他是不愿意交回问卷的.因此,在设计抽样调查时一定要注意这个问题,这也是人为因素造成的.科学合理的检测一个药品的疗效,通常是对一些临床的病人(要符合抽样的随机性原则)进行跟踪调查,有的还应该用安慰剂做对比试验,只有在考察各种因素后,得到的数据才比较可靠.
2.这是一个开放性问题,目的是让学生进一步体会什么样的样本才具有代表性.题中所提到的某同学的调查情况,只能代表他们班级的家庭收入情况,不能代表我国国民收入情况.这是一项复杂的调查,但本题的目的不是要求学生设计出一个非常完善的调查方案,而是让学生体会,在这样的社会调查中应当关注到各个方面的因素.教学时,教师不要求学生有一个统一的答案,但要求学生进行讨论,并主要考虑到这三个方面的问题:
东部与西部、城市与农村,发达地区与欠发达地区不同的工作岗位
3.目的是培养学生查阅资料的能力,进一步了解我国人口普查的历史,体会人口普查对国家宏观决策的作用.有条件的学校可组织学生进行分工合作,查书面资料(报刊、杂志、书籍等),查网上资料,然后进行汇总与交流.如果学生有困难,教师可以提供一些资料让学生进行阅读.
三、备用课程资源
中国历代人口与人口普查
xx-10-23《光明日报》记者 白英
据有关资料记载,我国是世界上最早统计人口的国家之一.但由于历代政府调查人口都是为了征税、抽丁,因而不重视保存统计资料,直到1949年以后,我国才开展了现代含义的科学的人口普查.
历史上的户籍与人口
据文献记载,公元前22世纪,大禹曾经“平水土,分九州,数万民”.所谓“数万民”就是统计人口.当时统计的数字约1355万;进入封建社会以后,人口数字统计更加完整.汉朝有“算赋法”;隋朝有“输籍法”;唐代有“户籍法”;宋朝采用“三保法”;元世祖忽必烈于至元八年颁布《户口条画》,将强制为奴的人口按籍追出,编为国家民户,使人口不断增加,元顺帝初年,全国人口达到8000万左右.明朝有“户贴制度”,现存明初洪武年间的户口统计,其总数均已达到1000余万户,近6000万人口.
具有近代意义的人口普查只有两次.第一次是在1909年清朝政府为了应付资产阶级民主革命,筹备立宪事宜,下令开展全国人口普查,当时推算我国人口约3.7亿.第二次是国民党内政部举行的人口普查.当时由于军阀混战,只调查了13个省份的人口,1931年发表的全国为47480万人口的数字,是后来估算出来的.
新中国三次人口普查
为查清人口状况,新中国成立后先后于1953年、1964年和1982年进行过三次全国人口普查.三次人口普查的时间都确定为7月1日0时.
前两次人口普查,是在我国计算技术比较落后的条件下进行的,1953年的人口普查全国人口总数为58260万余人,100岁以上的有3384人,最高年龄为155岁.1964年的人口普查增加了本人成份、文化程度和职业三项.全国人口为69122万人.其中大学文化程度的287万人,高中文化程度的912万人;初中文化程度的3235万人,小学文化程度的19582万人.
1982年的第三次全国人口普查,调查项目共19项,增加了常住人口的户口登记状况,在业人口的行业、职业和不在业人口状况,婚姻状况以及生育子女总数、存活子女总数和生育胎次等,并首次使用电子计算机处理大量数据.截至1982年6月30日24时,全国人口为100391万人.
随着新中国成立,人口的死亡率大幅下降,人口的生育率维持在高水平,1949年~1958年出现“第一次生育高峰”,人口净增加近1.2亿.1962年~1970年,9年净增人口1.57亿,1971年~1980年,全国总人口由8.52亿增加到1980年的9.87亿,净增人口1.35亿,实行计划生育政策已迫在眉睫.
同国际接轨的第四次普查
1990年我国进行了第四次人口普查,这次普查与联合国关于1990年人口普查的建议相一致.与第三次全国人口普查相比,这次人口普查的登记项目增加了“1985年7月1日常住地状况”和“迁来本地的原因”两项,旨在查清我国人口迁移的流向和原因.同时增加了死亡人口的民族、文化程度、死亡时的婚姻状况和死者生前从事的主要职业等.
到1990年7月1日,全国总人口113051万人,9年净增人口1.27亿.
1982年~1990年我国人口的文化素质发生了明显变化,1990年具有大专文化程度的人从1982年的604万人上升为1576万人,其增长率为160%;高中文化程度者的增长率为9%;初中文化程度增长率为48%;小学文化程度增长率为18%.文盲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 第一章 统计 最玄乘 估计 教案 北师大 必修