统计案例导学案.doc
- 文档编号:6146793
- 上传时间:2023-05-09
- 格式:DOC
- 页数:16
- 大小:745KB
统计案例导学案.doc
《统计案例导学案.doc》由会员分享,可在线阅读,更多相关《统计案例导学案.doc(16页珍藏版)》请在冰点文库上搜索。
§1.1.1回归分析的基本思想及其初步应用
(一)
学习目标
1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2.了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---相关系数.
学习过程
一、课前准备
(预习教材P2~P4,找出疑惑之处)
问题1:
“名师出高徒”这句彦语的意思是什么?
有名气的老师就一定能教出厉害的学生吗?
这两者之间是否有关?
复习1:
函数关系是一种关系,而相关关系是一种关系.
复习2:
回归分析是对具有关系的两个变量进行统计分析的一种常用方法,其步骤:
.
二、新课导学
※学习探究
实例从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:
编号
1
2
3
4
5
6
7
8
身高
165
165
157
170
175
165
155
170
体重
48
57
50
54
64
61
43
59
问题:
画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.
解:
由于问题中要求根据身高预报体重,因此选自变量x,为因变量.
(1)做散点图:
从散点图可以看出和有比较好的
相关关系.
(2)==
所以
于是得到回归直线的方程为
(3)身高为172cm的女大学生,由回归方程可以预报其体重为
问题:
身高为172cm的女大学生,体重一定是上述预报值吗?
思考:
线性回归模型与一次函数有何不同?
新知:
用相关系数r可衡量两个变量之间关系.计算公式为
r=
r>0,相关,r<0相关;
相关系数的绝对值越接近于1,两个变量的线性相关关系,它们的散点图越接近;
,两个变量有关系.
※典型例题
例1某班5名学生的数学和物理成绩如下表:
学生
学科
A
B
C
D
E
数学成绩(x)
88
76
75
64
62
物理成绩(y)
78
65
70
62
60
(1)画散点图;
(2)求物理成绩y对数学成绩x的回归直线方程;
(3)该班某学生数学成绩为96,试预测其物理成绩;
变式:
该班某学生数学成绩为55,试预测其物理成绩;
小结:
求线性回归方程的步骤:
※动手试试
练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据
(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值)
三、总结提升
※学习小结
1.求线性回归方程的步骤:
2.线性回归模型与一次函数有何不同
※知识拓展
在实际问题中,是通过散点图来判断两变量之间的性关系的,
学习评价
※自我评价你完成本节导学案的情况为().
A.很好B.较好C.一般D.较差
※当堂检测(时量:
5分钟满分:
10分)计分:
1.下列两个变量具有相关关系的是()
A.正方体的体积与边长
B.人的身高与视力
C.人的身高与体重
D.匀速直线运动中的位移与时间
2.在画两个变量的散点图时,下面哪个叙述是正确的()
A.预报变量在x轴上,解释变量在y轴上
B.解释变量在x轴上,预报变量在y轴上
C.可以选择两个变量中任意一个变量在x轴上
D.可选择两个变量中任意一个变量在y轴上
3.回归直线必过()
A.B.C.D.
4.越接近于1,两个变量的线性相关关系.
5.已知回归直线方程,则时,y的估计值为.
课后作业
一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有
缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:
转速x(转/秒)
16
14
12
8
有缺点零件数y(件)
11
9
8
5
(1)画散点图;
(2)求回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制
在什么范围内?
§1.1.1回归分析的基本思想及其初步应用
(二)
学习目标
1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2.了解评价回归效果的三个统计量:
总偏差平方和、残差平方和、回归平方和.
3.会用相关指数,残差图评价回归效果.
学习过程
一、课前准备
(预习教材P4~P7,找出疑惑之处)
复习1:
用相关系数r可衡量两个变量之间关系.r>0,相关,r<0相关;
越接近于1,两个变量的线性相关关系,它们的散点图越接近;,两个变量有关系.
复习2:
评价回归效果的三个统计量:
总偏差平方和;残差平方和;回归平方和.
二、新课导学
※学习探究
探究任务:
如何评价回归效果?
新知:
1、评价回归效果的三个统计量
(1)总偏差平方和:
(2)残差平方和:
(3)回归平方和:
2、相关指数:
表示对的贡献,公式为:
的值越大,说明残差平方和,说明模型拟合效果.
3、残差分析:
通过
来判断拟合效果.通常借助图实现.
残差图:
横坐标表示,纵坐标表示.
残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域的宽度越,说明拟合精度越,回归方程的预报精度越.
※典型例题
例1关于与y有如下数据:
2
4
5
6
8
30
40
60
50
70
为了对、y两个变量进行统计分析,现有以下两种线性模型:
,,试比较哪一个模型拟合的效果更好?
小结:
分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
例2假定小麦基本苗数x与成熟期有效苗穗y之间存在相关关系,今测得5组数据如下:
15.0
25.8
30.0
36.6
44.4
39.4
42.9
42.9
43.1
49.2
(1)画散点图;
(2)求回归方程并对于基本苗数56.7预报期有效穗数;
(3)求,并说明残差变量对有效穗数的影响占百分之几.
(参考数据:
,)
※动手试试
练1.某班5名学生的数学和物理成绩如下表:
学生
学科
A
B
C
D
E
数学成绩(x)
88
76
75
64
62
物理成绩(y)
78
65
70
62
60
(导学案第1页例1)
(4)求学生A,B,C,D,E的物理成绩的实际成绩和回归直线方程预报成绩的差.并作出残差图评价拟合效果.
小结:
1.评价回归效果的三个统计量:
2.相关指数评价拟合效果:
3.残差分析评价拟合效果:
三、总结提升
※学习小结
一般地,建立回归模型的基本步骤:
1、确定研究对象,明确解释、预报变量;
2、画散点图;
3、确定回归方程类型(用r判定是否为线性);
4、求回归方程;
5、评价拟合效果.
※知识拓展
在现行回归模型中,相关指数表示解释变量对预报变量的贡献率,越接近于1,表示回归效果越好.如果某组数据可以采取几种不同的回归方程进行回归分析,则可以通过比较作出选择,即选择大的模型.
学习评价
※自我评价你完成本节导学案的情况为().
A.很好B.较好C.一般D.较差
※当堂检测(时量:
5分钟满分:
10分)计分:
1.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数如下,其中拟合
效果最好的模型是().
A.模型1的相关指数为0.98
B.模型2的相关指数为0.80
C.模型3的相关指数为0.50
D.模型4的相关指数为0.25
2.在回归分析中,残差图中纵坐标为().
A.残差B.样本编号C.xD.
3.通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为().
A.回归分析B.独立性检验分析
C.残差分析D.散点图分析
4.越接近1,回归的效果.
5.在研究身高与体重的关系时,求得相关指数
,可以叙述为“身高解释了的体重变化,而随机误差贡献了剩余”所以身高对体重的效应比随机误差的.
课后作业
练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据
(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值)
(4)求相关指数评价模型.
§1.1.1回归分析的基本思想及其初步应用(三)
学习目标
1.通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.
3.了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较.
学习过程
一、课前准备
(预习教材P4~P7,找出疑惑之处)
复习1:
求线性回归方程的步骤
复习2:
作函数和的图像
二、新课导学
※学习探究
探究任务:
如何建立非线性回归模型?
实例一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.
温度
21
23
25
27
29
32
35
产卵数个
7
11
21
24
66
115
325
(1)根据收集的数据,做散点图
上图中,样本点的分布没有在某个区域,因此两变量之间不呈关系,所以不能直接用线性模型.由图,可以认为样本点分布在某一条指数函数曲线的周围(为待定系数).
对上式两边去对数,得
令,则变换后样本点应该分布在直线
的周围.这样,就利用模型来建立y和x的非线性回归方程.
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
作散点图(描点)
由上表中的数据得到回归直线方程
因此红铃虫的产卵数和温度的非线性回归方程为
※典型例题
例1一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,
温度
21
23
25
27
29
32
35
产卵数个
7
11
21
24
66
115
325
(散点图如由图,可以认为样本点集中于某二次曲线的附近,其中为待定参数)试建立与之间的回归方程.
思考:
评价这两个模型的拟合效果.
小结:
利用线性回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.
三、总结提升
※学习小结
利用线性回归方程探究非线性回归问题,可按“作散点图建模确定方程”这三个步骤进行.
※知识拓展
非线性回归问题的处理方法:
1、指数函数型
①函数的图像:
②处理方法:
两边取对数得,即.令把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出.
2、对数曲线型
①函数的图像
②处理方法:
设,原方程可化为
再根据线性回归模型的方法求出.
3、型
处理方法:
设,原方程可化为,再根据线性回归模型的方法求出.
学习评价
※自我评价你完成本节导学案的情况为().
A.很好B.较好C.一般D.较差
※当堂检测(时量:
5分钟满分:
10分)计分:
1.两个变量y与x的回归模型中,求得回归方程为,当预报变量时().
A.解释变量
B.解释变量大于
C.解释变量小于
D.解释变量在左右
2.在回归分析中,求得相关指数,则().
A.解释变量解对总效应的贡献是
B.解释变量解对总效应的贡献是
C.随机误差的贡献是
D.随机误差的贡献是
3.通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为().
A.回归分析B.独立性检验分析
C.残差分析D.散点图分析
4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得回归直线方程为,则该模型的回归方程为.
5.已知回归方程,则时,y的估计值为.
课后作业
为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个
6
12
25
49
95
190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)试求出预报变量对解释变量的回归方程.
§1.2.1独立性检验的基本思想及其初步应用
学习目标
1.通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性;
2.会根据列联表求统计量.
学习过程
一、课前准备
(预习教材P12~P14,找出疑惑之处)
复习1:
回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.
二、新课导学
※学习探究
新知1:
1.分类变量:
.
2.列联表:
.
试试:
你能列举出几个分类变量吗?
探究任务:
吸烟与患肺癌的关系
1.由列联表可粗略的看出:
(1)不吸烟者有患肺癌;
(2)不吸烟者有患肺癌.
因此,直观上课的结论:
.
2.用三维柱柱图和二维条形图直观反映:
(1)根据列联表的数据,作出三维柱形图:
由上图可以直观地看出,吸烟与患肺癌.
(2)根据列联表的数据,作出二维条形图:
由上图可以直观地看出,吸烟与患肺癌.
根据列联表的数据,作出等高条形图:
由上图可以直观地看出,吸烟与患肺癌.
反思:
(独立性检验的必要性)通过数据和图形,我们得到的直观印象是患肺癌有关.那是否有一定的把握认为“吸烟与患肺癌有关”呢?
新知2:
统计量
吸烟与患肺癌列联表
假设
:
吸烟与患肺癌没关系,
则在吸烟者和不吸烟者中患肺癌不患肺癌者的相应比例.即
因此,越小,说明吸烟与患肺癌之间关系;反之,.
=
※典型例题
例1吸烟与患肺癌列联表
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸 烟
2099
49
2148
总 计
9874
91
9965
求.
※动手试试
练1.性别与喜欢数学课程列联表:
喜欢数学
不喜欢数学
总 计
男
37
85
122
女
35
143
178
总 计
72
228
300
求.
三、总结提升
※学习小结
1.分类变量:
.
2.列联表:
.
3.统计量:
.
※知识拓展
1.分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等.分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义.如用“0”表示“男”,用“1”表示“女”.
2.独立性检验的步骤(略)及原理(与反证法类似):
反证法
假设检验
要证明结论A
备择假设H
在A不成立的前提下进行推理
在H不成立的条件下,即H成立的条件下进行推理
推出矛盾,意味着结论A成立
推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1-))很大
没有找到矛盾,不能对A下任何结论,即反证法不成功
推出有利于H成立的小概率事件不发生,接受原假设
课后作业
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:
不健康
健 康
总计
不优秀
41
626
667
优 秀
37
296
333
总 计
78
922
1000
求.
§1.2.2独立性检验的基本思想及其初步应用
学习目标
通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性检验的实施步骤与必要性
学习过程
一、课前准备
(预习教材P14~P16,找出疑惑之处)
复习1:
统计量:
复习2:
独立性检验的必要性:
二、新课导学
※学习探究
新知1:
独立性检验的基本思想:
1、独立性检验的必要性:
2、独立性检验的原理及步骤:
反证法
假设检验
要证明结论A
备择假设H
在A不成立的前提下进行推理
在H不成立的条件下,即H成立的条件下进行推理
推出矛盾,意味着结论A成立
推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1-))很大
没有找到矛盾,不能对A下任何结论,即反证法不成功
推出有利于H成立的小概率事件不发生,接受原假设
探究任务:
吸烟与患肺癌的关系
第一步:
提出假设检验问题
H:
第二步:
根据公式求观测值
k=
(它越小,原假设“H:
吸烟与患肺癌没有关系”成立的可能性越;它越大,备择假设“H:
”成立的可能性越大.)
第三步:
查表得出结论
P(k2>k)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
0.455
0.708
1..323
2.072
2.706
3.84
5.024
6.635
7.879
10..83
※典型例题
例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?
你所得的结论在什么范围内有效?
小结:
用独立性检验的思想解决问题:
第一步:
第二步:
第三步:
例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
喜欢数学课程
不喜欢数学
总 计
男
37
85
122
女
35
143
178
总计
72
228
300
由表中数据计算得到的观察值.在多大程度上可以认为高中生的性别与是否数学课程之间有关系?
为什么?
※动手试试
练1.某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:
不健康
健 康
总计
不优秀
41
626
667
优 秀
37
29
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 案例 导学案