第一二章 绪论 数据整理.docx
- 文档编号:16566820
- 上传时间:2023-07-14
- 格式:DOCX
- 页数:15
- 大小:210.74KB
第一二章 绪论 数据整理.docx
《第一二章 绪论 数据整理.docx》由会员分享,可在线阅读,更多相关《第一二章 绪论 数据整理.docx(15页珍藏版)》请在冰点文库上搜索。
第一二章绪论数据整理
第一章绪论
第一节生物统计学的性质和作用
一、什么是生物统计学
1、定义:
生物统计学就是运用统计学的原理和方法,来研究生物界数量现象的科学方法。
它是一门应用统计方法或数学逻辑来搜集、整理、分析和解释生物界数量现象的科学方法。
是统计学和生物科学相结合的边缘学科。
工具:
相当于光学显微镜、电子显微镜、
2、生物统计学的特点、属性:
归纳性、概率性
要求个体间的度量值而不是个体间的分类,要求的是数据而不是修饰词
二、为什么要学习生物统计学
1.“生物统计学”能为我们提供数据整理分析的方法
2.“生物统计学”能为我们提供由样本推断总体的方法
3.“生物统计学”能为我们分析变异因素提供一系列决策和方法
4.“生物统计学”可以帮助我们分析现象之间的关系
5.“生物统计学”对实验设计也有指导作用
第二节学习生物统计学的预备知识
一、总体和样本
(一)总体
具有共同性质的个体所构成的集团
无限总体
有限总体
(二)样本
由总体中随机抽取的若干个体所构成的集团
样本容量(n)
大样本,(n30)
小样本,(n≤30)
随机样本
二、变数和变量
1.变数
X、Y……
2.变量
x1、x2、x3、……
观察值
三、参数和统计量
1.参数
总体的特征数,如平均数μ、标准差σ
2.统计量
样本的特征数,如标准差s、平均数
四、误差、偏差和错误
误差=观察值-真值
偏差=观察值-平均观察值
误差和偏差统称为“随机误差”,简称“机误”
五、准确度和精确度
准确度:
观察值与真值之间的符合程度。
精确度:
重复观察值之间彼此相符合的程度。
复习思考题
①什么叫总体?
什么叫样本?
如何使抽取的样本具有代表性?
②精确度的概念及作用?
③错误和误差是一回事吗?
如何克服试验中发生错误?
④生物统计学的基本特点是什么?
第二章数据整理
第一节频数分布
一、试验资料的性质
(一)、数量性状的资料
1.连续型数据(度量数据)
2.离散型数据(间断、不连续数据)
(二)、质量性状的资料
能观察而不能量测的性状,如花色、有芒无芒
1.应用统计次数的方法
2.给予每类性状以相当的数量
二、频数表和频数图的绘制
(一)离散型数据资料的整理
例1:
调查每天出生的10名新生儿中,体重超过3kg的人数,共调查120天。
试对调查数据进行整理。
分析:
调查每天出生的10名新生儿中,体重超过3kg的人数;调查120天,将获得120个原始数据。
数据排列没有规律,但只可能有11种情况:
1名也没有,有1名,有两名,…,10名都是。
共11种可能。
处理:
按11种可能的情况进行分组,称每一种情况为组值。
每10名新生儿体重超过3kg的人数的频数(率)表
组值
(体重超过3kg的人数)
频数计算
频数
频率
0
1
2
3
4
5
6
7
8
9
10
一
十
正正十
正正正口
正正正正正正正口
正正正正正正口
正正
三
0
0
0
1
2
12
19
39
34
10
3
0.000
0.000
0.000
0.008
0.017
0.100
0.158
0.324
0.283
0.083
0.025
总计
120
0.999
(二)、连续型数据种资料的整理
例2、某农场在做高粱“三尺三”提纯时,调查了100株高粱的株高数据,结果如下(单位:
cm):
156155153144156150157160150160156150156160155160151157155159161156141156145156153158161157149153155162154152162162161159161156162151152154157162158155153151157156153147158155148163157153159155150159157159151152159158170163154158152163158154164155156158164148164154157165158166154154157167157159156158,试对数据进行整理。
分析:
连续型数据。
数据分布范围:
170-141=29
如何分组?
1.求极差
R=maxx–minx
2、确定组数和组距
数据个数分组时的组数
505-10
1008-16
20010-20
30012-24
50015-30
100020-40
3、选定组限、组界和组中点值
确定的原则和他们各自的作用。
4、归组,统计各组的频数和频率
三、属性性状资料的整理
属性分组(x)
频数(f)
频率%
红米非糯
96
53.6
红米糯稻
37
20.7
白米非糯
31
17.3
白米糯稻
15
8.4
合计(n)
179
100
(四)、频数(率)分布图
1、直方图(用于连续型数据)
图2-1“三尺三”高粱株高的直方图
2、多边形图
(用于连续型数据)
图2-2“三尺三”株高的多边形图
3、条形图(二维)
(用于离散型数据)
图2-3新生儿出生体重超过3公斤人数的条形图(二维)
3、条形图(三维,也称柱形图)
图2-4水稻F2代米粒性状条形图(三维)
4、累积频数图
(五)、研究频数分布的意义
1、根据频数分布,可以看出数据的集中情况,常用平均数表示全部数据的集中点。
2、根据频数分布,可以看出数据的变异情况,一般以变异数反映数据的离中趋势和变异性。
3、从频数分布图可以看出曲线的形状。
(六)、频数(率)分布的不恒定性
由于抽样具有随机性,即使在同一总体中抽出的两个样本容量相同的样本,其样本的频数分布也不完全一致,有时差异还会很大,这就是频数分布的不恒定性。
因此,当用样本推断总体时,推断的结果也会有所不同;这就需要对总体的分布有所了解,在后续章节中我们会涉及相关的问题。
第二节平均数和变异数
一、平均数
(一)、平均数的意义和种类
平均数是数量资料的代表值,表示资料中观察值的中心位置,并且可以作为资料的代表值与另一组资料相比较,借以明确二者间相差的情况。
1、算术平均数
一个数量资料中各个观察值的总和除以观察值的个数所得的商数,称为算术平均数,记作
,简称为平均数或均数。
2、中位数Md
将资料内所有观察值按从大到小排列,居于中间位置的观察值称为中位数。
*奇数和偶数个数据或分组时的确定原则
3、众数Mo
资料中最常见的观察值或频数最多的一组中点值,称为众数。
4、几何平均数G
如有n个观察值,其相乘积再开n次方所得的数值,即为几何平均数。
(二)、算术平均数的定义公式及其基本特征
1、算术平均数的定义公式
*离均差的代数和是“零”。
**离均差的平方和最小。
(三)、算术平均数的计算方法
1、非频数资料(小样本)
直接按定义公式计算,平均数的单位与观察值的单位相同。
2、频数资料(大样本)
I离散型数据
X:
组值,f:
频数,N:
总频数,k:
组数
平均每10个新生儿中,体重超过3Kg的人数为7个。
II连续型数据
其中m:
中值,f:
频数,N:
总数,k:
组数
二、变异数
表示数据资料离中趋势和变异程度的统计数叫变异数。
(一)、变异数的意义和种类
1、极差R
R=maxX-minX
应用实例:
品种两个小麦品种的每穗小穗数总和平均极差
甲131415171819182122231801810
乙16161718181819202018180184
说明乙的麦穗整齐。
如果
选择一个共同比较的标准
:
由于
,又由于
,且数据越分散,离均差的平方和越大,可以考虑使用其作为度量数据变异的一个指标。
离均差的平方和,以SS表示。
若一个样本有3个数据,SS=20;
又有一个样本有30个数据,SS=20;
显然后一个样本的变异小,为了考虑这种差异,将
则有:
2、方差
将各个离均差平方求和,所得数值称离均差的平方和,缩写为SS,平方和除以自由度的商值为方差。
3、标准差
方差的平方根就是标准差,以s表示。
4、变异系数CV
两个小麦主茎高度的测量结果
品种平均数cm标准差cm变异系数%
甲95.09.029.5
乙75.08.511.3
(二)、标准差的计算方法和特性
1、非频数资料
按计算公式计算:
试证明:
2.频数资料的计算
s=1.30人
I离散型数据
s=4.85cm
II连续型数据
3、标准差的特性及作用
①标准差的大小受多个观察值的影响,如果观察值间的差异较大,其离均差也大,因而标准差也大,反之亦反。
②在计算标准差时,对各观察值加上或减去一个常数,其标准差不变。
如果给各观察值乘或除以一个常数a,则所得的标准差扩大或缩小了a倍。
③在正态布情况下,一个样本变量的分布情况可作如下估计:
在
的范围内,将包含全部观察值个数的68.27%,在
的范围内,将包含全部观察值的95.45%,在
的范围内,将包含全部观察值个数的99.73%。
④标准差表示数据资料的离散程度,标准差小,说明数据资料比较集中在平均数附近;标准差大,则表明数据比较分散。
复习思考题:
复习思考题:
①什么是数量性状?
其数据的特点是什么?
②什么是质量性状?
在生物统计学里如何研究质量形状?
③什么是频数表(图)?
研究频数(图)分布的意义?
④平均数和变异数的意义与种类?
算术平均数的基本特征是什么?
⑤试证明“离均差的代数和为零”和“离均差的平方和最小”。
⑥什么是加权平均数?
如何计算加权平均数?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一二章 绪论 数据整理 第一 数据 整理