统计学重点总结1.docx
- 文档编号:17517224
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:16
- 大小:304.41KB
统计学重点总结1.docx
《统计学重点总结1.docx》由会员分享,可在线阅读,更多相关《统计学重点总结1.docx(16页珍藏版)》请在冰点文库上搜索。
统计学重点总结1
第一章绪论
一、名词解释
1.设计(design):
根据研究的问题与目的,从统计学的角度对各步提前做出的周密计划和安排。
2.收集资料(datacollection):
获得研究所需要的原始数据的过程。
3.整理资料(datastoring):
对收集到的原始资料进行归类整理汇总的过程。
4.分析资料(dataanalysis):
对整理的资料进行统计分析,获取资料中有关信息的过程。
5.总体(population):
根据研究目的确定的,所有同质研究对象某一(组)指标值的集合
6.样本(sample):
从总体中随机抽取的,数量足够的能代表总体特征的部分研究对象某一(组)指标值的集合。
7.参数(parameter):
描述总体特征的指标称为参数。
8.变异(variation):
对同质研究对象某指标值得波动性称为变异。
9.误差(error):
观测值与真实值之差。
10.变量(variable):
描述研究对象某种特征的指标。
11.资料(data):
变量全部或部分测量值构成资料
12.计量资料(measurementdata):
每个研究对象的变量值为一数值,表现出有量的大小,由这样一组研究对象定量观测值所构成的资料为计量资料。
13.计数资料(enumerationdata):
每个研究对象的变量值为互不相同的属性之一,由这样一组研究对象定性变量值组成的资料为技术资料。
14.等级资料(rankeddata):
每个研究对象变量值为互不相容的属性之一,且这些属性间有程度的递进或递减关系,有这样一组研究对象变量值组成的资料为等级资料。
15.过失误差:
由科研工作者的失误或过错造成的误差。
16.系统误差(systematicerror):
在收集资料的过程中,由于研究者或被研究者、仪器设备、检测用材料、检测方法、环境条件等原因,造成观测结果偏大或偏小,称作系统误差。
17.随机误差(randomerror):
在没有过失误差和系统误差的条件下仍存在大量偶然无法消除的不确定因素所引起的误差为随机误差。
18.频率(frequency):
在相同条件下,独立重复实验n次,其中事件A出现了m次,那么事件A发生的频率记为f(A)=m/n,0≤f(A)≤1
19.概率(probability):
某一随机事件A发生的可能性大小的度量,记为P(A),0≤P(A)≤1
20.实验因素(studyfactor):
研究者根据研究目的在实验中需要观察并阐明其效应的因素
21.实验对象(subject):
处理因素作用的客体
22.实验效应(experimentaleffect):
试验因素作用于受试对象后受试对象产生的变化。
23.随机化(randomization):
在抽样或分组时必须做到总体中每个个体都有相等的机会被抽入样本或分配到各组中
24.重复原则(replication):
在相同的实验条件下进行的受试对象需具有一定数量。
25.同质(homogeneity):
根据研究目的确定的研究对象相同特征的条件组合。
二、简答题
1.三种误差的区别
误差:
实际观察值与客观真实值之差
1过失误差:
人为失误
不应出现的
2系统误差:
因测量仪器、实验方法导致的
测量时不可避免,但可通过一些方法改善或消除
3随机误差:
排除上述误差后尚存的误差
受多种无法控制的因素的影响
有一定的规律,可以估计出来
2.资料和变量分类
第三章定量资料的统计描述
一、名词解释
1.频数(frequency):
资料中相同数值或同种属性的观察单位个数。
2.极差(range):
所有数据的范围,定义为一组中观察值的最大值和最小值的差。
3.组距:
将极差分成若干组段,相邻组段之间的区间长度为组距。
4.直方图(histogram):
组段为横坐标,频数或频率为纵坐标,用矩形面积大小表示频数多少。
5.集中趋势(centraltendency):
大多数观察值所在的中心位置。
6.离散趋势(tendencyofdispersion):
各观察值原理中心值的程度。
7.算术均数(arithmeticmean):
用来描述一组对称分布数值的平均水平。
计算方法有直接法和加权法。
8.几何均数(geometricmean):
多用于对正态分布或观测值之间存在倍数关系的资料,描述它的平均水平。
计算方法有直接法和加权法。
9.中位数(median):
将一组观察值按大小顺序排列后位置居中的数值。
10.百分位数(percentile):
将一组观察值按大小顺序排列后,第X位观察值为第X百分数,记作Px。
11.四分位数间距(inter-quartilerange,IQR):
第75位百分数P75和第25位百分数P25之差。
12.方差(variance):
反应每个观察值的平均变异的数值,总体方差用σ²表示,计算公式为
13.标准差(standarddeviation):
方差的平方根。
14.变异系数(coefficientofvariation,CV):
用于比较两个或多个度量衡单位不同指标的变异程度,或者虽然单位相同但均数相差悬殊的情况,是标准差与均数之比。
15.正态分布(normaldistribution):
又称高斯分布,频数分布以均数为中心两侧基本对称,越接近均数分布越多,越远离均数频数越少。
16.P-P图:
以实际观测值的累计频率为横轴,以正态分布的理论或期望累计概率为纵轴绘制散点图。
17.Q-Q图:
以实际观测值的分位数Px为横轴,以正态分布的理论或期望分位数为纵轴绘制散点图。
18.标准误(standarderrorofmean):
样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度
二、简答题
1.标准差和标准误的区别
;
•标准差SD用于描述离散程度,用于使用样本对总体的变异进行估计。
在标准正态分布中,约95%的总体个体值落在均数的1.96个标准差之内(mean±1.96SD)。
•标准误是对均数可靠程度的估计,表示的是抽样误差。
论文中应标明使用的是标准差还是标准误
2.正态分布的参数
μ为位置参数,描述正态分布的集中位置
σ为尺度参数,决定了正态分布的形状
3.如何将一个一般的正态分布转换为标准正态分布
将样本中的每个数值减去μ,再除σ²
4.制定参考值范围的注意事项
①选定足够例数的同质正常人作为研究对象
判断是否分组(为保证足够的同质性)
性别年龄种族……
②控制检测误差
③单、双侧界值
•双侧:
白细胞计数,血清总胆固醇……
•单侧:
上限:
转氨酶,尿铅,发汞……
•下限:
肺活量,IQ……
4选择百分界值
⑤选择合适的算法来计算参考值范围
5.正态曲线下面积常用数据
-σ~σ:
0.6827
-1.96σ~1.96σ:
0.9500
-2.58σ~2.58σ:
0.9900
第四章定量资料的参数估计与假设检验基础
一、名词解释
1.统计推断(statisticalinference):
从总体中随机抽取一定数量的观察单位作为样本进行抽样研究,然后由样本信息推断总体特征。
2.抽样误差(samplingerror):
由于个体变异存在,抽样研究所造成的各样本统计量之间以及样本统计量与总体参数之间的变异。
3.可信区间(confidenceinterval,CI):
从已知总体中以固定n重复随机抽样,根据每个样本可算得一个可信区间,则平均有1-α的可信区间包含了总体参数,而不是总体参数落在该范围的可能性是1-α。
4.中心极限定理(centrallimittheorem):
讨论随机变量序列部分和分布渐近于正态分布的一类定理
5.小概率事件(smallprobabilityevent):
概率≤0.05的随机事件,在以此观察或事件中发生的可能性很小,可认为不发生
二、简答题
1.可信区间和个体容许值参考区间
95%总体均数可信区间:
95%个体值容许区间(医学参考值范围):
2.假设检验的基本步骤
①建立假设检验,确定检验水准
②计算检验统计量
③确定P值,做出推断
P>α,不拒绝H0,差异无统计学意义
P≤α,拒绝H0,差异有统计学意义。
第五章定量资料的t检验
一、名词解释
1.配对设计(paireddesign):
一种比较特殊的设计形式,能较好控制非实验因素对研究结果的影响。
2.Ⅰ类错误:
实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观测值落到拒绝域,拒绝原本正确的H0,导致推断错误结论,这样的错误称为Ⅰ类错误。
3.Ⅱ类错误:
实际情况与H0不符,由于抽样的原因,使得统计量的观测值落到接受域,不能拒绝原本错误的H0,导致推断错误,这样的错误成为Ⅱ类错误。
二、简答题
1.α和β的关系
1.样本量固定,α确定后,可计算β
2.样本量固定时,α越小,β越大。
3.若要同时减小α和β,需增加样本量。
2.单样本t检验
已知:
1.某样本A的均数
2.某总体B的均数
用途:
检验某样本是否来自于某总体
适用条件:
单样本定量资料且来自正态总体
3.配对样本t检验
用途:
判断不同的处理方式是否有差别
适用情况:
配对设计,差值服从正态分布
4.两独立样本t检验
适用条件:
①两样本所代表的总体分别服从正态分布。
②两总体体方差相等。
③若方差不等,应使用
检验。
方差不齐:
5.答题模板
①检验假设:
H0:
μ0=μ1,总体均数相等
H1:
μ0≠μ1,总体均数不相等
α=0.05
②计算统计量t
单样本
配对样本
两独立样本
方差不齐
③确定p值:
t=xxx,查表得p=xxx<0.05,在α=0.05的水平上拒绝H0,接受H1,差异有统计学意义(或p>0.05,不拒绝H0,差异无统计学意义)。
第六章定量资料的方差分析
一、名词解释
1.总变异(totalvariation):
样本中每个数值与总体均数不同,这种变异称为总变异。
2.组间变异(variationbetweengroups):
在实验中每个分组的均数与总均数不同,这种变异称为组间变异。
3.组内变异(variationwithingroups):
每组中的每个观察值与该组的样本均数不同,这种变异称为组内变异。
4.完全随机设计(completelyradomizeddesign):
将同质的受试对象随机分配到各个处理组,再观察其实验效应,是研究单因素多水平的实验设计方法。
5.单向方差分析(one-wayANVOA):
完全随机设计只考察一个处理因素,统计分析处理因素各个水平组建均属有无显著差别。
6.随机区组设计(radomizedblockdesign):
又称配伍设计,通常是将受试对象按性质相同或相近者组成b个区组,每个区组中的受试对象分别随机分配到k个处理组中。
7.析因设计(factorialdesign):
将两个或多个实验因素的各水平进行全面组合,对各种组合都进行试验,探讨各实验因素的单独效应、主效应以及各因素之间的交互效应。
二、简答题
1.方差分析适用条件
①各样本是相互独立的随机样本,均服从正态分布。
②各样本的总体方差相等,可通过方差齐性检验来判断方差齐性。
2.完全随机设计、随机区组设计的方差分析是如何分解变异的?
3.方差齐性检验的方法
•F检验:
要求资料服从正态分布,只适用于两样本方差齐性检验。
•Batlett检验:
要求资料服从正态分布,可以用于多个样本的方差齐性检验。
•Levene检验:
不依赖总体分布的具体形式,而且可以用于多个样本的方差齐性检验。
4.两两比较的方法
①SNK法:
比较任意两组的均数是否相同
②Dunnett法:
比较任意处理组与对照组的均数是否相同
5.答题模板
①假设
H0:
X组总体均数相同
H1:
X组总体均数不全相同
α=0.05
②计算统计量
③P=xxx<0.05,在α=0.05的检验水准上拒绝H0,差异有统计学意义,可认为X组总体均数不完全相同,但还需进行两两比较(或p>0.05,不拒绝H0,差异无统计学意义,尚不能认为总体均数不全相同)
第七章卡方检验
一、名词解释
1.行x列表:
基本数据多于四个格子的表格。
二、简答题
1.卡方检验基本思想和基本公式
基本思想:
实际频数和理论频数吻合的程度
计算公式
A为实际频数(actualfrequency)
T为理论频数(theoreticalfrequency).
四格表专用公式
2.卡方检验需要校正的情况
①n≥40,T≥5,可用基本公式或专用公式计算X²
②n≥40,1≤T<5,用校正公式或
③n<40或T<1,或前两种方法p≈α,用Fisher确切概率法。
3.配对四格表的卡方检验(McNemar检验)
甲
乙
合计
+
-
+
a
b
a+b
-
c
d
c+d
合计
a+c
b+d
n
当b+c<40时用校正公式
4.RxC表注意事项
5.答题模板
①假设:
H0:
π1=π2,率相同
H1:
π1≠π2,不同
α=0.05
②计算统计量(注意各种检验的适用条件和校正条件)
③X²=xxx,P=xxx<0.05,在α=0.05的检验水准拒绝H0,差异有统计学意义,可认为不同/不完全相同(或P>0.05,不拒绝H0,差异无统计学意义,尚不能认为不同)
注:
当基本公式p值与校正公式p值对结果判定不同时,以Fisher确切概率为准
第八章定性资料的统计描述
一、名词解释
1.相对数(relativenumber):
指两个有联系的指标之比。
2.率(rate):
指某现象在某时间点或时间段内发生的实际观察单位数与同时期可能发生该现象的总观察单位数之比。
3.构成比(constituentratio):
指某事物内部某一组成成分的观察单位与该事物各组成部分的观察单位总数之比。
4.相对比(relativeratio):
两个有关事物的指标之比,用以描述两者的对比水平。
5.动态数列(dynamicseries):
按时间顺序将一系列统计指标排列起来,用以观察和比较该事物在事件上的变化和发展趋势。
第九章秩和检验
一、简答题
答题模板
①假设
H0:
总体分布位置相同
H1:
总体分布位置不同
α=0.05
②计算p值
③统计量=xxx,P=xxx≤0.05,在α=0.05检验水准拒绝H0,差异有统计学意义,可认为总体分布位置不同,(若三组以上)还需进行两两比较。
(或不拒绝H0,差异无统计学意义,不能认为总体分布位置不同)
总结:
统计方法的选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 重点 总结