医学统计学整理.docx
- 文档编号:6111240
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:24
- 大小:40.49KB
医学统计学整理.docx
《医学统计学整理.docx》由会员分享,可在线阅读,更多相关《医学统计学整理.docx(24页珍藏版)》请在冰点文库上搜索。
医学统计学整理
一、绪论
1..统计学是医学研究设计的技术三大原则:
对照、随机、重复
2.资料分类:
计量资料计数资料等级资料
计量资料:
指对每个观察单位某个变量用仪器、工具等测量方法或其他定量方法获得的定量观察结果,即为计量资料(measurmentdata)。
也叫定量数据Quantitativedata。
①有计量单位②数据间有连续性
计数资料:
将观察单位按某种属性分组计数的定性观察结果,称计数资料(countdata)或enumerationdata,也叫定性数据Qualitativedata。
①无固有计量单位血型(ABO)职业(工农兵)②各观察单位间或相同或存在质的差别③有质的差别者之间无连续性。
等级资料(rankdata)将观察单位按某种属性的不同程度或次序分成等级后分组计数的半定性或半定量的观察结果。
有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。
例如:
癌症分期:
早、中、晚。
药物疗效:
治愈、好转、无效、死亡。
尿蛋白:
—,,+,++,+++及以上。
1各观察单位间或相同,或存在质的差别;②各等级间只有顺序,而无数值大小。
3.资料的分类:
数值变量资料;
分类资料:
.二分类;
.多分类(a.无序多分类;b.有序多分类/等级资料)
4.基本概念:
(1)变量(variable)收集资料时,对每个观察单位的某项特征进行测量和观察,这种被观察单位的特征称为变量。
变化的或取值不同的量,一般指随机变量。
变量,统计上习惯用大写拉丁字母表示,如X、Y、Z、…。
变量值习惯用小写拉丁字母表示,如性别x1=1(男)、x2=1(男)、x3=0
变量的分类:
离散型变量(discretevariable)相当于计数资料;
连续性变量(continuousvariable)相当于计量资料;
有序变量(ordinalvariable)相当于等级资料。
(2)观察单位observationunit是获得数据的最基本的最小的单位。
(3)同质与变异
同质(homogeneity):
指事物的性质、影响条件或背景相同或非常相近。
同质性是构成研究总体的必备条件;研究内容不同,对同质性的要求不同;
变异(variation):
指同质的个体之间的某个变量的差异。
(4)总体与样本
总体(population):
根据研究目的确定的全部同质个体的某个(某些)变量值。
样本(sample):
从总体中随机抽取的部分观察单位的观察值。
总体有三大特点:
①同质性;②大量性;③差异性
总体可分为两大类:
①有限总体:
指总体单位数有限而可以计数的总体;②无限总体:
指总体单位数无限不可以计数的总体。
(5)随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法
随机(random)机会均等随机抽样(randomsampling),有相同的机会被抽到;
随机分组(randomallocation),有相同的机会被分到不同的组中;
实验顺序随机,先后接受处理的机会相同;
(6)参数与统计量parameterandstatistic
参数:
刻画总体特征的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
固定的常数。
统计量:
刻画样本特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为。
参数附近波动的随机变量。
(7)误差error
误差:
实际观察值与客观真实值之差
系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。
流行病学称之为偏倚(bias)。
特点:
观察值有系统性、方向性、周期性的偏离真值。
可以通过严格的实验设计和技术措施消除。
随机误差randomerror排除上述误差后尚存的误差,受多种无法控制的因素的影响。
大小方向不一的随机变化。
.随机测量误差(randommeasurementerror)——提高操作者熟练程度可以减少这种误差。
.随机抽样误差(randomsamplingerror):
由个体变异和抽样造成的样本统计量和总体参数间的差异。
——不可避免,但有一定的分布规律,可估计。
(8)概率probability
确定性现象:
在一定条件下,一定会发生或一定不会发生的现象。
其表现结果为两种事件:
肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。
随机现象:
在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。
其表现结果称为随机事件。
随机事件的特征:
①随机性;②规律性:
每次发生的可能性的大小是确定的。
概率:
随机事件发生的可能性大小,用大写的P表示;取值[0,1]。
P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯)。
(9)频率frequency样本的实际发生率称为频率。
设在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。
频率与概率间的关系:
样本频率总是围绕概率上下波动;样本含量n越大,波动幅度越小,频率越接近概率。
5.统计工作基本步骤:
统计设计→收集资料→整理资料→分析资料→解释数据(结果说明)
收集资料→
(1)资料来源:
统计报表;疗卫生工作记录和报告卡;题调查或实验。
(2)对资料要求:
完整、准确、及时。
对原始资料进行科学的加工与综合,使之系统化
整理资料→
(1)检查与核对:
(2)分组设计:
质量分组数量分组;3)拟订整理表:
(4)归纳汇总。
分析资料包括:
统计描述和统计推断inference;统计推断又包括两部分:
参数估计,假设检验。
医学研究的主要方法有实验性研究、观察性研究。
观察性研究又分为:
描述性研究、分析性研究。
医学研究的类型:
1.实验研究(干预)
按受试对象的特征分为
1)动物实验(animalexperiment)
2)临床试验(clinicaltrial)
3)社区干预实验(communityinterventiontrial)
2.调查研究(无干预):
被动地观察、如实记录
一.实验设计三要素(基本组成):
1.处理因素;2.受试对象;3.实验效应。
(1)处理因素(studyfactor,treatment):
研究者根据研究目的而施加的特定的实验措施。
例:
药剂、手术方法。
区分处理与非处理因素(混杂因素confoundingfactor);处理因素必须标准化。
(2)受试对象(studysubjects):
是指在实验研究中接受处理并作为实验观察的客体。
选择实验对象的注意事项:
1.是否对处理因素敏感;2是否对处理因素稳定;3对象的齐同性;4纳入标准和剔除标准。
(3)实验效应(experimentaleffect):
是指处理因素施加于受试对象并经过一定时间,受试对象产生的各种反应及表现。
受试对象的结果,通过观察指标表达。
观察指标应客观、精确、有效。
1客观性:
主观指标和客观指标。
2精确性:
准确度(accuracy)或真实性(validity):
观察值与真值的接近程度,受系统误差的影响(如灵敏度、特异度)。
精密度(precision)或可靠性(reliability)或重复性(repeatability):
重复观察时观察值与其均值的接近程度,受随机误差的影响,如一致百分率、Kappa值(诊断一致性)。
3有效性包括灵敏度与特异度两个方面。
二.实验设计的基本原则:
对照(control);随机化(randomization);重复(replication)。
空白对照(blankcontrol):
对照组不加任何处理因素。
实验对照(experimentalcontrol):
施加基础实验条件(非处理因素)。
标准对照(standardcontrol):
以现有的标准或正常值作对照。
自身对照:
实验在同一受试对象上进行。
简单易行,使用广泛。
相互对照:
几个实验组互相对照
历史对照:
以过去的研究结果作对照。
主要用于对难治或无法治愈的疾病的研究,如晚期恶性肿瘤,狂犬病等疾病。
随机化分组方法:
抽签;随机数字表;计算器或计算机。
几种常见随机化分组设计:
完全随机设计(两样本t检验,单因素方差分析,两组或多组独立样本的秩和检验);配对设计(配对t检验,符号秩和检验);随机单位组设计;配伍组设计(方差分析,秩和检验);盲法设计。
重复(replication):
结论的重复,用多个实验对象进行重复,同一实验对象的重复观察。
偏倚bias:
除抽样误差外,还可能受到非处理因素的干扰导致研究结果出现偏差。
选择性偏倚;测量偏倚;混合偏倚。
样本含量的估计:
四个主要因素:
α、1-β、δ、σ
(1)一类错误的概率α,即检验水准。
α越小,所需样本含量越多。
一般取α=0.05,还应明确单双侧。
⑵检验效能1−β。
为第二类错误的概率,1−β表示在特定的α水准下,H1为真时检验能正确发现的能力。
1−β越大,所需样本含量越多。
通常取β=0.1或0.2,一般1−β不能低于0.75。
⑶允许误差希望发现或需控制的样本和总体间或两个样本间某统计量的差别大小。
如δ=μ1−μ2,或δ=π1−π2。
δ越小,所需样本含量越多。
可作预实验或用专业上有意义的差值代替。
⑷总体变异度σ越大,所需样本含量越多。
通常根据预实验、查阅文献和专业知识判断σ值。
正态分布:
该分布由两个参数——平均值和方差决定。
概率密度函数曲线以均值为对称中线,方差越小,分布越集中在均值附近。
概率论中最重要的一种分布,一种最常见的连续性随机变量的概率分布。
中位数:
M指的是按大小顺序排列的一个变量的所有n个值中位于正中间的那个数。
分位数:
是介于最大值和最小值之间的一个数值,它使得变量的一部分观察值小于或等于它,另一部分观察值大于或等于它。
变异系数CV:
一个度量相对离散程度的指标,无量纲,可以用来比较几个不同的变量之间的离散程度的差异,也可用来比较量纲相同但均数相差悬殊的几个变量之间的离散程度的差异。
四分位间距:
Q3与Q1的差值四分位数间距不易受极端值的影响,通常与中位数一起描述偏态分布资料的分布特征。
方差:
是将离均差平方和再取平均,描述所有观察值与平均离散程度的指标。
右偏态分布:
即频数分布向右拖尾。
比:
表示两个相关指标的值之商,描述一个指标的值是另一个指标的值的几倍或几分之几。
率:
是表示某种现象发生的频率和强度,表示单位时间内某事件发生的可能性大小。
百分比:
表示分布结构的比例,表示事物内部各个组成部分所占整体的比重,通常以100%为比例基数,以百分比表示又称百分比。
相对比:
是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
如相对危险度RR:
指的是同一事件在不同的情况下发生的率之比。
优势比:
OR是一个事物在一种情况下发生的发生率与不发生率之比,与该事件在另一情况下的发生率与不发生率之比的比。
医学参考值范围:
“正常”人的解剖、生理、生化指标及组织代谢产物含量等数据正常与否的参考值。
标准误SE:
样本统计量的标准差称~。
样本均数的标准差也称均数的标准误SEM,反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异。
区间估计:
指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
这个区间即称为可信区间
事先给定的概率1-a称为可信度(confidencelevel),通常取1-a=95%。
可信区间优劣的两个指标:
准确性:
可信度,1-α,即计算出的区间包括总体均数μ的概率大小。
越接近于1越好。
精确性:
与变量的变异度大小、样本量和1-α取值有关,当1-α确定后,可信区间的长度受制于个体变异和样本量
算术均数:
适用于对称分布或偏斜度不大的数值资料,特别是正态分布资料或近似正态分布资料;大多数正常人的生理、生化指标,如身高、体重、胸围、血红蛋折含量、白细胞计数等均适宜用均数来描述其集中趋势
中位数:
适用于各种分布类型的资料,偏态资料、分布不明资料、一端或两端开口资料(一端或两端无确切数值的资料)。
几何均数:
适用于等比资料,对数正态分布资料,即取对数后资料近似呈对称分布的资料,右偏态分布数据。
全距:
只考虑极端值而忽略了其他大部分观察值,和均数一样,易受极端值的影响,粗略二不稳定,用途非常有限。
百分位数:
中位数是百分位数的特例。
其特点是不易受异常值的影响,适用于描述明显偏态分布、或两端无确定数值数据的平均水平。
四分位间距:
四分位数间距不易受极端值的影响,通常与中位数一起描述偏态分布资料的分布特征。
但四分位数间距只考虑了中间50%的观察值。
离均差和:
正负抵消。
平均偏差:
特点:
直观,易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。
离均差平方和:
克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和。
受样本大小影响。
方差的特点:
便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。
标准差比方差更常用,因为它与均数具有相同的度量单位,常与均数一样表示观察值的集中和离散趋势。
不适合用于单位不同或均值差异很大的资料。
变异系数:
多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
是一个相对数,不能反映个体实际的变异程度。
平均数是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。
其中均数的应用最为广泛,几何均数则多用于血清学和微生物学中,中位数主要用于偏度较大的数据分布资料。
百分位数可用来描述资料的观察值序列在某百分位置的水平,中位数是其中的一个特例。
构成比通常只能说明比重,不能说明发生的频率或强度。
构成比指标中某一部分所占比重的增减相应地会影响其他指标的比重。
比较两个总体率时,如两个总体的内部构成有所差别,就不能直接拿两个总体率进行比较和下结论,只有消除其内部构成上的差别之后,才能进行比较。
标准化法:
就是在一个指定的标准构成条件下进行率的对比的方法。
直接标准化法需要的指标:
被比较两组资料的年龄别死亡率;
标准人口构成即各年龄别人口数或人口构成比;
间接标准化法需要的指标:
被比较两组的年龄别人口数及总死亡率;
作为标准的某一人口各年龄别死亡率及其总死亡率。
参考值范围估计的方法有多种,其中最基本的有百分位数法和正态分布法。
正态法的优点是结果较稳定,但对资料要求严格;百分位数法适合于任何分布类型的资料,但要求大样本。
标准误与样本含量的平方根成反比,说明在同一总体中随机抽样,样本含量n越大,标准误越小,从而降低抽样误差;在样本含量一定的情况下,标准误与标准差成正比。
标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。
正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。
t分布主要用于总体均数的区间估计和t检验。
t分布曲线是以0为中心的对称分布。
自由度ν越小,t值越分散,t分布的峰部越矮而尾部翘得越高;当自由度ν逼近∞时,t分布趋向于标准正态分布;自由度ν不同,曲线形态不同,t分布是一簇曲线。
可信区间估计的优劣
准确性:
可信度:
1-α,即计算出的区间包括总体均数μ的概率大小。
越接近于1越好
精确性:
与变量的变异度大小、样本量和1-α取值有关。
当1-α确定后,可信区间的长度受制于个体变异和样本量。
可信度1-α,即区间包含总体均数的理论概率大小,愈接受于1越好,如99%的可信度比95%的可信度好。
区间的宽度:
对双侧可信区间而言,区间愈窄愈好。
当样本含量为定值时,两者互相矛盾。
样本率抽样分布的特点:
总体率π相同时,样本量越大,样本率的分布越趋向对称;
样本量n相同时,π偏离0.5,样本率的分布呈偏态分布;
总体率π=0.5时,样本率呈对称分布。
参数估计有点估计和区间估计两种方式。
点估计的重要表达方式是平均值;区间估计是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
区间越窄说明估计的准确度越高。
u检验亦称为Z检验:
(1)大样本均数(率)与总体均数(率)比较的u检验,条件:
(样本数据服从正态分布,总体方差已知),当总体标准差未知,n>=60时,可用样本标准差S作为总体标准差的估计值;
(2)两个大样本均数/率比较的u检验;
第一类错误:
当H0为真时,检验结论拒绝H0接受H1,这类错误称为第一类错误或Ⅰ型错误(typeⅠerror),亦称假阳性错误。
检验水准,就是预先规定的允许犯Ⅰ型错误概率的最大值,用α表示。
第二类错误:
当真实情况为H0不成立而H1成立时,检验结论不拒绝H0反而拒绝H1,这类错误称为第二类错误或Ⅱ型错误(typeⅡerror),亦称假阴性错误。
概率大小用β表示,只取单侧,一般未知,在已知两总体差值d(如μ1-μ2)、和n时,才能算出。
检验效能(power):
1-β,也称把握度.当两总体确有差别,按检验水准α,假设检验能发现其差别(拒绝H0)的能力。
同时减小Ⅰ型错误和Ⅱ型错误,唯一的方法就是增加样本含量n。
1.假设检验的思想是,首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。
假设检验基本思想:
先对总体特征作出某种假设H0,如假设总体均数(或总体率)为一定值,两个总体均数(或总体率)相等,然后通过从总体中抽取的样本计算有关检验统计量(teststatistic),最后获得P值,并依据P值的大小作出拒绝或接受假设H0的判断。
2.假设检验有三个基本步骤:
(1)建立假设和确定检验水准,通常选
(2)选择检验方法和计算检验统计量
(3)确定P值和做出统计推断结论
t检验(ttest,studentttest)和u检验(utest)是用于计量资料两组比较的最常用的假设检验方法
根据研究设计t检验可由三种形式:
单个样本均数的t检验X=μ0
配对样本均数t检验μd=0
两个独立样本均数t检验μ1=μ2
t检验应用条件:
正态、独立、方差齐性
(1)两组计量资料小样本比较;
(2)样本对总体有较好代表性,对比组间有较好组间均衡性——随机抽样和随机分组;
(3)样本来自正态分布总体,配对t检验要求差值服从正态分布,实际应用时单峰对称分布也可以;
(4)大样本时,用u检验,且正态性要求可以放宽;
(5)两独立样本均数t检验要求方差齐性——两组总体方差相等或两样本方差间无显著性。
若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。
假设检验和可信区间的关系:
两者既有联系又有区别
(1)假设检验用以推断总体均数是否相同或不同:
用于推断质的差异;
(2)可信区间则用于估计总体均数所在的范围:
用于说明量的大小即推断总体均数的范围;
(3)可信区间具有假设检验的主要功能:
可根据计算样本信息计算出总体的可信区间,再看H0假设的μ值在不在此区间进行推断.
方差分析的应用条件:
各观察值相互独立,并服从正态分布;
各组资料总体方差相等,即各总体具有方差齐性(homogeneityofvariance);
方差分析应用:
多个样本均数(计量资料)的比较,各样本含量可以不等,但样本含量相等时检验效率高。
均数之间的多重比较:
SNK(Student-Newman-Keuls)法最常用方法之一,其检验统计量为q,故又称为q检验;
Dunnett法其检验统计量为tD,故又称Dunnett-t检验,它适用于k-1个试验组与对照组均数的比较;拉丁方设计可以同时分析3个因素:
一个因素为处理因素,主要是研究因素,两个需要加以控制的非处理因素:
如同时控制体重和窝别两个非处理因素。
拉丁方的优点:
可同时研究3个因素,减少实验次数
从组内变异中不但分离出行区组变异,而且还分离出列区组变异,使误差变异进一步减小
拉丁方的缺点:
要求处理组数与所要控制的两个因素水平数相等,一般实验不容易满足此条件,而且数据缺失会增加统计分析的难度
方差齐性检验(HomogeneityofVarianceTest):
Bartlett检验法:
正态分布资料;
Levene检验法:
非正态分布资料
二项分布的图形取决于π和n;
当π=1-π时,图形对称;
当π<1/2时,二项分布的图形左偏;
当π>1/2时,图形右偏;
当n增大时,图形趋于对称。
二项分布的应用:
(一)总体率的区间估计
查表法:
对于n≤50的小样本资料,直接查附表百分率可信区间表,即可得到其总体率的可信区间。
正态近似法:
当n较大、p和1-p均不太小,如np和n(1-p)均大于5时,可利用样本率p的分布近似正态分布来估计总体率的可信区间。
(二)样本率与总体率的比较(直接法、正态近似法)
泊松分布的性质:
(一)σ2=λ
(二)当n很大,而π很小,且nπ=λ为常数时,二项分布近似Poisson分布。
(三)当λ增大时,Poisson分布渐近正态分布。
一般而言,λ≥20时,Poisson分布资料可作为正态分布处理。
(四)Poisson分布具备可加性。
(五)Poisson分布的图形
泊松分布的应用:
(一)总体均数的区间估计:
利用服从Poisson分布的样本资料可估计其总体均数1-α的可信区间。
1. 查表法:
当x≤50时,直接查附表7
2.正态近似法:
当x>50时,
(二)样本均数与总体均数的比较
直接法:
当总体均数λ<20时
正态近似法:
当总体均数λ≥20时
(三)两个样本均数的比较
卡方检验:
用途广泛,推断两个及以上总体率(或构成比)之间有无差别,两个分类变量间有无关系(关联),频数分布资料拟合优度检验等。
卡方检验注意事项:
为保证正态近似性比较好,一般认为行列表中不宜有20%以上格子的理论频数小于5。
对理论频数太小有以下处理方法:
增加样本含量;
将理论数太小的行或列与相邻的行或列合并;
删除理论数太小的行或列。
当一个或两个分组变量为等级变量时,为提高资料信息的利用率,一般不直接用卡方检验。
当拒绝H0时,只能认为构成比有差异,尚不能认为或断定到底构成比的差异在哪里。
这需要进行卡方分割。
参数检验(parametrictest):
针对总体参数进行的检验。
非参检验(nonparametrictest):
与参数检验不同,非参检验不要求样本所代表总体的分布类型,所以又称为distribution-freetest。
不考虑总体分布型,也不针对总体的参数进行检验。
非参数检验的适用范围:
非参数检验只有在参数检验不能用的时候才用
偏态资料;
分布类型不明的资料;
等级资料;
相互比较的各组变异程度相差悬殊。
优点:
a.不受总体分布的限制,适用范围广;
b.可用“等级”或“符号”来评定,收集资料方便。
缺点:
造成信息的丢失,导致检验效率下降。
增加犯第二类错误的概率。
常见的非参数检验:
配对样本符号秩检验(Wilcoxonsignedranktest)
两独立样本比较的秩和检验(Wilcoxonranksumtest)
多个独立样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 整理