医学统计学复习.docx
- 文档编号:2760234
- 上传时间:2023-05-04
- 格式:DOCX
- 页数:8
- 大小:58.68KB
医学统计学复习.docx
《医学统计学复习.docx》由会员分享,可在线阅读,更多相关《医学统计学复习.docx(8页珍藏版)》请在冰点文库上搜索。
医学统计学复习
医学统计学复习
医学统计学学习的内容;正态性检验,t检验,方差分析,卡方检验,非参数检验,pearson相关,spearman相关,双变量回归,多元变量的线性回归,主成分分析等。
其中t检验包括单个样本的t检验,两个独立样本的t检验,两个配对样本的t检验。
非参数检验主要用的是wilcoxon配对样本的wilcoxon符号秩检验,两个独立样本wilcoxon秩和检验和K-W检验(用来代替方差分析)
得到一批数据首先对其进行正态性检如果符合正太性,可以考虑使用t检验,卡方检验;如果不满足正态性,则考虑使用非参数检验
T检验与方差分析的区别是t检验用于两组数据的比较,而方差分析用于三组或者更多数据的比较。
1、正态性检验:
分析—>描述统计—>探索—>将数据放入因变量列表—>绘图中选择带检验的正态图—>读取结果:
样本数>100读K-S一栏,若sig值(显著性)>0.05说明数据分布呈正态性,反之则不成正态分布;样本数>100读S-W一栏,若sig值(显著性)>0.05说明数据分布呈正态性,反之则不成正态分布。
2、当数据满足正态分布时,单个样本的t检验:
分析—>比较均值—>单个样本的t检验—>将数据放入检验变量,同时将整体均数放入检验值中—>结果读取:
读t值和显著性值,若sig值>0.05说明该样本均数与总体均数无差异,反之说明有差异。
3、当数据满足正态分布时,两个配对样本的t检验:
分析—>比较均值—>配对样本的t检验—>将两组数据分别放入variable中—>读取结果:
读t值和sig值,若sig>0.05说明两组数据均值无差异,反之说明有差异。
4、当数据满足正态分布时,两个独立样本的t检验:
分析—>比较均值—>独立样本的t检验—>把数据放入检验变量,把group放入分组变量,并定义组—>读取结果:
先看方差齐性检验,若sig值>0.05说明方差齐,看第一行的t值和sig值,若sig>0.05说明两组均数无差异,反之有差异。
当方差不齐时看第二行的t值(即t’值)和sig值,若sig>0.05说明两组均数无差异,反之有差异。
5、当数据满足正态分布时,方差分析:
分析—>比较均值—>单因素方差分析—>将数据放入因变量列表,将group放入因子列表,同时在选项中选择方差同质性检验—>读取结果,先看levene检验的结果,若sig值>0.05说明方差齐,然后读F值和sig值,若sig值>0.05说明所选几组数据间无差异;反之,说明这几组数据有差异,接着:
分析—>比较均值—>单因素方差分析—>将数据放入因变量列表,将group放入因子列表,同时选取事后多重比较中的LSD-t检验—>读取结果,从sig>0.05与否判断哪些组之间有差异。
若方差不齐,则无法用单因素方差分析。
6、当数据满足不正态分布时,wilcoxon带符号秩检验:
分析—>非参数检验—>旧对话框:
2个相关样本检验—>将数据分别放入variable中—>读取结果:
读Z值和sig值,若sig值>0.05说明两组数据无差异,反之则有差异。
7、当数据满足不正态分布时,wilcoxon秩和检验:
分析—>非参数检验—>旧对话框,2个独立样本t检验—>将数据放入检验变量,将group放入分组变量,并定义组—>结果读取Z值和sig值,若sig>0.05说明有无差异,反之则有差异。
8、当数据满足不正态分布时,K-WH检验:
分析—>非参数检验—>旧对话框,k个独立样本—>将数据放入检验量列表,将group放到分组变量,并定义组—>读取卡方和sig值,若sig值>0.05说明无差异,反之则有差异。
9、卡方检验用于配对计数资料的比较:
(1)数据—>加权个案—>选择加权个案,将频数放入频率变量;
(2)分析—>描述统计—>交叉表格—>依次将数据放入行列中(行为重点)—>在统计量中选择卡方—>结果读取,读pearson卡方和sig值,若sig>0.05说明无差异,反之有差异。
10、pearson相关(适用于计量资料):
分析—>相关—>双变量—>把数据放入变量—>读取结果:
看pearson相关性和sig值,若sig>0.05说明两者不相关,反之则说明相关。
11、sperman秩相关(适用于构成比、死亡率、group变量):
分析—>相关—>双变量—>将数据放入变量,同时选取sperman相关—>读取结果,看sperman相关系数和sig值,若sig值>0.05说明两组数据不相关,反之说明相关。
12、二元线性回归:
分析—>回归—>线性—>将y放入因变量列表,将x放入自变量列表—>读取结果(从后往前读):
先得到回归方程;ANOVA的sig值必须小于0.05,说明回归成的存在,ANOVA值反映出回归方程的稳定性,模型汇总R2反应了回归方程的准确性,R2反应回归贡献度的相对程度,也就是在总变异中回归系数所能解释的百分比
13、多元线性回归:
主要是比较向前与向后的差别
分析—>回归—>线性—>将y放入因变量列表,将x1、x2、x3……放入自变量列表—>结果读取:
从后向前读,首先写出回归方程,接着看ANOVA的值,看模型汇总的值,看自变量的个数。
决定选择向前还是向后方法主要考虑的内容为:
自变量的个数、稳定性ANOVA、准确性R2、回归方程中单个变量。
14、主成分分析:
分析—>降维—>因子分析—>将x1、x2、x3……放入变量列表,选择得分中的保存变量—>读取结果:
看在数据中新增加的变量,按升序或降序排列即可知道那个因子的影响比较大
15、非条件的logistic分析:
一、两组或多组计量资料的比较
1.两组资料:
1)大样本资料或服从正态分布的小样本资料
(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验
2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验
2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:
选择合适的方法(如:
LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作KruskalWallis的统计检验。
如果KruskalWallis的统计检验为有统计学意义,则进一步作统计分析:
选择合适的方法(如:
用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析
1.单样本资料与总体比较
1)二分类资料:
(1)小样本时:
用二项分布进行确切概率法检验;
(2)大样本时:
用U检验。
2)多分类资料:
用Pearsonc2检验(又称拟合优度检验)。
2.四格表资料
1)n>40并且所以理论数大于5,则用Pearsonc2
2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s检验
3.2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMHc2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearsonc2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s确切概率法检验
4.R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMHc2或KruskalWallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作nonezerocorrelationanalysis的CMHc2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析
4)列变量和行变量均为无序多分类变量,
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearsonc2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s确切概率法检验
三、Poisson分布资料
1.单样本资料与总体比较:
1)观察值较小时:
用确切概率法进行检验。
2)观察值较大时:
用正态近似的U检验。
2.两个样本比较:
用正态近似的U检验。
配对设计或随机区组设计四、两组或多组计量资料的比较
1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验
2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:
选择合适的方法(如:
LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。
如果Fredman的统计检验为有统计学意义,则进一步作统计分析:
选择合适的方法(如:
用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、分类资料的统计分析
1.四格表资料
1)b+c>40,则用McNemar配对c2检验或配对边际c2检验
2)b+c£40,则用二项分布确切概率法检验
2.C×C表资料:
1)配对比较:
用McNemar配对c2检验或配对边际c2检验
2)一致性问题(Agreement):
用Kap检验
变量之间的关联性分析六、两个变量之间的关联性分析
1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、回归分析
1.直线回归:
如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2.多重线性回归:
应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:
可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:
在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:
应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)非配对的情况:
用非条件Logistic回归
(1)观察性研究:
可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:
在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:
用条件Logistic回归
(1)观察性研究:
可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:
在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:
应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:
可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:
在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:
应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:
可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:
在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 复习