2014级现代医学统计学试题Word文件下载.doc
- 文档编号:3726754
- 上传时间:2023-05-02
- 格式:DOC
- 页数:12
- 大小:207.50KB
2014级现代医学统计学试题Word文件下载.doc
《2014级现代医学统计学试题Word文件下载.doc》由会员分享,可在线阅读,更多相关《2014级现代医学统计学试题Word文件下载.doc(12页珍藏版)》请在冰点文库上搜索。
~23.9
超重24~27.9
肥胖BMI≥28
分析前处理:
数据整理与数据导入
根据所给数据,整理全部574例研究对象的性别、年龄、身高、体重、空腹血糖、餐后2小时血糖以及血压(收缩压/舒张压)的数据。
(1)打开所给数据,在Excel表中,将血压一行进行分割,分为收缩压和舒张压两列,以便于数据的后期处理与分析。
(具体步骤:
WPS表格→数据→选中H列血压的数据→分列→分隔符号→下一步→勾去Tab键,选中其他,在其他后的空格中输入/,点击下一步,再点击完成→更改H列为收缩压(mmhg),I列为舒张压(mmhg)
(2)异常值的处理:
在Excel软件中,分别对每一个变量按照升降序的排列顺序,找出其中有无异常数据(比如极大值、极小值或不符合实际情况的数据),并对异常数据进行修正。
一.对研究对象的基本特征进行描述
1.对性别分布的描述
表1:
574例研究对象性别分布情况表
性别
频率(例)
百分比(%)
有效百分比(%)
累积百分比(%)
男
247
43.0
女
327
57.0
100.0
合计
574
分析:
如表所示,574例研究对象中,男性为247例,占43%,女性为327例,占57%。
2.对年龄分布的描述
方法:
选择分析→描述统计→频率→选择年龄为变量→统计量中选择“均数、标准差、极小值及极大值”→确定
表2:
574例研究对象年龄分布情况表
年龄
有效(例)
缺失(例)
均值(岁)
标准差
极小值(岁)
极大值(岁)
48.31
15.849
13
85
如表所示,574例研究对象中,年龄的均数为48.31岁,标准差为15.849,最小年龄为13岁,最大年龄为85岁。
3.对不同性别情况下年龄分布的描述
1)文件拆分:
选择数据→拆分文件→比较组→分组方式:
性别→确定
2)分性别的年龄分析:
选择分析→描述统计→频率→选择年龄为变量→确定
表3:
574例研究对象不同性别的年龄分布情况表
49.58
16.742
80
47.35
15.095
14
如表所示:
在男性247例研究对象中,年龄的均值为49.58岁,标准差为16.742,最小年龄为13岁,最大年龄为80岁;
在女性327例研究对象中,年龄的均值为47.35岁,标准差为15.095,最小年龄为14岁,最大年龄为85岁。
4.对身高分布的描述
选择分析→描述统计→频率→选择身高为变量→统计量中选择“均数、标准差、最小值及最大值”→确定
表4:
574例研究对象身高分布情况表
身高
均值(cm)
极小值(cm)
极大值(cm)
162.41
8.611
144
187
在574例研究对象中,身高的均数为162.41cm,标准差为8.611,最低身高为144cm,最高身高为187cm。
5.对不同性别情况下身高分布的描述
选择分析→描述统计→频率→选择身高为变量→确定
表5:
574例研究对象不同性别的身高分布情况表
169.17
6.444
148
157.31
6.195
182
在男性247例研究对象中,身高的均值为169.17cm,标准差为6.444,身高最小值为148cm,最大值为187cm;
在女性327例研究对象中,身高的均值为157.31cm,标准差为6.195,身高最小值为144cm,身高最大值为182cm。
二.不同性别、不同年龄段、不同肥胖程度、高血压患者与非高血压患者DM(糖尿病)患病率比较
题意分析:
本题意在分析DM(糖尿病)患病率的比较,而卡方检验则常用于样本率、构成比之间的比较,因而本题应选用卡方检验。
分组变量:
性别,年龄段,肥胖程度,高血压与非高血压患者;
结果变量:
DM(糖尿病)
数据预处理:
1)对年龄段进行分层处理:
将年龄分层,分为不同年龄段。
如前示,研究对象中,最小年龄为13岁,最大年龄为85岁,因此以10岁为一个年龄段分组。
表6:
574例研究对象不同年龄段分布情况表
频率
百分比
有效百分比
累积百分比
有效
1
178
31.0
2
122
21.3
52.3
3
106
18.5
70.7
4
168
29.3
由上表可知,在574例研究对象中,<40岁的研究对象有178例,占31%,40~49岁有122例,占21.3%,50~59岁有106例,占18.5%,>60岁有168例,占29.3%。
2)对肥胖程度进行分层处理:
由身高、体重计算体重指数,BMI=体重(Kg)/身高(m)2。
诊断标准:
低体重:
;
18.5~23.9
超重:
24~27.9
肥胖BMI≥28。
选择转换→计算变量→目标变量BMI,
BMI=体重(kg)/(身高(cm)/100)²
。
将BMI转化为肥胖程度:
选择转换→重新编码为不同变量→输入变量为BMI,输出变量为肥胖程度→命名新旧值,如下:
Lowestthru18.49→1;
18.50thru23.99→2;
24thru27.99→3;
28thruHighest→4
发现有缺失值:
张260,张311,据其BMI值进行补充。
表7574例研究对象不同肥胖程度分布情况表
38
6.6
309
53.8
60.5
171
29.8
90.2
56
9.8
由上表可知,在574例研究对象中,低体重(BMI<18.5)为38例,占6.6%;
正常体重(BMI:
~23.99)为309例,占53.8%;
超重(24~27.99)为171例,占29.8%;
肥胖(BMI≥28)为56例,占9.8%。
3)对高血压与非高血压进行区分处理:
根据高血压诊断标准收缩压
将高血压研究对象定义为1,非高血压研究对象定义为0.
4)对糖尿病患者的诊断处理
糖尿病(DM):
空腹≥7.0mmol/L
餐后2小时血糖≥11.1mmol/L。
将DM患者定义为1,非DM研究对象定义为0,并作出统计学分析,结果如下:
表8574例研究对象糖尿病患者分布情况表
525
91.5
49
8.5
5)对性别进行处理
将男性定义为1,女性定义为0,并做统计学分析并进行卡方检验,结果如下:
1.不同性别与DM患病率:
表9:
574例研究对象不同性别与DM患病情况
组别
样本含量(例)
DM
c2
P
患病(例)
未患病(例)
24(9.7%)
223(90.3%)
0.773a
0.379
25(7.6%)
302(92.4%)
49(8.5%)
525(91.5%)
如上表所示,男性247例研究对象中,DM患者为24例,患病率为9.7%,女性327例中,DM患者为25例,患病率为7.6%。
卡方检验,样本含量为547≥40,且所有理论频数T≥5,因此,可以进行非校正Pearson卡方检验,卡方值c2=0.773,P=0.379>0.05,认为不同性别的DM患病率无统计学差异。
2.不同年龄段与DM患病率
表10:
574例研究对象不同年龄段DM患病情况
<40
6(3.4%)
72(96.6%)
29.096a
0.000
40~49
4(3.3%)
118(96.7%)
50~59
9(8.5%)
97(91.5%)
≥60
30(17.9%)
138(82.1%)
如上表所示,在574例对象中,DM患者49例,<40岁的为6例,占3.4%,40~49岁有4例,占3.3%,50~59岁有9例,占8.5%,≥60岁有30例,占17.9%。
进行卡方检验,样本含量为547≥40,卡方值c2=29.096,P=0.000,P<0.05,认为不同年龄段的DM患病率有统计学差异。
3.不同肥胖程度与DM患病率
表11:
574例研究对象不同肥胖程度DM患病情况
肥胖程度
c2
低体重
2(5.3%)
36(94.7%)
15.966a
0.001
正常体重
15(4.9%)
294(95.1%)
超重
26(15.2%)
145(84.8%)
肥胖
6(10.7%)
50(89.3%)
如上表所示,在74例研究对象中,DM患者49例,其中,低体重为2例,占5.3%,正常体重为15例,占4.9%,超重为26例,占15.2%,肥胖6例,占10.7%。
据卡方检验,样本含量为547≥40,卡方值=15.966,P=0.001,P<0.05,认为不同肥胖程度的DM患病率有统计学差异。
4.高血压与非高血压DM患病率
表12:
574例研究对象高血压与非高血压DM患病情况
高血压
105
14(13.3%)
91(86.7%)
3.787a
0.052
非高血压
469
35(7.5%)
434(92.5%)
如表格所示,在74例研究对象中,DM患者49例,其中,高血压患者为14例,占13.3%,非高血压患者为35例,占7.5%。
据卡方检验,样本含量为547≥40,卡方值=3.787,P=0.052,P虽然大于0.05,但是较为相近,据临床知识,可以认为高血压与DM患病率有统计学差异。
对以上数据进行合并,得到下表:
表13:
574例研究对象不同性别、不同年龄段、不同肥胖程度、高血压患者与非高血压患者DM(糖尿病)患病率比较
性
别
年
龄
段
29.096a
肥
胖
程
度
15.966a
高
血
压
三.体重指数与收缩压、舒张压关联
体重指数、收缩压和舒张压均为定量资料,分析几者关系,假定满足正态分布,应该做Pearson相关。
表14574例研究对象体重指数、收缩压和舒张压相关性
BMI
收缩压(mmHg)
舒张压(mmHg)
Pearson相关性
0.297**
0.289**
显著性(双侧)
N
0.749**
**.在.01水平(双侧)上显著相关。
由上表可知,BMI和收缩压呈正相关(r=0.297,p<0.001),有统计学意义;
BMI与舒张压呈正相关(r=0.289,p<0.001),有统计学意义。
四.肥胖程度与年龄相关
因为年龄为定量资料,肥胖程度为分类有序的等级资料,因此,分析二者关系,应该做Spearman秩相关。
表15:
574例研究对象体肥胖程度和年龄的相关性
年龄
Spearman的rho
相关系数
1.000
0.190**
Sig.(双侧)
.
**.在置信度(双测)为0.01时,相关性是显著的。
由上表可知:
肥胖程度和年龄呈正相关(r=0.190,p<.001),有统计学意义。
五.收缩压的影响因素
影响因素的研究一般应该做回归,同时,收缩压为定量资料,并且满足正态分布,应该做多元线性回归。
表16:
574例研究对象收缩压的影响因素
模型
非标准化系数
标准系数
t
Sig.
B的95.0%置信区间
B
标准误差
试用版
下限
上限
(常量)
92.154
3.089
29.832
86.087
98.222
sex
3.087
1.407
0.082
2.194
0.029
0.323
5.851
Old
4.334
0.604
0.280
7.173
3.147
5.520
5.775
0.935
0.234
6.177
3.938
7.611
空腹血糖(mmol/L)
0.173
0.485
0.020
0.356
0.722
-0.781
1.126
餐后2h血糖(mmol/L)
0.633
0.259
0.141
2.442
0.015
0.124
1.142
a.因变量:
收缩压(mmHg)
由上表知,p<0.05的自变量为sex、年龄段、肥胖程度和餐后2h血糖,对收缩压可能有统计学意义。
公式表示:
Y=92.154-3.087×
(sex)+4.334×
(年龄段)+5.775×
(肥胖程度)+0.633×
(餐后2h血糖)。
含义:
性别与收缩压呈负相关,年龄段、肥胖程度和餐后2h血糖与收缩压呈正相关。
同时,如想将没用的变量剔除掉,还可以选择向前法或向后法进行影响因素筛选,如想尽可能多的保留影响因素,则应选用向后法。
六.糖尿病患病率的影响因素
糖尿病患病率为二分类变量,应该做二元Logistic回归。
表17:
574例研究对象糖尿病的影响因素
S.E,
Wals
Exp(B)
EXP(B)的95%C.I.
0.669
0.157
18.217
1.952
1.436
2.654
0.465
0.200
5.426
1.592
1.077
2.354
Sex
常量
0.057
0.049
-5.521
0.312
0.354
0.736
0.033
0.019
56.320
0.855
0.890
1.059
1.050
0.004
0.525
2.102
a.输入的变量:
sex,Old,肥胖程度,高血压.
据上表,筛选糖尿病患病率的影响因素结果:
年龄段和肥胖程度与糖尿病患病率相关,均呈正相关。
预测公式:
P=1/(1+e-[-5.521+0.669(年龄段)+0.465(肥胖程度)]),可预测出不同年龄段及肥胖程度下DM的患病率。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2014 现代医学 统计学 试题