第3章分类资料的统计描述DOC.docx
- 文档编号:15878218
- 上传时间:2023-07-08
- 格式:DOCX
- 页数:33
- 大小:212.39KB
第3章分类资料的统计描述DOC.docx
《第3章分类资料的统计描述DOC.docx》由会员分享,可在线阅读,更多相关《第3章分类资料的统计描述DOC.docx(33页珍藏版)》请在冰点文库上搜索。
第3章分类资料的统计描述DOC
·第三章分类资料的统计描述
名人名言
吾志所向,一往无前;愈挫愈奋,再接再励。
孙中山
第一节常用相对数
例3-1某医生调查甲乙两中学初中三年级学生的近视眼患病情况,结果甲校近视眼患者为100人,乙校近视眼患者60人,甲校比乙校多40人,由此得出甲校近视眼患病情况比乙校严重。
你认为该结论是否正确?
为什么?
【问题3-1】
1.这是什么资料?
2.该医生分析结论是否正确?
为什么?
3.如何正确分析比较?
【分析】
(1)近视眼患病人数是按患病与未患病分类,属于二分类资料,即计数资料。
(2)该医生分析结论不正确。
因为患病人数是根据患病与未患病分组直接清点各组所得数据即绝对数,可以说明某现象在一定条件下的规模和实际水平,但不能互相比较,因基数(或调查人数)未知。
(3)若要比较两校近视眼患病严重程度,还需要考虑两校被调查的学生数,计算两校学生近视眼患病率后才能比较。
近视眼患病率是近视眼患病人数除以调查人数所得的比值,是一种相对数。
相对数(relativenumber)是分类资料的描述性统计指标,是两个有联系指标之比。
常用相对数有率、构成比、相对比和动态数列,对比的两个指标可以是绝对数、相对数、平均数等,性质可以相同,也可以不同。
假如调查了甲校400人,乙校200人,则甲校近视眼患病率为100/400×100%=25%,乙校近视眼患病率为60/200×100%=30%,可见乙校近视眼患病率高于甲校。
【知识点3-1】
1.绝对数是分类资料整理中,根据资料的类别直接清点各组所得的数据。
2.相对数是分类资料的描述性统计指标,是两个有联系指标之比。
常用相对数有率、构成比、相对比和动态数列。
3.对比的两个指标可以是绝对数、相对数、平均数等,性质可以相同,也可以不同。
例3-2某年某地不同年龄组某病的患病情况见表3-1,某医师由此认为“20~”年龄组的患病情况最为严重。
该结论是否正确?
为什么?
表3-1某年某地不同年龄组某病的患病情况比较
年龄组(岁)
(1)
调查人数
(2)
患病人数
(3)
患病构成比(%)
(4)
与0~之比
(5)
0~
60030
1820
21.24
1.00
20~
38013
3019
35.24
1.66
40~
20260
2208
25.77
1.21
60~
7120
1521
17.75
0.84
合计
125423
8568
100.00
—
【分析】该结论不正确。
原因是以患病构成比代替患病率来说明问题。
上表第4栏是每一组患病人数除以总患病人数得到的;第5栏是定基比,以“0~”岁组的患病构成比作基数,每组患病构成比与之相比。
从第4栏和第5栏可以看出,患病构成比是随着年龄的增加而增大,“20~”岁组达到最高峰(达35.24%),以后随着年龄的增加而逐渐减少,“60~”岁组最低,但这并不能说明“20~”岁组的患病情况最为严重,见图3-1(A),只能说明“20~”岁组患病构成比重最大。
要说明患病的严重程度,需要用患病率来比较。
在表3-1的基础上,用患病人数除以调查人数计算出患病率,见表3-2第6栏和图3-1(B)。
从患病率可以看出,患病率是随着年龄的增加而增大,“60~”岁组患病最严重,原因是疾病免疫力或抵抗力是随着年龄的增加而减少。
因此,该医师用患病构成比来代替患病率分析是错误的。
表3-2某年某地不同年龄组某病的患病情况比较
年龄组(岁)
(1)
调查人数
(2)
患病人数
(3)
患病构成比(%)
(4)
与0~之比
(5)
患病率(%)
(6)=(3)/
(2)
0~
60030
1820
21.24
1.00
3.03
20~
38013
3019
35.24
1.66
7.94
40~
20260
2208
25.77
1.21
10.90
60~
7120
1521
17.75
0.84
21.36
合计
125423
8568
100.00
—
6.83
A B
图3-1某年某地不同年龄组某病的患病情况比较
一、率(rate)
1.意义率(rate)是说明某现象发生的频率或强度,又称为频率指标。
2.计算公式
(3-1)
表3-2第7栏“0~”的患病率为1820/60030=3.03%,由第2、3栏的数据算得,依次类推,可算得“20~”、“40~”和“60~”岁组的患病率分别为7.94%、10.90%和21.36%。
比例基数可以取100%或1000‰100000/10万等。
比例基数的选择主要根据习惯用法或使计算的率有适当位数的整数,而且整数不太大;小数位数保留1~2位即可。
3.特点
例3-3南华大学某医师在研究乳腺癌与C-erbB-2表达的关系时,数据显示:
55例特征表现为肿块的其C-erbB-2阳性表达率为69.1%,19例乳腺癌X线特征表现为局限浸润致密影的其C-erbB-2阳性表达率为73.7%,17例乳腺癌X线特征表现为单纯钙化的其C-erbB-2阳性表达率为82.4%,三者之间差异无统计学意义(
=1.162,P=0.559)。
表3-3乳腺癌X线直接征象与C-erbB-2表达的关系
影像表现
例数
C-erbB-2
阳性阳性率(%)
肿块
55
38
69.1
局限浸润致密影
19
14
73.7
单纯钙化
17
14
82.4
合计
91
66
72.5
图3-2乳腺癌X线直接征象与C-erbB-2表达的关系
从表3-2、表3-3和图3-2看出,率有以下两个特点:
(1)一般合计率或总率不等于100%。
(2)某一部分的分率改变不影响其它分率的变化。
4.应用在医疗卫生工作和科学研究的分析中应用非常广泛,如患病率、发病率、死亡率、病死率、阳性率、治愈率、有效率等。
二、构成比(proportion)
1.意义构成比(proportion)是表示某事物内部各组成部分所占的比重或分布,常以百分数表示。
2.计算公式
(3-2)
表3-1第4栏的患病构成比是由第3栏算得的,其中“0~”占全部患病人数的比重为1820/8568×100%=21.24%,依次类推,可算得“20~”、“40~””和“60~”所占的比重分别为35.24%、25.77%和17.75%。
例3-4某县医院2000年各科病床数均为100张病床,2005年各科病床数如2005年外科病床增加了100张病床,见表3-4和图3-3。
表3-4某县医院2000年和2005年各科病床数比较
科室
2000年
2005年
病床数
构成比(%)
病床数
构成比(%)
内科
100
25.0
100
20.0
外科
100
25.0
200
40.0
妇产科
100
25.0
100
20.0
其它科
100
25.0
100
20.0
合计
400
100.0
500
100.0
2000年2005年
图3-3某县医院2000年和2005年病床数比较
例表3-4中各个科室的病床构成比等于各个科室数除以合计病床数乘100%,如2000年内科病床构成比=100÷400×100%=25.0%,其余依次类推,各科室病床数构成比总和等于100%。
在2005年,由于外科病床数增加100张,外科病床数构成比从25.0%增加为40.0%,其余科室的病床数没有改变,但构成比从25.0%下降为20.0%,因要保持总病床构成比为100.0%。
3.特点从表3-2、表3-4和图3-3看出构成比有两个特点:
(1)某事物内部各构成比的总和必定等于100%,即各分子的总和等于分母。
(2)某一部分构成比的改变受到两方面因素的影响:
一是其本身数量的变化,二是同一内部其他部分数量的变化。
4.应用在医疗卫生工作和科学研究的分析中应用非常广泛,如年龄构成、血型构成、病种构成、死亡原因等。
三、相对比(relativeratio)
1.意义相对比(relativeratio)是表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
2.计算公式
(3-3)
式中甲、乙指标可以是相对数、绝对数、平均数。
如果甲指标大于乙指标,用倍数表示;如果甲指标小于乙指标,用百分数表示。
例表3-3中,试验组和对照组有效率相对比为95.2%÷82.2%=1.2倍。
3.特点
(1)甲乙两个指标的性质可相同也可不同。
(2)甲乙两个指标可以是绝对数、相对数或平均数。
4.应用在医疗卫生工作和科学研究的分析中应用也非常广泛,如性别比、人口密度、医生(护士)床位比等。
【知识点3-2】
1.率是说明某现象发生的频率或强度。
某一分率改变不影响其它分率变化。
2.构成比是表示某事物内部各组成部分所占的比重或分布。
某一部分构成比的改变将影响其它构成比的变化。
3.相对比表示两个有关事物指标之比,用以说明一个指标是另一个指标的几倍或几分之几。
两个指标可以是绝对数、相对数或平均数。
第二节动态数列
例3-5某县医院1995~2005年门诊就诊人数的统计数据见表3-5,试作动态分析。
表3-5某县医院1995-2005年门诊就诊人数动态变化
年份
(1)
符号
(2)
门诊就诊
人数
(3)
绝对增长量
发展速度(%)
增长速度(%)
累计
(4)
逐年
(5)
定基比
(6)
环比
(7)
定基比
(8)
环比
(9)
1995
a0
4700
—
—
100.0
100.0
—
—
1996
a1
5000
300
300
106.4
106.4
6.4
6.4
1997
a2
5300
600
300
112.8
106.0
12.8
6.0
1998
a3
5400
700
100
114.9
101.9
14.9
1.9
1999
a4
5650
950
250
120.2
104.6
20.2
4.6
2000
a5
5820
1120
170
123.8
103.0
23.8
3.0
2001
a6
6010
1310
190
127.8
103.3
27.9
3.3
2002
a7
6280
1580
270
133.6
104.5
33.6
4.5
2003
a8
6450
1750
170
137.2
102.7
37.2
2.7
2004
a9
6500
1800
50
138.3
100.8
38.3
0.8
2005
a10
6700
2000
200
142.6
103.1
42.6
3.1
【分析】动态数列(dynamicseries)是按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。
动态数列分析建立在相对比基础上,采用定基比和环比两种方式。
常用的动态数列分析指标:
绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
1.绝对增长量说明事物在一定时期所增长的绝对值。
绝对增长量可计算:
(1)累计增长量,若以1995年该县医院门诊就诊人数为基数,各年门诊就诊人数与其相减即得,如1998年门诊就诊累计增长量为5400–4700=700(人);
(2)逐年增长量,即以下一年门诊就诊人数与上一年相减,如表3-5第5栏。
2.发展速度和增长速度可计算:
(1)定基比,即统一以某个时间的指标为基数,用各时间的指标与之相比;
(2)环比,即以前一个时间的指标为基数,用相邻的后一时间的指标与之相比。
发展速度和增长速度是说明事物在一定时期的速度变化。
增长速度=发展速度–1(或100%)。
如:
2000年定基发展速度=5820/4700×100%=123.8%
2000年定基增长速度=123.8%–100%=23.8%
2000年环比发展速度=5820/5650×100%=103.0%
2000年环比增长速度=103.0%–100%=3.0%
按上述方法分别计算出各时期的发展速度与增长速度。
见表3-5的第6~9栏。
3.平均发展速度和平均增长速度平均发展速度是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐年平均发展变化的程度。
平均增长速度是各环比增长速度的平均数,说明某事物在一个较长时期中逐年平均增长的程度。
其计算公式为
平均发展速度=
(3-4)
式中:
a0为基期指标;an为第n年指标。
平均增长速度=平均发展速度–1(3-5)
根据表3-5第3栏资料计算平均发展速度与平均增长速度:
平均发展速度=
平均增长速度=103.6%–100%=3.6%
可以看出,该县医院1995~2005年间门诊就诊人数平均发展速度为103.6%,平均增长速度则为3.6%。
第三节应用相对数的注意事项
例3-6某医生收集了三种消化道肿瘤患者血清TPS检出结果见表3-6,问此表中存在的主要问题是什么?
表3-6消化道肿瘤患者血清TPS阳性率
肿瘤类型
检查人数
阳性人数
阳性率(%)
食管癌
8
8
100.0
胃癌
9
6
66.7
大肠癌
12
7
58.3
合计
29
21
75.0
【问题3-2】
1.这是什么资料?
2.该表中有无不当之处?
为什么?
3.正确做法是什么?
【分析】
(1)这是计数资料。
(2)此表中存在主要问题有两个:
1)计算“阳性率”的分母太小,因为分母太小时,抽样误差大,偶然性大,相对数波动大,结果不稳定;2)合计率的计算错误,不能简单地把各组率相加求其平均值而得。
(3)正确做法:
1)分母过小时,最好用绝对数表示,否则,应列出率的可信区间;2)计算合计率应该分别将绝对数相加,然后用合计的分子与合计的分母求出合计率,本例的合计率为21/29×100%=72.4%。
例3-7某单位于2004年对1191名全体职工进行冠心病普查,按年龄、职业分组统计结果见表3-7。
作者认为:
该单位干部、工人的冠心病发病率均随年龄增加而下降,发病率高峰都在40~岁组,这与其他资料的结果不符。
你同意上述分析吗?
请说明理由。
表3-7某单位不同职业的各年龄组冠心病发病率比较
职业
40~
50~
60~70
合计
病人数
%
病人数
%
病人数
%
干部
21
60.0
9
25.7
5
14.3
35
工人
12
70.6
4
23.5
1
5.9
17
合计
33
63.5
13
25.0
6
11.5
52
【问题3-3】
1.此例分析是否正确?
为什么?
2.正确做法是什么?
【分析】
(1)结论是错误的,原因是犯了用构成比代替率的错误。
该作者普查的结果只有冠心病的年龄构成,只能说明在此单位,无论是干部冠心病患者还是工人冠心病患者均是40~岁组占的比例高,而不能得出该单位干部、职工的冠心病发病率均随年龄增加而下降,发病率高峰都在40~岁组的结论。
(2)正确做法:
调查各年龄段的职工数及2004年当年新发病例数,再分别计算出该单位干部和职工的各个年龄组的发病率再比较。
若只在该单位下结论,可直接根据各年龄组发病率下结论。
例3-8某医院发现一批罕见的疾病病例,其中85%有某化学物接触史,只有15%否认接触史,据此院方认为该病主要是由该化学接触导致的,无接触史者不易发病。
你认为如何?
【问题3-4】
1.85%和15%是构成比还是率?
2.该院方结论是否正确?
为什么?
3.正确做法是什么?
【分析】
(1)这里85%是指在所有病例中有85%的人接触过某化学物,是构成比而不是率。
(2)该医院的结论是错误的,它犯了以比代率的错误。
(3)正确做法:
随机抽取一定数量的有某化学物接触史者和无某化学物接触史者,分别计算两组人群该病的发病率,采用一定的统计学方法进行假设检验后再下结论。
例3-9某医院研究枸橼酸乙胺嗪与酒石酸锑钾对丝虫病的疗效,对81例不合并其他寄生虫病的丝虫病患者采用枸橼酸乙胺嗪治疗,对120例合并血吸虫病患者用酒石酸锑钾治疗,结果见表3-8。
据此表,作者认为枸橼酸乙胺嗪疗效比酒石酸锑钾好,你怎样评价?
表3-8枸橼酸乙胺嗪与酒石酸锑钾治疗丝虫病的疗效比较
药物
病例数
治愈例数
治愈率(%)
枸椽酸乙胺嗪
81
52
64.2
酒石酸锑钾
120
25
20.8
【问题3-5】
1.此作者的结论是否正确?
为什么?
2.正确做法是什么?
【分析】
(1)该作者的结论不正确。
因为他犯了两个错误,首先,对81例不合并其他寄生虫病的丝虫病患者采用枸橼酸乙胺嗪治疗,对120例合并血吸虫病的丝虫病患者用酒石酸锑钾治疗,治疗方法与是否合并血吸虫病都可能影响治疗效果,这样就导致了两组除了治疗方法不同外,还有是否合并血吸虫这个非处理因素的不同,两组不具有可比性;其次,所比较的两组均是样本治愈率,欲比较两组疗效,应该在有可比性的情况下做假设检验,不能根据样本率直接下结论。
(2)正确做法:
随机抽取一定数量的丝虫病患者(不合并其他寄生虫病),并随机分为枸橼酸乙胺嗪治疗组和酒石酸锑钾治疗组,两组之间除治疗方法不同外其余条件应尽可能一致。
治疗一段时间后,观察两组的治愈情况,采用一定统计学方法进行假设检验后再下结论。
【知识点3-3】应用相对数注意事项
1.计算相对数时分母应该有足够数量即例数不能太小。
2.计算合计率或平均率时,不能把n个率相加后除以n,应将绝对数相加后再计算相对数。
3.正确区分构成比与率,分析时不能以构成比代替率。
4.相对数的比较应该注意其可比性。
5.样本率或样本构成比在比较时应做假设检验。
第四节标准化法
例3-10某医院欲比较甲、乙两种疗法治疗某病疗效,得资料见表3-9。
据此认为甲疗法为优。
表3-9甲、乙两种疗法治疗某病的治愈率比较
病型
甲疗法
乙疗法
病人数
治愈数
治愈率(%)
病人数
治愈数
治愈率(%)
轻型
400
360
90.0
100
90
90.0
重型
100
60
60.0
400
240
60.0
合计
500
420
84.0
500
330
66.0
【问题3-6】
1.这是什么资料?
2.该医生的结论是否正确?
为什么?
3.正确做法是什么?
【分析】
(1)甲、乙两种疗法的治疗结果为治愈人数和未治愈人数,为计数资料;
(2)该医师结论不正确,因为这两组病人的病型构成有很大不同,甲疗法中治愈率较高的轻型病人所占比重较大,而乙疗法中治愈率较低的重型组病人所占比重大,并且轻型与重型的治愈率也有很大差别。
两种疗法分别按轻型组和重型组进行比较时,甲、乙两疗法的治愈率相等,但由于两组内部构成不同,即乙疗法的重型组病人多于甲疗法,造成了两种疗法的合计治愈率不同(甲疗法高于乙疗法)。
(3)正确做法:
先将两组治疗对象的病型构成按照统一标准进行调整,然后计算出调整后的标准化合计治愈率即标准化率后再进行比较。
【知识点3-4】
当比较的两组资料内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个合计率是不合理的。
因为其内部构成不同,往往影响合计率的大小,需要按统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化法。
标准化率(standardizedrate)亦称为调整率(adjustedrate),常用的标准化方法有直接法、间接法和反推法。
本教材主要介绍前两种标准化方法。
一、直接法
例3-11试就表3-10资料分析比较甲、乙两地的肿瘤死亡率。
表3-10甲、乙两地的肿瘤死亡率(1/10万)
年龄(岁)
(1)
甲地
乙地
人口数
(2)
人口
构成比(%)
(3)
肿瘤
死亡数
(4)
肿瘤
死亡率
(5)
人口数
(6)
人口
构成比(%)
(7)
肿瘤
死亡数
(8)
肿瘤
死亡率
(9)
0~
206338
53.17
13
6.30
263309
62.30
17
6.46
30~
67187
17.31
27
40.19
55028
13.02
24
43.61
40~
45883
11.82
41
89.36
38724
9.16
39
100.71
50~
28114
7.25
80
284.56
31890
7.54
101
316.71
60~
23621
6.09
147
622.33
21204
5.02
144
679.12
70~
16929
4.36
139
821.08
12513
2.96
123
982.98
合计
388072
100.00
447
115.18
422668
100.00
448
105.99
【分析】由表3-10资料看出,肿瘤死亡率随年龄增长明显升高,乙地各年龄别肿瘤死亡率皆比甲地高,但甲地总的肿瘤死亡率却高于乙地。
究其原因是由于两地年龄别构成不同所致,须计算标化率后再进行比较两地的总肿瘤死亡率。
本例已知两地的年龄别死亡率,用直接法。
1.以某地各年龄组人口数作标准(表3-11第2栏);按式(3-6)计算甲、乙两地的标准化总肿瘤死亡率。
(3-6)
式中Ni为标准年龄别人口数(表3-11第2栏),pi为实际年龄别死亡率(表3-11第3、5栏),N为标准人口总数,ΣNipi为预期死亡数(表3-11第4、6栏)。
本例得:
甲地标准化总肿瘤死亡率
乙地标准化总肿瘤死亡率
可见,经标准化以后,乙地的总肿瘤死亡率高于甲地。
表3-11直接法计算标准化肿瘤死亡率(1/10万)
年龄
(岁)
(1)
标准
人口数
Ni
(2)
甲地
乙地
原肿瘤死亡率
pi
(3)
预期肿瘤死亡数
Nipi
(4)=
(2)×(3)
原肿瘤死亡率
pi
(5)
预期肿瘤死亡数
Nipi
(6)=
(2)×(5)
0~
469647
6.30
30
6.46
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 分类资料的统计描述DOC 分类 资料 统计 描述 DOC