医学统计学试题及答案.docx
- 文档编号:3204903
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:21
- 大小:29.91KB
医学统计学试题及答案.docx
《医学统计学试题及答案.docx》由会员分享,可在线阅读,更多相关《医学统计学试题及答案.docx(21页珍藏版)》请在冰点文库上搜索。
医学统计学试题及答案
医学统计学试题及答案
【篇一:
2012医学统计试题及答案(最新)】
变量中是分类变量的是
a.身高b.体重c.年龄d.血型e.血压
2下面的变量中是是数值变量的是
a.性别b.年龄c.血型d.职业e疗效
3.随机事件的概率p为
a.p=0b.p=1c.p=-0.5d.–0.5p0.5e.0p1
4.用样本作推断,样本应是
a.总体中典型的一部分
b.总体中任一部分
c.总体中随机抽取的一部分
d.总体中按比例分配的一部分
e.总体中信息明确的一部分
5.若以发汞含量大于2.6ug/kg为异常,调查某地1000人中多少人属于异常,这资料可看作
a.计量资料b.计数资料c.等级资料
d.实验资料e.以上均不对
6.统计工作的步骤是:
a.作假设、计算统计量、查界值表和作结论
b.整理资料、分析资料、假设检验
c.统计设计、收集资料、整理和分析资料
d.设立对照组、估计样本、重复试验
e.统计描述、区间估计、假设检验
7.反映计量资料集中趋势的指标是____。
a.标准差b.标准误c.率d.全距e.均数
8.编制频数表中错误的做法是____。
a.找出最大值和最小值,计算极差
b.定组距,常用等组距,一般分8~15组为宜
c.写组段时组段可重叠,如“2~4,4~6,?
”
d.用划记法计频数
e.第一个组段应包括变量最小值,最后一个组段应包括变量最大值
9.在描述资料的变异程度时,最宽的范围是___。
a均数?
标准差b极差c四分位数间距
d95%的参考值范围ep5~p95间距
10.比较20头河马体重和20只小白鼠体重两组数据变异程度大小宜采用____
a.变异系数(cv)b.方差c.极差(r)
d.标准差(s)e.四份位数间距
11.对血清滴度资料表示平均水平的最常用统计量是:
:
a.均数b.中位数c.几何均数
d.全距e.标准差
12.描述一组偏态分布资料的变异程度时,适宜的统计量是:
a.变异系数(cv)b.方差c.极差(r)
d.标准差(s)e.四份位数间距
13.关于标准正态分布曲线下的面积,错误的是____
a.-1.96到1.96间曲线下面积是95%
b.1.96到2.58间曲线下面积是2%
c.大于1.645的曲线下面积是2.5%
d.-1.96到-1.645间曲线下面积是2.5%
e.大于1.96的曲线下面积为2.5%
14.?
?
1.96?
范围内占正态曲线下面积的____。
a.80%b.99%c.95%d.5%e.47.5%
15.正态曲线下总面积为____。
a.95%b.99%c.50%d.1%e.100%
16.抽样误差是由
a.计算引起b.测量引起c.抽样引起
d.采样结果不准引起e.试剂、仪器未经校正引起
17..在抽样研究中,均数的标准误。
a.比标准差大b.比标准差小c.与标准差无关
d.比均数大e.与标准差相等
18.配对设计t检验的统计假设为
a.两样本来自同一总体b.差数的均数来自?
?
0的总体
c.差数的均数来自?
?
0的总体d.差数的均数来自?
?
0的总体
e.差数的均数来自?
?
0的总体
19.假设检验的步骤是
a建立假设、选择和计算统计量、确定p值和判断结果
b建立无效假设、建立备择假设、确定检验水准
c确定单侧检验或双侧检验、选择t检验或u检验、估计i类错误和ii类错误
d计算统计量、确定p值,做出推断结论
e以上都不对
20.在比较两样本均数的假设检验中,结果t=3.24,t0.05(v)=2.086,t0.01(v)=2.845。
正确的结论是
a两样本均数不同
b两样本均数差异很大
c两总体均数差异很大
d两样本均数来自同一总体
e两样本均数来自不同总体
21.区间x?
2.58s?
的含义是x?
a.99%的总体均数在此范围内b.样本均数的99%可信区间
c.99%的样本均数在此范围内d.总体均数的99%可信区间
22.通常可采用以下那种方法来减小抽样误差。
a.减小样本标准差b.减小样本含量
c.增大样本含量d.以上都不对
23.关于假设检验,下列那一项说法是正确的。
a.单侧检验优于双侧检验
b.采用配对t检验还是成组t检验是由实验设计方法决定的
c.检验结果若p值大于0.05,则接受h0犯错误的可能性很小
d.用u检验进行两样本总体均数比较时,要求方差齐性
24.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小
a.?
?
0.05b.?
?
0.01c.?
?
0.10d.?
?
0.20?
25.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为
2两个样本,求得x1,s,x2,s2,则理论上
2a.x1?
x2,s12?
s2?
?
?
21?
b.作两样本t检验,必然得出无差别的结论
c.作两方差齐性的f检验,必然方差齐
d.分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠
26.作两样本均数比较的t检验时,正确的理解是:
a.统计量t越大,说明两总体均数差别越大。
b.统计量t越大,说明两总体均数差别越小。
c.统计量t越大,越有理由认为两总体均数不相等。
d.p值就是?
?
e.p值不是?
,且总是比?
小。
27.将90名高血压病人随机等分成三组后分别用a、b和c方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____。
a.作三个差值样本比较的t检验b.作三个差值样本比较的方差分析
c.作配伍组设计资料的方差分析d.作两两比较的t检验
e.以上都不对
28.当组数等于2时,对于同一资料,方差分析结果与t检验的结果:
____.
a.完全等价且f=t.B.方差分析结果更准确
C.t检验结果更准确.D.完全等价且t
E.以上都不对
29.方差分析中
a.f值可能是负数
b.f值不可能是负数
c.组间离均差不会等于组内离均差
【篇二:
医学统计学历年考题及答案】
/研究生/医学统计
简答
1给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等
2一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?
为什么?
如果是你,用什么?
3假设检验的基本思想和原则
4给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?
5给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。
问你合不合理,为什么?
你的设计是什么?
6一型错误和二型错误的区别和联系
7什么是抽样误差?
举例说明分类资料和数量资料的抽样误差计算
1给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:
计算时直接带入公式的相关数值
(1)比较白天晚上血压有无差别(配对t检验计算)
(2)白天和晚上血压有无相关(相关分析)
(3)如何用白天血压估计晚上血压(回归分析)
2多个平均值进行总体假设检验。
类如几种药的作用效果是否相同(方差分析)
(也有人说:
一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)3样本率与总体率的比较(u检验)(也有人说:
配伍组方差分析)
2008
1.列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2.医学统计中,将正态分布视为近似正态分布有哪几种情况?
列出应用条件和公式3.数值资料的统计描述指标?
公式?
4.多元回归模型的基本形式?
参数含义?
回归效果的评价?
5.什么叫截尾值?
产生原因?
举例说明
6.一同学两样本率的比较用了卡方检验,你有什么建议?
若不符合卡方检验的应用条件,你又有什么建议?
他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?
7.一个三因素的2x2x2的析因设计的实验设计及分析思路8.给了一个数值资料:
小鼠的饮食量x1,x2,x3,x4,x5,x6,x7,x8,x9共十个数值小鼠的体重增加量也有十个值
(1)对体重增加量资料进行统计描述
(2)求饮食量和体重增加量的关系
(3)由体重增加量的样本估计其代表总体均数的可信区间
(4)求小鼠体重增加量为x5(就是从体重增加量的那十个値里取了一个)的95%的置信区间(5)(3)和(4)中的可信区间有什么差别?
2006
1直线回归中的b与多元线性回归中的b有什么区别?
多元线性回归中,是否可以用b来表示各自变量对因变量的影响?
为什么?
2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中p.a,b以及1-b的意义
4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?
应该用什么统计方法,并写出统计思路
5有一个两样本的秩和检验的应用题,写思路,不要求计算
6生存分析中,有哪些非参数检验的方法?
两个生存率的比较用什么检验?
7给了一个实验,测量抗体.
样本序列抗体滴度效应是否有效11:
40+是21:
160++是.
..
.就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.8正态分布,二项分布,poisson分布的可信区间
9有两个变量,让你说出分析它们相关的统计分析思路
10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.
2005(研究生)
1.举例说明变量及变量类型。
(10分)
答案:
变量:
在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。
如身高、体重、疗效等
变量按其性质可分为两种类型:
(1)数值变量:
其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。
如身高(cm)、体重(kg)、心律(次/min)、血压(mmhg)等。
(2)分类变量:
表现为互不相容的类别或属性,它又分为无序与有序两类:
a.无序分类变量:
是指所分类别或属性之间无程度或顺序上的差别,如:
性别(男、女)血型(a、b、o、ab)等。
b.有序分类变量:
是指所分类别或属性之间有程度或顺序上的差别。
如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。
2.在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设。
请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。
(10分)
答案:
p值为0.015小于检验水准a(0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝h0,接受h1,尚可以认为现有样本所代表的总体与已知总体不相等。
p值的含义是指从h0所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于)现有样本统计量的概率。
若pa,按a检验水准不拒绝h0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。
若p=a,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝h0,接受h1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。
3.写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。
(15分)
答案:
(1)统计描述:
描述资料的类型:
数值变量资料频数表资料的分布:
正态性检验服从正态分布:
均数、标准差(方差);不服从正态分布,服从对数正态分布:
几何均数、几何标准差;偏态分布:
中位数、四分位数间距
(2)统计推断:
资料的设计类型:
完全随机设计的多个样本比较
分布:
正态性检验和方差齐性检验:
(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;
(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。
4.写出两变量之间相关关系的分析思路。
(15分)答案:
(1)绘制散点图:
在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。
如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作spearman等级相关分析。
或者进行曲线拟合。
(2)计算直线相关系数r或者spearman秩相关系数rs。
r?
?
?
x?
x?
?
y?
y?
?
?
x?
x?
?
?
y?
y?
2
2
?
lxylxxlyy
(3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的r值也不一定等于零,应对样本相关系数做假设检验。
根据检验目的,检验假设为:
h0:
p=0;h1=/0.常用t检验
t?
rs
r
?
r1?
r
2
v=n-2,拒绝h0认为两变量间存在直线相关。
n?
2
(4)总体相关系数的可信区间估计,先对相关系数做z变换,估计z的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a)%可信区间(z?
ua/换。
5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。
要求写出随机分配方案。
(10分)
随机数字表(部分数据)
编号1-1011-2021-3031-4041-50122176865816895239235870222575161094395065824820347219362759461379933755397732770985520530624783516274316772302770961872521280624259316711359782305474725
478437671612044903264976763996146380393226981219921503282826087337320405693016090588695828993507447547
答案:
先把十五只动物按体重从小到大分别编号:
123456789101112131415;在随机数字表任意指定某行某列,如
取第三行的1列开始,向下录入不重复的二位随机数字:
167723020961872521280624937113;
对应于十五只动物的编号,对随机数字有小到大编秩得出序号r如下:
513713111496102815124;并规定:
一到五号分到甲试验组,六到十号分到乙组,十一到十五号分到丙组;随机分配结果是:
甲实验组动物有:
1451115;乙组动物为:
3891012;丙组动物有:
2671314。
6.某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对k562细胞进行抑制。
此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)?
(10分)
答案:
此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。
设计方案:
该试验是一个2x3的析因设计,共有2x3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。
b2表示乙药物,b3表示丙药物。
先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。
分析两因素之间有无交互作用及其交互作用的性质。
同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。
样本含量:
2x3x4=24
7.某研究者随机测定了某地100例健康成人血清nse酶(ug/l)含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。
(20分)答案:
(1)资料的类型,列频数表,观察分布类型和分布特征:
经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。
统计描述:
(2)通过资料来估计制定医学参考值范围:
比如估计该地健康成年人血清nse酶含量的上双侧95%(90%、99%)参考值范围,如果资料为正态分布资料,则95%医学参考值范围为(x?
1.96s,x?
1.96s);如果资料为对数正态分布资料,则95%医学参考值范围为lg围为(p2.5~p97.5)。
?
1
n?
3,z?
ua
,再对z的可信区间上下限按r=tanhz进行逆变n?
3)
(xlgx-1.96slgx,xlgx+1.96slgx);如果资料为偏态分布,则95%医学参考值范
(3)统计推断:
参数估计包括均数的抽样误差即标准误:
sx?
sn
和总体均数的可信区间估计①?
未知且n较
小:
可信区间为(x?
ta/2,?
sx,x?
ta/2,?
sx);②?
未知但n足够大:
(x?
ua/2,sx,x?
ua/2,sx);③?
已知:
(x?
ua/2,?
x,x?
ua/2,?
x)。
8.多元回归方程为:
yhat=b0+b1x1+b2x2+…+bjxj+…+bpxp,其中bj的名称是什么,它的意义是什么?
若比较各自变量对因变量影响的大小,应通过什么统计量比较?
判断多元线性回归分析的效果应看那些指标?
(10分)
答案:
bj称为偏回归系数,意义是在其他自变量固定不变的条件下,自变量xi每改变一个单位时所引起的因变量y的平均改变量。
比较各自变量对因变量影响的大小,应通过bj的大小来比较。
常用的多元线形回归分析的效果指标有决定系数r(是回归平方和占总平方和的比例,值越大,回归效果越好)、复相关系数(决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度r越就接近1,线性关系越密切)、校正决定系数(越大回归效果越好)、剩余标准差(不能有m个自变量的变化解释的y的变异,越小回归效果越好)等。
2001级七年制临床医学专业考试试题答案
1、同质:
对研究指标影响较大的、可以控制得主要因素尽可能相同。
变异:
同质基础上各观察单位的某变量值得差异称为变异。
2、均数的抽样误差:
由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。
3、假设检验p值含义:
p值是指从所规定得总体中随机抽样时,获得等于及大(负值时为等于及小于)现有样本统计量的概率。
若,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。
若,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝,接受;可认为从已知总体抽到现有样本得可能性很小,该样本可能来自另一总体。
4、变量及其变量类型:
变量:
在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。
变量类型:
1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位。
由数值变量的测定值组成的资料称为数值变量资料或计数资料。
如:
身高、体重、心律、住院天数、血压等。
2.分类变量亦称定性变量,表现为互不相容的类别或属性。
分类变量可分为无序与有序两类:
(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。
分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。
如:
性别(男、女),血型(o、a、b、ab)等。
二、
标准差:
计算公式:
s?
(1)
(2)(3)(4)(5)
n—1
表示观察值的变异程度
s
计算变异系数cv?
?
100%
x
确定医学参考值范围计算标准误
与样本含量没有关系
2
?
x
?
x
标准误:
计算公式:
s?
sn
(1)估计均数的抽样误差的大小
(2)估计总体均数可信区间:
(x?
t?
2
?
s,x?
t?
2
?
s)
(3)进行假设检验
(4)与样本含量成反比
三、1、t分布,均数的区间估计:
1)?
未知且n小:
?
x?
t?
,?
sx?
t?
2,?
s?
2)?
未知,但n足够大时(n100),t分布逼近u分布:
?
x?
u?
2sx?
u?
s?
3)?
已知:
?
x?
u?
2?
x?
u?
2?
?
2、二项分布:
当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布,总体率?
的可信区间:
?
p?
u?
sp,p?
u?
2sp?
3、poisson分布:
当样本阳性数x50时,可按正态近似原理先求总体平均数?
的95%或99%可信区间:
?
x?
u
?
2
x,x?
u?
x
?
四、方差分析的应用条件:
1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。
应用:
1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用;3)回归方程的线性假设检验;4)多元线性回归分析中偏回归系数的假设检验等。
五、该设计是2*4析因设计
(随机数字表略去)将随机数字排秩,按秩次的1到8,分别取从a1b1、A1B2、A2B1、...、A4B2。
进行实验。
六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。
这就是完全随机设计两样本比较的分析思路。
其检验统计量t值是:
x?
x2
,?
?
n1?
n2?
2t?
1
sx?
sx2
1
七、
非条件logisti回归模型:
exp(?
0?
?
1x1?
?
2x2?
?
?
?
mxm)
p?
1?
exp(?
0?
?
1x1?
?
2x2?
?
?
?
mxm)
,
其中?
0是常数项,?
1、?
2?
?
m为偏回归系数。
2002级临床医学七年制《医学统计学》期末考
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 试题 答案