SAS临界值.docx
- 文档编号:967245
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:72
- 大小:47.56KB
SAS临界值.docx
《SAS临界值.docx》由会员分享,可在线阅读,更多相关《SAS临界值.docx(72页珍藏版)》请在冰点文库上搜索。
SAS临界值
现代统计学与SAS应用—附录2~5
附录2 统计用表及产生这些表所需的SAS程序
统计用表
表 t、r、rs、χ2临界值
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
t临界值 r临界值 rs临界值 χ2临界值
df──────── ──────── ──────── ─────────
双∶ 双:
双:
单:
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
1 … …
2 … …
3 … …
4 … …
5 …
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
100
120 … … … … ?
∞ … … … … … …
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
“单”指单侧概率,“双”指双侧概率,r是Pearson相关系数,rs是Spearman等级相关系数
表 F临界值(方差齐性检验用,双侧概率为
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df2df1∶1 2 3 4 5 6 7 8 9 10 20 ∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
100
120
∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df1为F统计量分子(即较大均方)的自由度,df2为F统计量分母(即较小均方)的自由度
表 F临界值(方差分析用,单侧概率为
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df2df1∶1 2 3 4 5 6 7 8 9 10 20 ∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
100
120
∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df1为F统计量分子的自由度,df2为F统计量分母的自由度
表 F临界值(方差分析用,单侧概率为
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df2df1∶1 2 3 4 5 6 7 8 9 10 20 ∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2
3 ?
?
?
4 ?
5
6
7 ?
8 ?
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
100
120
∞
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
df1为F统计量分子的自由度,df2为F统计量分母的自由度
产生上述表所需的SAS程序
[SAS程序]──[] 这是产生t临界值表所需的SAS程序
OPTIONSLS=120PS=55;
DATAabc;
ARRAYT(50,9);
g=1;
DOd=1TO40,50,60,70,80,90,100,200,500,1000,0;
w=1;
DOalpha=,,,,,,,,;
p=1-alpha/2;
b=TINV(p,d);
b=ROUND(b,;
T(g,w)=b;
w=w+1;
OUTPUT;
END;
g=g+1;
END;
FILEPRINT;
DOL=1TO50;
c=L;
PUT#c@5 T(L,1) @12T(L,2) @19T(L,3)
@26T(L,4) @34T(L,5) @42T(L,6)
@50T(L,7) @59T(L,8) @68T(L,9) ;
END;
RUN;
[SAS程序]──[] 这是产生χ2临界值表所需的SAS程序
OPTIONSLS=120PS=50;
DATAabc;
ARRAYX(46,13);
g=1;
DOd=1TO40,50,60,70,80,90,100;
w=1;
DOalpha=,,,,,,,,,,,,;
p=1-alpha;
b=CINV(p,d);
b=ROUND(b,;
X(g,w)=b;
w=w+1;
OUTPUT;
END;
g=g+1;
END;
FILEPRINT;
DOL=1TO46;
c=L;
PUT#c@5 X(L,1) @11X(L,2) @17X(L,3)
@23X(L,4) @29X(L,5) @35X(L,6)
@41X(L,7) @47X(L,8) @54X(L,9)
@61X(L,10)@68X(L,11)@75X(L,12)
@82X(L,13);
END;
RUN;
[SAS程序]──[] 这是产生F临界值表所需的SAS程序
OPTIONSLS=120PS=50;
DATAa;
alpha=;
p1=1-alpha;
p2=1-alpha/2;
ARRAYF1(13,35);
ARRAYF2(13,35);
g=1;
DOv1=1TO10,20,30,1000000;
w=1;
DOv2=1TO30,40,60,100,120,1000000;
a=FINV(p1,v1,v2);
a=ROUND(a,;
F1(g,w)=a;
b=FINV(p2,v1,v2);
b=ROUND(b,;
F2(g,w)=b;
w=w+1;
OUTPUT;
END;
g=g+1;
END;
FILEPRINT;
DOL=1TO35;
c=L;
PUT#c@1 F1(1,L) @8 F1(2,L)
@15F1(3,L) @22F1(4,L)
@29F1(5,L) @36F1(6,L)
@43F1(7,L) @50F1(8,L)
@57F1(9,L) @64F1(10,L)
@71F1(11,L)@78F1(12,L)
@85F1(13,L);
END;
DOL=1TO35;
c=L;
PUT#c@1 F2(1,L) @8 F2(2,L)
@15F2(3,L) @22F2(4,L)
@29F2(5,L) @36F2(6,L)
@43F2(7,L) @50F2(8,L)
@57F2(9,L) @64F2(10,L)
@71F2(11,L)@79F2(12,L)
@87F2(13,L);
END;
RUN;
[说明] 与F1对应的F临界值是单侧的,用于方差分析;与F2对应的F临界值是双侧的,
用于两总体方差齐性检验。
欲得到的F临界值,只需将alpha=改成。
附录3 估计样本含量的常用公式
研究者需提出某些精度要求,并提供某些先验知识,方可进行估计。
所谓精度要求,通常
指事先规定允许犯Ⅰ型错误的概率α、检验功效或把握度1-β(这里β为允许犯Ⅱ型错误的
概率)。
α定得越小,1-β定得越大,所需样本含量就越大。
所谓先验知识,就是根据专业知
识、文献资料或预试验结果获得的由样本推断总体的一些信息,如:
已知δ(最大容许误差或
差值)、σ(标准差)等。
注意∶查t临界值表时,一律看双侧概率栏,因为公式中已考虑了单、双侧检验问题。
未按单、双侧分别讨论时,一般指的是双侧。
估计总体均数时所需的样本含量
σ已知:
σ未知:
式中n,δ,σ,S分别为样本含量、容许误差、总体标准差、样本标准差;uα,tα分别为与
u临界值表、t临界值表中双侧概率栏相对应的临界值,其中tα=tα(df),第1次取df=∞,
求得的n记为n1,第2次取df=n1-1,依次类推,直至前后两次求得的n趋向稳定的数值时为止(下同)。
[例] 拟抽样调查了解某地区正常成年人白细胞数的平均水平。
希望误差不超过100
个/mm3,据文献所载,正常成人白细胞数的标准差约为1000个/mm3。
取α=,问需调查多少人?
将S=1000、δ=100、(∞)=代入式,得n=,取为385人(n>100,可免去尝试)。
估计总体率时所需的样本含量
π(或P)接近时,
π(或P)接近0或1时,
[例] 拟用抽样调查了解某地小学生蛔虫感染率。
假定以往该地小学生蛔虫感染率
P=50%,要求误差不超过3%,如取α=,问需调查多少人?
将P=、δ=、u=代入式,得n=,取为1068人。
采用单组设计或定量资料的配对设计时所需的样本含量
单侧:
双侧:
[说明] 若是配对设计,则用Sd取代式中的S。
[例] 用某药治疗矽肺患者后,尿矽排出量平均比治疗前增加100ml,其标准差
为100ml。
假定该药确能使尿矽排出量增加,定α=(单侧),β=,问需观察多少
患者才能得出服药前后尿矽排出量有显着性差别的结论?
本例为配对设计,因要求疗后尿矽排出量增加,故宜选单侧检验。
令S=Sd,并将δ=、
Sd=、t2α(∞)=(∞)=、t2β(∞)=(∞)=代入式,经三次尝试,得n=26人。
采用成组设计时所需的样本含量
单侧:
双侧:
[例] 在动物镇咳试验中,比较中药复方Ⅰ与复方Ⅱ使小鼠推迟发生咳嗽的时间,复
方Ⅰ和复方Ⅱ的平均值分别为和秒(即δ=秒)。
设两组标准差
相等为25秒,α=(双侧),β=,要得出两组有显着性差别的结论,问需用多少只小鼠
将δ=、S=25、tα(∞)=(∞)=、t2β(∞)=(∞)=代入式,
经三次尝试,得n1=n2=88,两组共需176只。
两总体率比较时所需的样本含量
单侧:
双侧:
[例] 用旧药治疗慢性气管炎的近控率,根据过去的经验为20%。
现拟试用新药治疗,
以旧药为对照,要求新药的近控率须达到40%才值得推广使用。
令α=(单侧),β=,问
每组最少要多少病例?
由题意可知,应选单侧检验。
将P1=、P2=、u2α=、u2β=代入式,
得n=,即每组至少要88人。
四格表中配对设计时所需的样本含量
设配对四格表的格式为:
令:
第2种检查:
+ - π+-=b/(a+b), π-+=c/(a+c),
第1种 + a b π-=(π+-+π-+)/2
检查 - c d 则:
[例] 某菌种接种于甲、乙两种培养基的结果如下:
甲阳性乙阴性的概率π+-=,
甲阴性乙阳性的概率π-+=,设α=(双侧),β=,问应该用多少样本对子数?
将π+-=、π-+=、π-=+/2=、
u=、u=代入式,得n=57对。
直线相关分析时所需的样本含量
单侧:
双侧:
[例] 估计总体相关系数ρ=,规定α=(双侧),β=,问需要多少例?
将ρ=、u=、u=代入式,得n=17例。
两总体相关系数比较时所需样本含量
单侧:
双侧:
式中。
[例] 设ρ1=,ρ2=,α=(单侧),β=,问需要多大样本例数?
因ρ1=>ρ2=,故取单侧检验。
将它们的值及u=、u=代入式
,得每组应取90例。
两总体生存率比较时所需的样本含量(设N=n1+n2,令n1=n2)
单侧:
双侧:
[例] 已知胃癌常规手术的5年生存率为50%,现拟改进手术,要求新手术的生存率达
到70%以上,设α=(单侧),β=,问需要多少样本例数?
依题意应选单侧检验。
将P1=、P2=、u=、u=代入式,得
n=84例,即每组各取42例。
附录4 三种常用的离散型随机变量的概率
二项
一般地,若进行n次独立试验,每次试验只有两个可能的结果,要么事件A发生,要么A不
发生。
若p=P(A)为A发生的概率,q=1-p为A不发生的概率,0
用X表示这n次试验中
A发生的次数,则
这个分布叫二项分布,也称为贝努利分布。
[例] 已知某病自愈率为,为了鉴定一种新药是否有效,医生把它给10个患政
用,判断规则是∶若这10名患者的治愈人数≥4,则认为此药有效;反之,则认为无效。
求∶
(1)虽然新药有效,并把痊愈率提高到,但经过试验却被否定的概率;
(2)新药完全无效,但通过试验被认为有效的概率。
解∶对
(1)而言,P(否定新药)=;
对
(2)而言,P(误判新药有效)=。
普阿松
若随机变量X的取值为非负整数,且相应的概率为
λ>0为X的均数
则称随机变量X服从普阿松。
[例] 设某昆虫产k个卵的概率为Pk=λke-λ/k!
k=0,1,2,…,又设一个
虫卵能孵化为昆虫的概率为p,若卵的孵化是相互独立的,问此昆虫的下一代有l条的概率
是多少?
解∶设用Y表示一条昆虫的产卵数,用X表示该昆虫下一代的数目,则
几何
一般地,在一个贝努利试验中,事件A出现的概率为p,试验一个接一个地独立进行,用X
表示第1次出现事件A时所进行的试验次数,则X的为
P(X=k)=qk-1p, k=1,2,…
[例] 某血库急需AB型血,需从献血者中获得,根据经验,每100个献血者中只有2名
身体合格的AB型血的人。
现在对献血者一个接一个进行化验,用X表示第1次找到合格的AB
型血的人时,献血者已被化验的人数,求X的。
解∶将p=2/100=、q=1-p=代入式,便得X的,即
附录5 与SAS软件有关的内容
[说明] ~由胡良平编写,由代炼忠编写。
SAS表达式简介
1.SAS常数表达式
(1)数值常数 如:
、-5、。
(2)字符常数 如:
name1='TOME'、name2='MARY'、name3='JOHN'。
(3)日期(d)、时间(t)、日时(dt)常数 如:
d1='01JAN80'd、t1='9:
25:
19't、
dt1='18JAN80:
9:
27:
05'dt。
(4)16进制常数(略)
2.SAS运算符
(1)前缀算符与后缀算符
前缀算符,即正号或负号;如:
+Y;-25;-COS(30);+(X*Y);后缀算符,即两个运算对
象之间的运算符号,如:
1+9;4-2;6<8。
(2)只含一个运算符的简单表达式(Ⅰ组)和含有多于一个运算符的复合表达式(Ⅱ组)
Ⅰ组,如:
A+B;C-D;E*F;G/H;Ⅱ组,如:
1-EXP(N/(N-1)); 100-LOG(N*(N+1));
(3)操作运算的顺序
求一个复合表达式的值时,其操作运算的顺序和优先级遵从如下的规则(见表:
表 SAS的运算符及其在运算顺序上的优先级
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
优先级组别 运 算 符 号 等价表示 运算符号含义之说明
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
第0组 ( ) 括号
第1组 ** + - 乘方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 临界值