韩 测量复习提纲11.docx
- 文档编号:12772847
- 上传时间:2023-06-08
- 格式:DOCX
- 页数:21
- 大小:422.86KB
韩 测量复习提纲11.docx
《韩 测量复习提纲11.docx》由会员分享,可在线阅读,更多相关《韩 测量复习提纲11.docx(21页珍藏版)》请在冰点文库上搜索。
韩测量复习提纲11
第一章心理测验总论
1、首先倡导测验运动的优生学创始人、英国生物学家和心理学家高尔顿。
强调不同个体之间在能力上存在着重要的差异;此种差异主要来自于遗传,提出了优生学。
高尔顿还是应用等级评定量表、问卷法以及自由联想法的先驱。
2、美国心理学家卡特尔于1890年发表的《心理测验与测量》一文,首创了“心理测验”这个术语。
3、科学心理测量的创始人是比纳(Binet)。
1905年他与助手西蒙编制了第一个智力测验----比纳-西蒙智力量表。
1905年出版的智力测验有30道题目,侧重于测量判断,推理和理解方面,测验结果是以答对的题数来计算,没有一个客观的分数来评价智力水平。
1908年比纳对测验做了修订,把题目按年龄来分组,并以智龄来报告测验的结果。
4、测验的特性:
P7-9
①心理测量的间接性
②心理测量的相对性
③心理测量的客观性
5、心理测验的种类
①按测验的功能分类:
能力测验(测量一个人所具有的能力和潜在能力)
学业成就测验(测量一个人对知识和技能掌握的程度)
人格测验(测量一个人的性格、气质、兴趣、态度、需要、品德、情绪、动机、自我价值等个性心理特征)
②按测验人数分类
个别测验(测验者和被测者一对一)
优点:
对被试的反应有较多的观察和控制机会。
结果比较可靠
缺点:
比较费时,主试需要较高的训练与素养
团体测验(一个测验者同时测量多个被试)
优点:
省时,对主试要求不高
缺点:
被试在测验中的行为不宜控制。
结果不一定可靠。
③按测验材料分类
文字测验(纸笔测验)缺点:
受文化程度的影响
操作测验缺点:
不能团体测试,因而时间上不够经济。
口头测验缺点:
不能团体测试,主试需要较好的语言表达能力,被试的掩饰性更高。
电脑测验优点:
方便统计结果,操作较为简单缺点:
硬件实施要求较高。
④按测验的目的分类
描述性测验(大致了解人的心理特征)优点:
快速,简便缺点:
结果比较粗糙,不够准确
诊断性测验(精确确定人的心理特征)优点:
结果比较精确可靠
预示性测验(潜能测试)
⑤按测验难度分类
速度测验:
(测验题目较为容易,但数量多,且时限短)
难度测验(包含各种不同难度的题目,由易到难排列,其中有一些极难的题目,几乎所有的被试都解答不了,但作答时间充裕。
)
⑥按测验性质分类
构造性测验:
(在此测验中,所呈现的刺激和被试的任务是明确的)
投射性测验:
(呈现的刺激没有明确的意义,问题模糊,对被试的反应也没有明确规定。
)
第二章心理测量的编制
1、项目分析包括质的分析和量的分析。
2、项目的编排:
两种常见的排列方式:
并列直进式(此种方式是将整个测验按项目内容或形式分为若干分测验,属同一分测验的项目,则依其难度由易到难排列)
混合螺旋式(此种方式是将各类项目依难度分成若干不同的层次,再将不同性质的项目予以组合,做交叉的排列,其难度则渐次上升。
此种排列的优点是,被试对各类项目循序作答,从而维持作答的兴趣。
)
3、时限:
通常说的时限是使大约90%的被试能在规定的时间内完成全部的测验,如果题目由易到难排列,应使大多数人在规定时间内完成他会答的问题。
4、项目的难度
①难度的范围在0~1之间,难度系数越小题目难度越大。
②当被试人数较多时,可以先将被试依照测验总分从高到低排列,然后将总分最高的27%和最低的27%的被试定为高分组和低分组,分别计算两组在某一项目上的通过率。
用于样本很大的测题
例:
在100名学生中,高分组与低分组各有27人。
其中高分组答对第一题的有20人,低分组答对第一题的有10人。
请问这道题的难度系数是多少?
③在选择题中,由于允许猜测,备选答案数目越少,机遇作用越大,就越不能反映题目的真实难度。
为平衡机遇对难度的影响,可用下面的公式校正:
P为实得通过率,K为备选答案数目。
校正难度的作用:
检验实际难度:
例:
某题通过率为75%,是一个五选一的题目.
比较两个不同选项数题目的难度:
例:
有二道题,一题的难度为0.50,有五个选项,另一题的难度为0.53,有四个选项.
④项目难度的选择:
项目难度多高合适,取决于测验的目的、性质以及项目的形式。
1、如果测验是为了了解被试对知识、技能的掌握情况,就不必过多考虑难度;
2、如果测验用于选拔人员,就应该比较多地采用难度值接近录取率的项目。
3、如果测验是为检验被试个体间的差别,则应选择接近中等难度的项目。
5、项目区分度
区分度的取值范围介于-1.00至+1.00之间。
通常D为正值,称作积极区分;D为负值,称为消极区分,D为0称作无区分作用。
具有积极区分作用的项目,其D值越大,区分的效果越好。
测题和总分的相关:
1)二列相关(两个连续变量,但其中一个变量被人为分成两类。
)
公式:
或
=该题及格的被试在总分上的平均分
=该题不及格的被试在总分上的平均分
p=该题的难度q=1-pSt=全体被试的总分标准差
=总分平均数y为p与q交界处正态曲线的高度
二列相关系数的显著性检验公式:
N为被试总人数,y为正态分布下答对百分比所在位置曲线的高度
可见,作文分数与总分相关显著。
2)点二列相关(一个变量为连续变量,另一个变量为二分变量)
公式:
3)用Φ系数计算区分度(二变量均为二分称名变量)
若检验Φ值是否显著,应先将Φ值转换成值:
例:
15个学生数学成绩四格表
6、编制是非题的注意事项:
A.每一个题目只能包含一个概念;
B.避免具有暗示性的字词,如“绝不”、“总是”、“有时”、“可能”等;
C.题目的表述要简洁明确;
D.各种答案的测题数量大致相等;
E.测题要有一定的数量.
7、编制选择题的注意事项:
A.选项要多,普遍采用4—5个;
B.只有一个对的选项.错的也不能太明显,以致没人选.
C.题目的编排要有利于理解,选项不要夹在题干中间,
D.各个选项在形式上应该协调一致.
E.选项之间不应相互重叠,相互包括
F.选项中有相同的词可以考虑放到题干里,以免显得累赘
G.正确答案的位置要随机安排
8、简答题的编制原则:
A.只能有一个答案
B.不适宜测量零散琐碎的知识
C.测量有重要意义的词类
D.题中不应有正确答案的线索
E.如果答案是数字,最好跟上单位
F.测题不能直接来自课本或参考书
G.测题中的空格不宜过多
第三章测量的误差及其检验
1、真分数定义:
真分数指的是在测量没有误差时所得到的真值。
(无数次测量结果的平均值)
经典测验理论(CTT)假定,观察分数与真分数之间是一种线性关系,并只相差一个随机误差。
即:
X=T+EX是实得分数或观测分数,T是假设的真分数,E是测量的误差。
2、估计信度的方法
(1)再测信度(Test—retestreliability):
用同一个测验,对同一组被试前后两次施测,两次测验分数所得的相关系数为再测信度,又称稳定性系数。
(2)复本信度(equivalentformsreliability):
根据一组被试在两个平行(等值)测验上的得分计算的相关系数即为复本信度,又称为等值性系数
(3)分半信度(Split—halfreliability):
分半法是按正常的程序实施测验,然后将全部项目分成相等的两半,根据各人在这两半测验的分数计算其相关系数。
(4)同质性信度
含义:
1)同质性也称内部一致性,指的是测验内部所有题目间的一致性。
2)当一个测验具有较高的同质性信度时,说明测验主要测的是某一单个心理特质,实测结果就是该特质水平的反映。
如果一个测验同质性信度不高,则说明测验结果可能是几种心理特质的综合反映。
3)一些表面上看起来是测量同一种心理特质的题目,如果其题目间不具有较高的正相关,则不能认为它们具有同质性。
4)分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。
估计方法:
1)内部一致性系数的一种粗略估计方法是求测验的分半信度
2)求所有题目之间的相关:
式中K为构成测验项目数,为项目间相关系数的平均数,为同质性信度值。
Ø库德—理查逊公式(K—R21):
式中K为构成测验项目数,pi为通过第i题的人数比例,qi为未通过第i题的人数比例,为测验总分的变异数。
1
2
3
4
5
6
∑X
001
002
003
004
005
006
007
008
009
010
1
1
0
1
0
1
1
1
1
1
0
0
0
1
1
1
1
1
1
1
0
0
0
1
0
1
1
1
0
1
0
1
0
0
0
0
1
1
1
1
0
0
1
0
1
0
0
0
1
1
0
0
1
0
1
0
0
0
1
1
1
2
2
3
3
3
4
4
5
6
∑Z
P
q
pq
8
0.8
0.2
0.16
7
0.1
0.3
0.21
5
0.5
0.5
0.25
5
0.5
0.5
0.25
4
0.4
0.6
0.24
4
0.4
0.6
0.24
∑pq=1.35
K=6,∑pq=1.35,S2=2.10
Rkr20=6÷(6-1)×(1-1.35÷2.10)=0.39
Ø库德—理查逊公式(K—R21):
(只有当所有题目的难度接近时才适用)
式中K为构成测验项目数,为测验总分的平均数,为测验总分的变异数。
Ø克伦巴赫系数(适用于多重记分题)
式中K为构成测验项目数,为某一题目分数的变异数,为测验总分的变异数。
注:
1)此公式可以处理任何测验的内部一致性系数的计算问题。
2)值还是所有可能的分半信度的平均值,它只是测量信度的下界的一个估计值,即值大,必有测量信度高;但值小时,却不能断定测量信度不高。
3、影响信度的因素
1)被试的样本:
样本的范围越大,信度系数也就越高
2)测验的长度:
测验越长,信度值越高
3)测验的难度:
与难度没有直接对应的关系,但是当测验难度水平可以使测验分数分布范围最大时,测验的信度才会提高,通常这个难度水平是0.5。
4、内容效度:
内容效度是指一个测验对欲测的内容或行为范围取样的适当程度,又称为逻辑效度。
内容效度与表面效度的区别:
w表面效度(surfacevalidity)是指测验看起来所要测量的东西,是被试或外行看来是有效的测验.
w表面效度与内容效度并不总是一致的.
w表面效度能间接影响测验的效度,所以测验编制时也要适当关注表面效度.
5、效标关联效度(criterionrelatedvalidity):
效标关联效度,又称实证效度,是指一个测验对处于特定情境中的个体的行为进行估计的有效性。
根据收集效标的时间,可以将效标效度分为预测效度和同时效度。
(一)同时效度(concurrentvalidity)概念:
是一种测验的结果与另一大约同时获得的测验结果(即效标)之间的一致程度。
(二)预测效度概念:
测效度是指测验结果(如分数)对未来的行为或测验成绩(效标)能够准确预测的程度。
预测效度与同时效度的区别:
w1)从进行本测验到获得效标的间隔时间不同。
w2)目的和作用不同。
同时效度主要用来查明自编测验的效度;预测效度主要用来评价本测验的预测能力。
第四章分数的合成与解释
1、标准分数
1.线性转换的标准分数
Z分数具有的性质:
(1)Z分数属于等距量表,可作一般代数运算;
(2)Z分数的绝对值表示某一原始分数与平均数的距离,Z分数的正负号则表示原始分数是落在平均数之上还是平均数之下;
(3)Z分数的分布形状与原始分数相同,原始分数所能进行的计算,Z分数也能进行,并且结果没有丝毫失真;
(4)假如原始分数的分布是常态的,则Z分数的范围大致是从-3到+3。
2.常态化的标准分数
先把原始分数转化为百分等级,然后从正态曲线面积表中查得对应的标准分数。
由此种方式所得到的分数就叫常态化的标准分数。
将分数常态化的前提:
只有所测特质的分数在实际上应该是常态分布,只是由于测验本身的缺陷或取样误差而使分布稍有偏斜时,才能转换为常态化标准分数。
(1)T分数T=50+10Z
(2)标准九(标准化九级分制)
将常态曲线下的横轴分为9段,最高段为9分,最低段为1分,除两端以外,每段有半个标准差宽。
Ø几种分数的平均数和标准差
名称
Z分数
Z’分数
T分数
标准九
标准十
标准二十
平均数
0
0
50
5
5
10
标准差
1
1
10
2
1.5
3
(3)离差智商
将一个人的测验分数与同年龄组的人比较所得到的标准分数。
优点:
同样的智商分数在任何年龄水平上都代表同样的相对位置,可以相互比较。
韦氏离差智商:
是表示在以100为平均数、15为标准差量表上的分数,即IQD=100+15Z
第五章心理测验的使用
1、测验前的准备
1)预告测验2)主试自身的准备3)测验材料的准备4)测试环境的准备
2、施测时主试不应该做哪些反应?
1)对被试的反应给予及时而清楚、详细的记录,特别是对口试和操作测验,此点尤其重要,必要时可录音和录像。
对于测验的环境及测验时的一些突发事件,主试应该给予详细记录,以供解释时参考。
2)主试应当熟练掌握计分键,特别是非客观题的积分要求,不得随意计分。
标准化测验在手册中都有关于计分原则和方法的说明。
作为主试,应该以客观、公正的态度严格依据计分键或评分标准计分。
3)在施测的过程中,对于被试的反应,主试不应作出点头、皱眉、摇头等暗示性的反应,这会影响被试以后的测验,主试应时刻保持和蔼、微笑的态度。
另外,在个别施测时,主试不应让被试看见计分,可用纸板等物品挡着。
这样做一直是避免影响被试的测验情绪,二是避免分散被试的注意力。
第六章智能测验
1、比奈和智力年龄
也叫智力年龄,是比奈首先使用的,由于儿童的智力是与年龄同时发展起来的,所以用心理年龄来表示智力的程度。
4岁及4岁以上的心理年龄计算方法:
先算基底年龄,再计算基底年龄以后的各年龄中正确回答问题的总数,并乘以2作为月数,与基底年龄相加,即得心理年龄。
从1岁到未满4岁的心理年龄计算方法:
与4岁以上相同,但由于在这些年龄级中,各年龄级配置了12个问题,所以每个问题相当于1个月。
在将合格问题换算成月数时,不必加倍。
实足年龄:
智商(IQ):
智商(IQ)=[心理年龄(MA)/实足年龄(CA)]×100
智商是以智力与年龄同时直线地发展为前提。
2、韦氏量表以100为平均数,15为标准差
韦氏成人智力量表(WAIS):
有11个分测验,分别为:
常识、数字广度、词汇、算术、理解、类同、填图、图片排列、积木图案、物体拼凑
韦氏儿童智力量表(WISC):
有12个分测验,5个言语测验,5个操作测验,此外还有数字广度测验和迷津测验(属于操作测验,测量知觉的速度和准确性)作为备用测验
韦氏学龄前和学龄初期儿童智力量表(WPPSi)
3、陆军甲种测验(欧提斯)是第一个团体智力测验
4、瑞文标准推理测验(SPM):
非言语智力测试。
包括60道题,分为5组,每组12题
5、图画—词汇测验(邓恩,1959):
适用于2岁半到成年的被试
6、格塞尔发展量表:
最早的婴儿量表,该量表主要诊断:
动作能、应物能、语言能、应人能4个方面的能力
格塞尔是婴幼儿量表的创始人
7、丹佛发展筛选测验(DDST):
筛选性测验,真是筛选出可能的智商落后者
8、新生儿行为评定表(NBAS):
适用年龄最小(出生第一天到满月为止)的婴儿使用行为量表
9、贝利婴儿发展量表(BSID):
最好的婴儿测验
第七章人格测验
1、人格测验的编制方法:
合理构建法、经验标准法、)因素分析法、综合技术
2、明尼苏达多相人格问卷(MMPI):
有399,566道题两种。
566题有24个量表(10个临床量表,10个附加量表,4效度量表)。
399题有14个量表(10个临床量表,4效度量表)
效度量表有:
说谎量表、诈病量表、校正量表、疑问量表(30个以上题目为无回答,则此卷无效)
3、罗夏墨迹测验:
属于投射测验,以10张图为测验材料(5张为黑白图片,3张为彩色图片,2张为黑白照片+红色斑点)
测验的实施过程:
自由反应阶段、提问阶段、类比阶段、极限试探阶段
记分及解释:
计分包括以下几个方面:
1)反应区位:
即被试对整个墨迹图的反应着重在哪个部位,是注重整体还是某一个局部。
包括以下:
W(整体反应)D(普通大部分反应)d(普通小部分)Dd(异常部分反应)
2)反应决定因子:
指被试反应时的主要依据,墨迹的什么因素(形状、颜色、浓淡等)决定了被试的反应。
包括:
F(形状)M(动作)C(色彩)K(阴影、浓淡)
大范围
小范围
名称
定义
形态反应
F
F
纯粹形状
仅以墨迹的形态特性作为决定因子的反应
运动反应
M
M
FM
m,CM
人的运动
动物的运动
非生物的运动
对人或类似于人的东西的运动、表情、姿势等进行反应;
看到动物的动作形态;
包括所有物理性运动,以及抽象的力和紧张。
浓淡(阴影)反应
材料表面反应
C
Fc
cF
c
分化材料
未分化材料
无形的未分化材料
在清楚开关的表面上,感觉到材料的质地。
如像毛皮覆盖着的动物;
形态不清楚的反应;
完全无视形态所作的反应。
立体反应
K
FK
KF
K
透视
扩散
无形扩散
对开关清楚的东西都有深度和立体感,如对风景的透视感和远近感;
像云烟那样,由阴影浓淡而产生的效果,在某种程度上也考虑了形状;
没有形状的雾和霞那样的扩散感觉
弱立体反应
k
k
弱立体
像X光相片和地势图那样的阴影反应,只是平面投影
色彩反应
黑白反应
C′
FC′
C′F
C′
形态黑白
黑白形态
纯粹黑白
清楚的形态,是黑白或灰色的形态
形态是暧昧的,或是黑白,或是白色,或是灰色
只说出黑白而没有形态
色彩反应
C
FC
CF
C
形态色彩
色彩形态
纯粹色彩
既有清楚的形态又有色彩,作为亚型记为F/C,以形状为主
形状是暧昧的,以色彩为主要因子,它的亚型为C/F
仅由色彩决定的反应,亚型有Cn(仅指出墨迹的色彩反应);Cdes(说明色彩性质的反应);Csym(象征性地解释色彩的反应)
3)反应的内容:
指被试回答的内容是什么。
包括:
H(人物)(H)A(A)SexAtBl
记号
意义
记号
意义
记号
意义
H
(H)
Hd
(Hd)
At
Sex
A
(A)
人
非现实的人
人的部分
非现实人的部分
人的解剖
性
动物
非现实的动物
Ad
(Ad)
Aobj
A,At
Pl
Na
Obj
Arch
动物的部分
非现实动物的部分
动物制品
动物解剖
植物
自然
物体
建筑物
Map
Lds
Art
Abst
Bl
Cl
Fire
Expl
地图
风景
艺术
抽象
血液
云、烟
火
爆发
4)反应的创意性:
指反应是一般人常有的还是特殊的。
包括:
P(普通性)O(特殊性)
4、其他量表,不做严格要求,了解就好,解释方法要理解。
1)卡特尔16种人格因素问卷(16PF):
可用计算机或模板记分,得到原始分后需要转化为标准拾分,并绘制出人格轮廓图。
适用对象:
16岁以上的青年和成人
主要功能:
对个体的人格因素作出分析,从16个方面描述个体的人格特征。
16PF总共有187题,各因素题目按顺序轮流排列,且尽量采用中性题目。
2)艾森克人格问卷(EPQ):
由E量表(内外倾性)、N量表(情绪性)、P量表(精神质)、L量表(掩饰性)组成。
计算时,先计算L量表,大于5.5时,则量表不可信
适用对象:
成人问卷适用于16岁以上的成人,儿童问卷适用于7至15岁的儿童
3)爱德华个性偏好量表(EPPS):
以莫瑞的人类需要理论作为编制的理论基础,采用强迫选择法来编制问卷
4)加州心理问卷(CPI):
以MMPI为基础编制,MMPI主要服务于临床精神病领域,而CPI则更着重对正常人格的测查
5)詹金斯活动性调查表(JAS):
主要是为了评价A型行为(有3个因素:
S–速度和性急因素,J–对工作献身的因素,H–刻苦和竞争的因素)。
JAS有4个量表:
A型量表(21个项目)、S量表(21个项目)、J量表(24个项目)、H量表(20个项目),4个量表各有3个分数:
原始分,标准得分,百分位分数,最后结果用百分位数表示。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测量复习提纲11 测量 复习 提纲 11