现代心理与教育统计学 笔记.docx
- 文档编号:16098822
- 上传时间:2023-07-10
- 格式:DOCX
- 页数:21
- 大小:316.81KB
现代心理与教育统计学 笔记.docx
《现代心理与教育统计学 笔记.docx》由会员分享,可在线阅读,更多相关《现代心理与教育统计学 笔记.docx(21页珍藏版)》请在冰点文库上搜索。
现代心理与教育统计学笔记
现代心理与教育统计学笔记(总9页)
概念
(1)随机变量:
在统计学上把取值之前,不能准确预料取到什么值的变量,称
为随机变量。
(2)总体:
总体(population)又称为母全体或全域,是具有某种特征的一类
事物的总体,是研究对象的全体。
(3)样本:
样本是从总体中抽取的一部分个体。
(4)个体:
构成总体的每个基本单元。
(5)次数:
是指某一事件在某一类别中出现的数目,又称作频数,用f表示。
(6)频率:
又称相对次数,即某一事件发生的次数除以总的事件数目,通常用
比例或百分数来表示。
(7)概率:
概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定
义。
随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记
为P(A)。
(8)统计量:
样本的特征值叫做统计量,又称作特征值。
(9)参数:
又称总体参数,是描述一个总体情况的统计指标。
(10)观测值:
随机变量的取值,一个随机变量可以有多个观测值。
2何谓心理与教育统计学学习它有何意义
答:
(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整
理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传
递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就
是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并
将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、
推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关
系。
要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
统计学
正是提供了这样一种科学方法。
统计方法是从事科学研究的一种必不可少的工
具。
②心理与教育统计学是心理与教育科研定量分析的重要工具。
凡是客观存在事物,都有数量的表现。
凡是有数量表现的事物,都可以进行测量。
心理与教育现象是一种客观存在的事物,它也有数量的表现。
虽然心理与教育测
量具有多变性而且旨起它发生变化的因素很多,难以准确测量。
但是它毕竟还是
可以测量的。
因此,在进行心理与教育科学研究时,在一定条件下,是可以对心
理与教育现象进行定量分析的。
心理与教育统计就是对心理与教育问题进行定量
分析的重要的科学工具。
③广大心理与教育工作者学习心理与教育统计学的具体意义。
a.可经顺利阅读国内外先进的研究成果。
b.可以提高心理与教育工作的科学性和效率。
c.为学习心理与教育测量和评价打下基础。
3.先用统计方法有哪几个步骤
答:
一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分
析。
只有做到对数据分析正确,才能对统计方法做出正确地选用。
选用统计方法
可以分为以下步骤:
(1)首先,要分析一下实验数据是否合理,即所或得的数据是否适合用统计方
法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义
没有了解,将一些不着边际的数据加以统计处理是毫无意义的。
(2)其次,要分析实验数据的类型。
不同数据类型所使用的统计方法有很大差
别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。
(3)第三,要分析数据的分布规律,如总体方差的情况,确定其是否满足所选
用的统计方法的前提条件。
4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量
答:
(1)在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变
量。
(2)心理与教育科学实验所获得的数据属于随机变量。
心理与教育科学研究数
据具有随机性和变异性。
科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象。
在
心理和教育科学领域,研究获得的数据资料也具有一定随机性质。
观测数据的这
种特点,称为变异性。
即便使用同一种测量工具,观测同一事物,只要是进行多
次,那么获得的数据就不会完全相同。
随着测量工具的完善和精确,数据的这种
随机性变化就更明显。
例如,人们对同一年级或同一年龄儿童甚至对同一个人进
行同一学科的学业测试,或对同一个心理特点进行评量、观察多次,得到的数据
绝不会全然相同,这些数据总是在一定的范围内变化。
造成数据变异的原因,出
自观测过程中一些偶然的不可控制的因素,称随机因素。
随机因素使测量产生的
误差称作随机误差。
由于这种随机误差的存在,使得在相同条件下观测的结果常
常不止一个,并且事前无法确定,这是客观世界存在的一种普遍现象,人们称这
类现象为随机现象。
在教育和心理科学的各类研究中,研究的对象是人的内在的
种种心理现象,不仅由客观上一些偶然因素会引起测量误差,由实验者和被试主
观上一些不可控制的偶然因素也会造成测量误差,这些偶然因素+分复杂,因而
造成的随机误差就更大,也就是使心理与教育科学研究中得到的数据具有更明显
的变异性。
5。
怎样理解总体、样本与个体。
答:
根据其各自的定义,我们可以用下面这个图来表示。
大圆表示研究对象的全
体,也就是总体;大圆中的小圆表示其中一个样本,大圆中所有的点代表的是样
本。
6、统计量与参数之间有何区别和关系。
答:
(1)参数是描述总体情况的统计指标;样本的特征值称作统计量。
(2)区别:
1参数是从总体中计算得到的量数,代表总体特征,一个常数。
统计
量是从一个样本中计算得到的量数,它描述一组数据的情况,是一个变量,随样
本的变化而变化。
2参数常用希腊字母表示,样本统计量用英文字母表示。
(3)联系:
1参数通常是通过样本特征值来预测得到,(7、答案略)
8、下述一些数据,哪些是测量数据哪些是计数数据其数值意味什么
(1)17.0千克
(2)89.85厘米(3)199.2秒(4)17人(5)25本(6)93.5
答:
上面的数据中测量数据有:
(1)千克
(2)89.85厘米(3)199.2秒(6)
93.5分
计数数据有:
(4)17人(5)25本
(2)17.0千克、89.85厘米、199.2秒、93.5
分,
这些数据是借助一定的重量、长度、时间或一定的测量标准而获得数据,分别代
表事物的重量、长度、时间或者分数。
9符号代表的意义(课本20页)
(1)总体平均数,期望值
(2)样本平均数(3)总体之间的相关系数(4)样本间的相关系数(
5)总体标准差(6)样本标准差(7)总体间的回归系数(8)有限个体数目的总体(9)样本容量,样本大小
1.统计分组应注意哪些问题
答:
进行统计分组时需要注意下列问题:
(1)分组要以被研究对象的本质特性为基础
面对大量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要
选择与被研究现象的本质的关的特性为依据,才能确保分类或分组的正确。
在心
理与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要的作用。
例如在学业成绩研究中按学科性质分类,在整理智力测验结果时,按言语智力、
操作智力和总的智力分数分类等。
(2)分类标志要明确,要能包括所有的数据
对数据进行分组时,所依据的特性称为分组或分类的标志。
整理数据时,分组标
志要明确并在整理数据的过程中前后一致。
这就是说,关于被研究现象本质特性
的概念要明确,不能既是这个又是那个。
另外,所依据的标志必须能将全部数据
包括进去,不能有遗漏,也不能中途改变。
2、直条图或叫条形图:
主要用于表示离散型数据资料,即计数资料。
详见课本
45页。
3、圆形图或叫饼图:
主要用于描述间断性资料,目的是为显示多部分在整体中
所占的比重大小,以及各部分之间的比较。
1.心理统计方法:
统计学的原理和数学的方法在心理学领域中的运用。
2.心理统计方法包括描述统计和推理统计两大部分。
3.实验数据可分为两类:
准确数和近似值。
4.确定组距以后,要考虑最小的一组从哪开始。
显然,最小的一组应包含整个
系列中的最小数值。
5.在心理实验中常用的表格有三类:
原始数据登记表,经过分组整理的次数分
布表,带有对实验结果总结性质的表
6.表示实验结果的图有:
平面图和立体图。
7.平面图一般分为:
曲线图和直方图两类。
8.平面图有两个坐标,横坐标代表心理实验中的刺激变量或自变量,纵坐标代
表反应变量或因变量。
当横坐标代表的数量是连续的,可画曲线图或直方图;
当横坐标代表的数量不是连续的变量,而是不同类别时,就只能画直方图,其纵
坐标必须从0开始。
9.累加次数分布图的横坐标是各组数据的上限。
10.平均数指的是算术平均数。
11.众数是最明显的集中趋势指标,但众数不如平均数和中数稳定。
12.分组不适合会出现双峰,可调整组距。
真正的双峰出现的原因是_有两种性
质不同的数据_。
13.在偏斜的分布中,平均数总是处于偏斜的一端,而中数则永远把一个分布曲
线下的面积分成相等的两部分。
14.q2-q1
q3-q2时,分布向_左(哪方大则朝哪方偏斜)偏斜。
15.表示两个变量之间相关性质和程度的图,叫散布图。
如果图中所有的点形成
一条直线,说明是一个完全正相关的散布图;如果是椭圆,这个椭圆越窄,说明
相关程度越_高_____。
16.从样本估计总体是以概率原则为基础的,如果样本中只包括随机误差就不致
产生对总体偏性的估计;如果样本中还包括系统误差在内,就会产生偏性估计。
17.当一个总体中的成分只分成两类时,根据传统,把_希望得到的结果,发生
的概率叫P;不希望得到的结果发生的概率叫q。
18.在一系列正态分布中,有一个标准的正态分布,其平均数为_0,标准差为_1
19.当实验数据有___二组____以上时,而且都是__不连续_____的变量时,要检
验各组间的差异是否显著就需要用c2分布进行计算。
20.统计结果检验时:
1)w2为0.14_时,实验效果较强,统计结果可信。
2)w2为0.16_时,实验效果中等,统计结果可信度一般。
3)w2为0.01_时,实验效果很差,统计结果不可信。
21.用d值说明实验效果时:
1)d是时,实验效果较小;2)d;是时,效果中等;3)d>>0.8_时,效果较大。
概念
1.描述统计:
是对成组数据概括的描述。
描述统计的指标有三类:
数据的集中
趋势,数据的离中趋势,数据间的相关。
2.推论统计:
方法包括从样本的数量特性推测总体数量特性的一系列问题:
推
论假设,推论的各种方法和步骤,以及检验推测可靠性的各种方法。
3.组距:
每一组上限和下限的差。
(组距习上常用2,3,5,10,20
4.中点:
在某一组的下限和上限当中的那一点。
5.集中趋势:
是代表一系列数据的典型水平的数字指标,代表集中趋势的指标
有平均数,中数和众数。
6.平均数(x):
是一组数据总和的平均值。
7.中数(mdn):
一系列按大小顺序排列的数据中的一个点,在这个系列中有一
半数据在这个点以上,有一半数据在这个点以下。
8.众数(mo):
在一系列数据中出现次数最多的那个数。
9.全距:
一个分布中最大的数值的上限减去最小数值的下限,就得到全距。
(全
距大,说明这组数据分散;全距小,则较集中。
使用时注意:
1、无极端值;2,
比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才能使
用)
10.离中趋势:
是表示一组数据分散程度的指标,常用的指标有:
全距,四分
差,平均差和标准差。
(如果离中趋势很小,说明数据分布都在平均数附近变动,
因此平均数的代表性很大;如果离中趋势太大,说明数据分布太分散)
11.四分差(q):
是数据的离中趋势的指标之一,四分差说明按大小顺序排列
的一系列数据中间50%个数据的分散程度。
(如果一个分布中间部分的数据比较
集中,则两个四分点q3与q1就离得近些,a的值就小些。
)
12.百分点:
某次数分布中处于某百分等级的数值。
13.百分等级:
某数值在某次数分布中所处的位置。
14.平均差(ad):
一个分布中每个变量和平均数的差的绝对值的平均值。
15.标准差:
s2开方后的正值就叫标准差,是数据的离中趋势的指标之一。
16.离中系数(CV):
用相对量来表示数据分散程度的数字指标。
17.相关程度:
指相关是否密切,可分为无相关;部分相关;完全相关。
18.相关:
是描述两种数量关系的一个指标,如果一个变量随另一个变量的增
加(减小)而增加(减小),则两个变量之间存在着相关。
19.z分数(标准分数):
是以标准差为单位所表示的原始分数(x)与平均数
的偏离,也可以说是一个以标准差为单位来表示的偏离分数。
20.总体;某类事物的全部称为总体。
21.样本:
从全部抽出的部分叫样本。
22.推论统计:
从局部推测全部,从样本推测总体的统计程序。
23.随机抽选样本:
指总体中每个成分都有同等的机会被抽选。
24.分层抽样:
用分层抽样的方法,必须对总体有一定的了解,事先对于影响
所研究问题的诸因素做适当安排。
25.样本分布:
从很多个样本中算出的很多个平均数的次数分配叫样本分布。
26.正态分布:
是一个中间高,两侧逐渐下降,两端永远不与横轴相交,两侧
完全对称的钟形曲线。
27.平均数的标准误(sx):
为了和单个样本的标准差有所区别,把样本分布的标准差称做平均数的标准误。
28.自由度(df):
能够独立变化的数据的数目。
29.平均数差的标准误(sxd):
分别从两个总体中抽取出的多个样本平均数的
差(xd)的分布,这个分布的标准差叫做平均数差的标准误。
30.虚无假设(ha):
除概率以外不加任何其它假定,即假设二总体的平均数差异为O
31.备则假设(ha):
假设两个总体平均数之间差异中除了抽样误差外,还包括
有两个总体平均数之间的差异,即备则假设是个总体平均数之间差异不为O
32.显著性生水平(P):
我们所选择的推翻虚无假设的概率叫做检验的显著性水平。
33.第一类错误:
当虚无假设不应推翻时而被推翻了,这意味着把样本的平均
数差别认为是代表了总体平均数的差异。
34.第二类错误:
当应该推翻虚无假设时而不推翻,这意味着把样本的平均数
差别是代表总体平均数的差别这一事实给否认了。
35.显著性检验:
通过样本平均数的差别来推论总体平均数是否真正存在差别,
并确定存在何种水平。
36.回归:
当两种变量间存在着一定程度的相关时,一种变量有向另一种变量
的平均数趋近的现象,这种现象叫回归。
37.回归方程式:
从一变量的数值预测另一变量的相应数值的直线方程式,当
两个变量部分相关时,有两个回归方程式。
38.回归系数(byx):
由x变量预测Y变量的回归方程式的斜率。
检验:
是实际观察次数与假设次数偏离程度的指标。
40.方差分析:
根据组间和组内方差的比值,来比较两组或多组数据的差异是否达到显著。
41.组间变异:
在两组之间所产生的因变量的变异,就是系统变异,也就是由自变量引起的变异。
因为这种变异发生在两组之间,所以又叫组间变异。
42.组内变异:
同一组内的因变量的变异,就不是由于自变量的情况不同引起的,而只是由于未加控制的变量引起的。
因为这种变异发生在同一组内,所以叫做组内变异。
43.组间设计:
每个被试只参加1个水平的实验
44.组内实际:
每个被试参加所有水平的实验。
45.主效应:
自变量所引起的平均数差异
46.交互作用:
一个自变量对反应变量的影响因另一个自变量的变化而发生
1,伽利略提出了概率论的基本理论;法国数学家帕斯卡和费马创立了概率论,未统计学的
发展奠定了重要基础;贝奴里定理的产生,为发现正态概率分布创造了条件;棣莫弗推导出
“正态曲线方程”;皮尔逊发表了频率曲线理论和积差相关;斯皮尔曼提出等级相关;肯德
尔W系数和U系数;格赛特T分布理论;费舍是推论统计真正的创始者,最先提出F分布
理论,使方差分析系统化;凯特勒他将统计方法应用于教育学和社会学的研究;斯内德克提
出方差分析;克一瓦氏H检验是一种非参数方差分析方法,它与参数方法中的完全随机资料
方差分析相对应;费里德曼双向等级方差分析可解决随机区组实验设计的非参数检验问题
2:
从数据的观测方法和来源划分,研究数据可分为计数数据和测量数据两大类;根据数据
反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型;按
照数据是否具有连续性,把数据分为离散数据和连续数据
3:
统计表的儿个组成要素:
表号、名称、标目、数字、表注。
4:
统计图的组成部分:
图号及图题、图目、图尺、图形、图例、图注
5:
次数分布显示初步整理后一组数据的分布情况主要表示数据在各个分组区问内的散
布情况,可分为简单次数分布、分组次数分布、相对次数分布、累计次数分布。
6:
常用的次数分布图有直方图、次数多边形图及累加次数分布图。
7:
其它常用的统计图的类别:
直方图、条形图、圆形图、线形图、散点图:
条形图又分为简单条形图、分组条形图、分段条形图
8:
其它常用统计表类型:
简单表、分组表、复合表
9:
用来描述数据集中趋势和离中趋势的统计量分别称为集中量数和差异量数。
10:
集中量数包括:
算数平均数、中数、众数、加权平均数、儿何平均数、调和平均数等。
12:
平均数的优缺点:
优点:
反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动的影响;缺点:
易受极端数据的影响、若出现模糊不清的数据时,无法计算平均数。
13:
计算和应用平均数的原则:
同质性原则、平均数与个体数值相结合的原则、平均数与标准差、发差相结合的原则
14:
差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。
15:
差异量数有:
全距、四分位差、白一分位差、平均差、标准差与方差
16:
相关类别为:
正相关、负相关、零相关
17:
质量相关分为:
点二列相关、二列相关及多系列相关
18:
品质相关:
主要分为四分相关、C相关、列联表相关
19:
概率:
是表明随机事件出现可能性大小的客观指标就是概率,概率的定义有两种即后验概率和先验概率
20:
概率分布类型:
160页离散分布与连续分布、经验分布与理论分布、基本随机变量分布与抽样分布
21“概率分布:
是指对随机变量取值的概率分布情况用数学方法(函数)进行描述
22:
连续分布:
是指连续随机变量的概率分布,即测量数据的概率分布,它用连续随机变量的分布函数描述它的分布规律
23:
离散分布:
离散随机变量的分布又称作离散分布
24:
经验分布:
是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布
25:
理论分布:
一是随机变量概率分布的函数一数学模型,二是按某种数学模型计算出的总体的次数分布
26:
抽样分布:
是样本统计量的理论分布,样本统计量有:
平均数、两平均数之差、方差、标准差、相关系数、回归系数、白一分比率等。
27:
正态分布:
也称常态分布或常态分配,是连续随机变量概率分布的一种,正态分布NC0,1)称为标准正态分布,它的平均值是0,标准差是1.
28:
二项分布:
是指试验仅有两种不同性质结果的概率分布,具体定义是:
设有N次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是P,某事件不出现的概率都
是q(等于1-P)。
则对于某事件出现X次(0,1,2,0on)的概率分布为为
29:
除了标准正态Z分布外,儿种常见的抽样分布包括X的平方分布,T分布,F分布。
30:
点估计:
是用样本统计量来估计总体参数,因为样本统计量为数值上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。
31:
良好估计量的特性:
无偏性、有效性、一致性、充分性犯:
区问估计:
就是根据估量值以一定可靠程度推断总体参数所在的区问范围,它是用数轴上的一段距离表示未知参数可能落入的范围,他虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区问的概率有多大
33:
置信区问:
也称置信问距,是指在某一置信度时,总体参数所在的区域距离或区域长度。
置信区问的上下两端点值称为置信界限。
34:
显著性水平是指估计总体参数落在某一区问时,可能犯错误的概率,用符号a表示
35:
假设检验:
通过样本统计量得出的差异做出一般性结论,判断总体参数之问是否存在差
异,这种推论过程称作假设检验,它的基本任务就是事先对总体参数或总体分布形态做出一
个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接收原假设。
假设检验包
括“参数检验”和“非参数检验”。
36:
参数假设检验:
若进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验;非参数假设检验:
若对总体分布形式
37:
方差分析:
主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的白变量是否对因变量有重要影响
38:
方差分析的基本原理:
综合虚无假设和部分虚无假设、方差的可分解性
39:
平方和:
指观测数据与平均数离差的平方总和
40:
总变异被分解为“组问变异”和“组内变异"
41:
组问变异:
主要指由于接受不同的2而造成的各组之问的变异,可以用两个平均数之问的差异表示
42:
组内变异:
是由组内各被试因变量的差异范围决定的,主要指由实验误差、或组内被试之问的差异造成的变异。
43:
发差分析的基本假定:
总体正态分布、变异的相互独立性、各实验处理内的方差要一致
44:
组内设计:
又称被试内设计,是指每个被试都要接受所有白变量水平的实验处理
45:
完全随机设计的方差分析:
就是对单因素组问设计的方差分析,在这种实验研究设计中,各种处理的分类仅以单个实验变量为基础,因而把它称为单因素方差分析或单向方差分析
46:
随机区组设计的方差分析:
根据被试特点把被试划分为儿个区组,再根据实验变量的水平数在每一个区组内划分为若干个小区,同一区组随机接收不同的处理。
这类实验设计的原则是同一区组内的被试应尽量同质
47:
试比较完全随机设计与随机区组设计的优、缺点随机区组设计由于同一区组接受所有实验处理,使实验处理之问有相关组设计,或称被试内设计。
与完全随机设计相比,其最大优点是考虑到个别差异的影响。
这种由于被试之问性质不同导致产生的差异就称为区组效应。
随机区组设计可以将这种影响从组内变异中分离出来,从而提高效率。
但是这种设计也有不足,主要表现为划分区组困难,如果不能保证同一区组内尽量同质,则有出现更大误差的可能。
48:
当整个实验中的个体差异知道后,就可以算出个体差异造成的变异,即区组变异。
这时总平方和被分解为三部分:
被试问平方和、区组平方和、误差项平方和
49:
X平方检验的具体方法((leibieb类别):
配合度检验、独立性检验、同质性检验、以及数据的合并与相关源的分析方法
50:
非参数统计方法:
秩和检验法、中数检验法、符号检验法、等级方差分析
51:
非参数检验的概念:
指非参数模型、在非参数统计中面临的问题也与参数统计中不同、在非参数统计中使用的统计量与参数中使用的统计量也不同
52:
非参数检验的特点:
它一般不需要严格的前提假设、非参数检验特别适用于顺序资料(等级
变量)、非参数检验很适用于小样本,且方法简单、非参数方法最大的不足是未能充分利用
资料的全部信息、非参数方法目前还不能处理“交互作用”
53:
回归分析:
这种用一定模型来表述变量相关关系的方法就称为回归分析
54:
线性回归:
对于这种线性关系的回归分析叫做线性回归;只有一个白变量的线性回归称作简单线性回归
55:
回归分析与相关分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代心理与教育统计学 笔记 现代 心理 教育 统计学