1、统计学复习整理1、一组数据中出现次数最多的变量值,称为众数(mode),用M0表示。2、一组数据排序后,处于中间位置的变量值,称为中位数(median),用Me表示。3、一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分点。4、一组数据相加后除以数据的个数而得的结果,称为均值(mean),也称平均值。5、各变量值倒数的平均倒数,称为调和平均数(harmonic mean),它是均值的另一种表现形式, 用Hm表示。6、n个变量值乘积n次方根,称为几何平均数(geometric mean)。7、非众数组的频数占总频数的比率,称为异众比率(variation ratio),用Vr表示
2、。8、上四分位数与下四分位数之差,称为四分位差(quartile deviation),也称为内距或四分间距(inter-quartile range),用Qd表示。9、一组数据的最大值与最小值之差,称为极差(range),也称全距,用R表示。10、各变量值与其均值离差绝对值(之和)的平均数,称为平均差(mean deviation),也称平均离差,用Md表示。11、各变量值与其均值离差平方和的平均数,称为方差(variance)。12、方差的平方根,称为标准差(standard deviation)。13、变量值与其平均数的离差除以标准差后的值,称为标准分数(standard score)
3、,也称标准化值或 z 分数。14、一组数据的标准差与其相应的均值之比,称为离散系数(coefficient of variation),也称变异系数。15、数据分布的不对称,成为偏态(skewness)16、对数据分布不对称性的度量值,称为偏态系数。17、数据分布的平峰或尖蜂程度,成为蜂态(kurtosis)。18、对数据分布峰态的度量值,称为峰态系数。19、抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并根据样本数据所提供的信息来推断总体的数量特征。20、从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中,这样的抽样
4、方式称为简单随机抽样,也称纯随机抽样。21、从总体中抽取一个元素后,把这个元素放回总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。22、一个元素后被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为不重复抽样。23、用来估计总体参数的统计量的具体数值,称为估计量,用符号表示。24、用来估计总体参数时计算出来的估计量的具体数值,称为估计值25、用样本估计量的值直接作为总体参数的估计值,称为参数的点估计。26、在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计值。27、估计量抽样分布的数学期望等于被估计的总体参数
5、。设总体参数为,所选择的估计量为,如果E()=,称为的无偏估计28、对同一总体参数的两个无偏估计量1和2,若D(1)D(2),称1是比2更有效的估计量。29、随着样本容量的增大,点估计量的值越来越接近总体的参数30、由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。31、如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平或置信系数。32、对总体参数的数值所作的陈述,称为统计假设(hypothesis)33、对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验(hy
6、pothesis testing)。34、通常将研究者想收集证据予以支持的假设称为备(选)择假设(alternativel hypothesis),记作 H或 H1 。35、通常将研究者想收集证据予以反对的假设称为原假设(null hypothesis),或零假设,用H0表示。36、能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。37、根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。38、众数:未分组数据的众数:就是次数最多的那个值分组数据的众数:中位数:未分组数据 分组数据的中位数:四分位数:未分组:分组:均值:调和平均数几何平均数异众比率四位分差平均差总体方差与标准差样本方差与标准差标准分数(值-平均值 / 标准差)离散系数偏态与峰度