统计科研的一些总结.docx
- 文档编号:6351588
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:12
- 大小:22.95KB
统计科研的一些总结.docx
《统计科研的一些总结.docx》由会员分享,可在线阅读,更多相关《统计科研的一些总结.docx(12页珍藏版)》请在冰点文库上搜索。
统计科研的一些总结
统计、科研的一些总结
统计、科研的一些总结
一
(1)统计学是关于数据收集、整理、分析、表达和解释的普遍原理与方法的一门科学。
(2)随机事件:
随机现象每一个可能的结果,简称事件,常用字母A,B,C,表示。
(3)概率:
是随机事件发生可能性大小的客观度量指标,随机事件A的概率记为P(A)。
(4)正态曲线下面积的分布规律:
X轴上与正态曲线下所夹面积恒等于1,即正态曲线下面积恒等于1。
(5)χ2分布是一种连续型分布。
(6)连续型随机变量最基本和常用的分布:
正态分布
二
(1)选择样本的两个方法:
概率抽样和非概率抽样
(2)概率抽样的方法:
等概率抽样、非等概率抽样(3)误差:
系统误差、随机误差。
(4)设计:
专业设计、统计设计
(5)统计表可分为简单表、复合表(组合表)(6)自然界的现象可分为两种:
必然现象、随机现象(7)随机变量可分为:
离散型随机变量、连续型随机变量。
(8)离散型概率分布:
二项分布、Poisson分布(9)数据的分布形状:
对称分布和偏态分布。
(10)假设检验的两类错误:
①原假设为真而被拒绝的错误称为第一类错误,也称I类错误,犯I类错误的概率记作α。
②原假设为不真而被接受的错误称为第二类错误,也称II类错误,犯II类错误的概率记作β。
三
(1)资料的三个类型:
计量资料、计数资料和等级资料。
(2)统计表的三个制表原则
①重点突出,一张表一般只表达一个中心内容。
②统计表如同完整的一句话,要有描述的对象和内容。
③统计表应简单明了,一切文字、数字和线条都尽量从简。
(3)医学科研设计:
调查设计、实验设计、临床实验设计(4)连续型概率分布:
正态分布、t分布、F分布(5)样本率的分布有以下三个特点:
①总体率π相同时,样本量越大,样本率的分布越趋向对称。
②样本量n相同时,π偏离0.5,样本率的分布呈偏态分布。
③总体率π=0.5时,样本率呈对称分布。
(6)假设检验三个基本步骤:
①建立假设与确定检验水准(α)②确定检验方法,计算统计量③确定P值作出推断结论(7)实验研究三个基本组成部分:
处理因素、研究对象和实验效应。
(8)实验设计的基本原则:
对照原则、随机原则和重复原则。
(9)实验性研究中对照组设置必须具备3个条件:
①对等:
除研究因素外,对照组(实验对象)具备与实验组(实验对象)对等的一切因素。
②同步:
设立的对照组与实验组在整个研究进程中始终处于同一空间和同一时间。
③专设:
任何一个对照组都是为相应的实验专门设立的。
(10)描述集中趋势的主要统计指标有:
算数均数、几何均数和中位数。
四
(1)医学统计工作的四个基本步骤:
①统计设计:
包括调查、实验设计。
②收集资料:
取得准确可靠的原始资料③整理资料:
对资料进行清理、改错,数量化④分析资料:
统计描述、统计推断
(2)科研选题的四个原则:
①创新性:
包括探索和创新两个连续的过程,创新就是选择前人没有解决或没有完全解决的问题。
是本学科的空白点,或者将会在理论上或应用上有新的发展和补充。
②科学性:
以科学理论为指导,符合客观规律。
③先进性:
先进性是相对的,有国际先进和国内先进。
更重要的是结合实际条件选择适合的先进技术。
④可行性:
研究课题的主要技术指标实现的可能性。
它包括人、财、物的支持和工作基础。
(3)等概率抽样:
简单随机抽样、系统抽样、分层抽样、整群抽样。
(4)文献检索的几种查法:
①先查国内文献,再查国外文献②先查综述性文章,后原始文章③先近期后远期
④先核心期刊后一般期刊。
(5)计量资料频数表的编制步骤
①求极差②决定组数和组距③列出组段④划记计数(6)频数分布表的用途
①揭示计量资料分布的特征②描述计量资料分布的集中趋势和离散趋势③便于发现可疑值。
④简化统计指标的计算
(7)四种基本抽样方法:
单纯随机抽样、系统抽样、分层抽样和整群抽样。
五
(1)文献检索的五个要点:
①有助于认识本课题的重要性②了解有关的既往研究工作情况③了解有关研究现状④寻找可借鉴的研究方法⑤注意有关的不同见解与争论。
(2)五个概率分布:
连续型概率分布:
正态分布、t分布、F分布
离散型概率分布:
二项分布、Poisson分布
(3)离散趋势的描述:
①全距②分位数区间③方差④标准差⑤变异系数(4)样本均数的分布有以下五个特点:
①各样本均数未必等于总体均数②各样本均数间存在差异
③样本均数的分布很有规律,围绕总体均数,呈现中间多,两边少,左右基本对称,近似服从正态分布
④样本均数的变异范围较原变量的变异范围缩小
⑤随着样本量的增大,样本均数的变异范围逐渐缩小
(5)常用的相对数指标:
比、比例、率、相对危险度(RR)和优势比(OR)
六
(1)选题六个方法:
①从招标范围中选题。
②从碰到的问题中选题③从文献的空白点选题④从已有的课题延伸中选题⑤从改变研究内容组合中选题
⑥从其他学科移植中选题。
(2)Wilcoxon符号秩检验的步骤:
①建立假设,确定检验水平②求差值③编秩④求秩和⑤确定统计量T
⑥确定P值,做出推断结论。
(3)医学研究的基本步骤:
①建立科学假说,提出拟探索和解决的医学问题以及明确而具体的目标②查阅文献,并对文献进行综述、评价
③拟定研究设计方案和技术路线,必要的信息及条件保障④实施研究计划
⑤收集、整理、分析研究所得信息和资料
⑥对研究结果进行解释,对提出的假说进行评价,并据此向更高更深的层次探索
七
(1)统计表的七个基本结构及要求
①标题:
统计表的标题要确切、简练,能够高度概括表的主要内容,应包括研究的时间、地点和研究内容,放在表的上方中央位置。
如果一篇文章当中有多个表,应在左侧加上表号。
如果整个表的指标统一,可将研究指标的单位标在标题后面。
②标目:
标目可分为横标目和纵标目,用以说明每行和每列数字的意义。
标目文字要精练、准确。
横标目是描述的对象,在表的左侧;纵标目是描述的内容,在表的右侧。
横标目和纵标目的位置不能颠倒,从左到右应构成一句完整的话。
③顶线④底线⑤纵标目下横线
统计表中的这三条基本线条,要从表的最左端画至表的最右端。
根据需要可由其他短的横线,如合计上方的横线、纵标目的总标目和纵标目之间的横线。
统计表中不允许出现斜线和竖线。
⑥数字:
统计表中的数字一律用阿拉伯数字表示,小数点位置对齐。
如无数字用“-”表示,缺失数字用“”表示,数值为0的要填写“0”,不能空白。
⑦注释:
统计表中数字区域不能插入文字,也不列备注项。
必须说明的内容用可以在表的下方说明。
(2)常用的七种统计图:
条图、百分条图、圆图、线图、半对数线图、箱图、散点图。
八计量资料的八个统计描述:
①算术均数,简称均数②几何均数③中位数
④极差(全距)
⑤四分位数间距⑥方差⑦标准差⑧变异系数
九
(1)假设检验九点主要内容①假设检验的概念②假设检验的基本步骤
③t检验(单样本、配对样本、两独立样本均数的t检验,正态性检验、方差齐性检验、t’检验)
④假设检验的两类错误⑤双侧检验与单侧检验
⑥假设检验的统计意义与实际意义⑦检验效能⑧多次重复检验问题
⑨假设检验的因果关系推论与实验设计
(2)统计图表种类:
统计表、统计图、条图、百分条图、圆图、线图、半对数线图、箱图、散点图
十
(1)关于临床科研方法设计的10点:
①抉择合理的设计方案
②研究对象的正确诊断③标本的来源与样本含量的估算
④试验措施要有创新性,有效性以及安全性⑤要设立对照组
⑥确定试验观察的期间要合适
⑦注意盲法方法的合理应用,避免测量性偏倚,干扰研究测试的真实性⑧防止混杂因素对研究的影响⑨限制机遇因素对研究结果的影响⑩要正确地应用统计学分析方法
(2)科研选题10种方法:
①从临床实践中寻找课题②学术交流与争鸣中选题③从文献中记载的难题中选题④从学科交叉的边缘区选题⑤从医学的空白区选题⑥从国家研究项目指南中选题
⑦从研究中出现的特殊现象或反常现象中选题⑧运用借鉴、移植的方法选题⑨改变选题的组合因素,编制新的课题⑩从已有课题的延伸中选题
扩展阅读:
外语研究中的统计方法总结
T-检验方差分析MSb两组平均数的差异检验:
(1)比较多组平均数;组间差异与组内差异比值F定两个样本
(2)单一样本与总MSw义体1、抽取样本的总体呈正态分布2、数据随机从一个总体中通过样本抽取3、因变量必须前是连续性数据,即定距变量或提定必变量4、自变量必须是分类的、离散性数据,水平必须是2定义:
检验某个变量的总体均值和某指定值之间是否存在显著差异样本均数与已知总体均数之间的比较)1、样本所来自的总体呈方差齐性2、因变量数据在总体中呈正态分布3、数据由随即抽样获得;4、因变量的数据必须是区间级变量或分类不多的比率级变量5、自变量必须是名称级或顺序变量F检验:
方差分析以F检验来推断几个平均数差异的显著性。
如果组间与组内方差相等,即F比值等于或接近1,表明各组平均数无显著差异;如果F值很大,大到超过F抽样分布上某种显著性水平的临界值,则拒绝零假设,接受有显著性差异的备择假设单一样形本式t-前提:
样本总体服从正态检分布验F分布:
形态随F比值分子和分母中的自由度的变化而形成的一簇正态分布组间方差MSb=SSb(组间平方和)dfb(组间自由度)组间自由度:
dfb=K-1(组数减1)组内方差MSWSSw(组内平方和)dfw(组内自由度)组内自由度dfw=K(n-1)=N-K实现过程:
analysis-comparemeans-one-samplet-test几个概念:
实验或调查中的自变量称为因素,只有一个自变量的方差分析称为单因素方差分析,用one-wayANOVA命令计算;有两个以上因素的称为多因素方差分析,用Univariate命令计算某一个因素的不同情况称为因素的“水平”各因素水平之间的每个组合叫做一个“单元”(cell)定义:
两个样本之间彼此没有任何关联,两个独立样本各自接受相同的测量单因素方前提:
(1)两个样本互相差独立>.05方差齐性;分≤.05方差不齐性
(2)样析本来自的两个总体应该呈正态分布单一因素各水平影响的一个(或几个相互独立的)因变量各组平均数之间的差异;对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异尽心分析,即进行均值多重比较实现过程:
analysis-comparemeans-one-wayANOVA方差不齐性:
Tamhane’sT2方差齐性:
LSD两独立样本t-检实现形式:
验analysis-comparemeans-independent-samplet-test定义:
根据样本数据对样本来自的两配对总体的均值。
同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较前提:
两个样本应该是配对的;观察数目相同;顺序不能随意改变实现形式:
analysis-comparemeans-paired-samplet-testCohen’sd=21效应幅度:
etasquaredbetweengroupssumsofsquares(组间)totalsumofsquares(总体)对一个独立变量是否受一个或多个因素或变量影响;可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差、各因素变量与协变量之间的交互作用多因素单因变量方差分析两配对样本t-检验公22式:
mean1mean2(sdsd)/2效应效应幅度指数值:
幅0-0.2aweekeffect效果弱度0.21-0.5amodesteffect效果弱强(尚可)0.51-1.00amoderateeffect效果中强>1.00astrongeffect效果强单因素:
0-0.1aweekeffect0.1-0.3amodesteffect0.3-0.5amoderateeffect>0.5astrongeffect多因素:
在P值小于.05时观察Etasquared=SSmod/SStotal0-0.1效应幅度弱0.1-0.3效应幅度弱强0.3-0.5效应幅度中强>0.5效应幅度强相关分析
相关的概念:
两个变量之间不精确、不稳定的变化关系称为相关关系。
两个变量值不是一一对应得那样精确、稳定。
变化关系:
变化方向上:
正相关(变化方向一致)、负相关(变化方向相反)、零相关(变化
方向无一定规律)
密切程度:
强相关或弱相关、中度相关、弱相关或低度相关相关系数(Correlationcoefficient):
用r表示。
数值范围在-1到+1之间,即0≤r≤1重要知识:
相关系数的值,仅仅是一个比值,不能做数学运算。
也不能揭示两者之间的内在
本质,不一定存在因果关系。
相关系数所显示的相关强度:
r:
<0.3低度/弱相关
r:
>0.3且<0.8中度相关r:
>0.8高度/强相关
相关系数的显著性检验:
要看r在抽样分布上出现的概率如何形式:
1皮尔逊相关分析
使用条件:
1)两个变量都是由测量获得的连续性数据2)呈正态分布3)成对数据,每对数据之间相互独立4)呈线性关系(散点图)实现形式:
analyze-correlate-bivariate
注意:
p指<.05才求效应幅度(相关系数的平方)2等级相关分析定义:
当两个变量之间以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态
分布,样本容量也不一定大于30,表示这两变量之间的相关,称为等级相关。
优点:
不要求呈正态分布,也不要求大于30,所以应用范围广
缺点:
若两个变量的原始资料都是较精确的度量资料,则不必化成较粗略大大等级资料,否
则会失掉很多信息。
前提:
不能有较多的个案属于同一等级,这样会严重影响协变关系的产生,因此,用于等级相关的顺序级变量应有较多数量的等级分类,且每一类中的个案较少。
3偏相关分析
定义:
剔除其他相关因素影响的条件下计算相关系数条件:
当两个变量同时与第三个变量有线性关系,求某两个变量之间的相关系数才能用偏相
关分析
实现形式:
analyze-correlation-partial4距离相关分析
定义:
距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量
使用范围:
可用于同一变量内部各个取值之间,以考察其相互接近程度;也可用于变量间,
以考察预测值对实际值的拟合优度。
分类:
1)根据统计量的不同,可分为a不相似性测量,通过计算样本或变量之间的距离表
示b相似性测量,通过计算Person相关系数或Cosine相关来表示
2)根据分析对象的不同,可分为a个案间分析(只测不相似性)b变量间分析
实现形式:
变量之间相似性测量分析:
analyze-correlation-distance-betweenvariables-similarities
变量之间不相似性测量分析:
analyze-correlation-distance-betweenvariables-dissimilarities
个案之间不相似性测量分析:
analyze-correlation-distance-betweencases-dissimilarities
注意:
相似性数值越大,相似性越好;不相似性数值越大,不相似性越好5信度分析量表的可靠新1)同质信度分析
内部一致性,指的是测量内部所有项目的一致性Analyze-scale-reliabilityanalysis-alpha
Cronbacha信度系数:
连续变量系数在0.8以上较好,离散变量的系数在0.6以上较好
2)分半信度分析
在测试以后对测试项目按奇项、偶项或其他标准分成两半,分别记分,有两半分数之间的相关系数得到信度系数。
3)再测信度分析
再测信度系数为两次测量结果之间的信度系数,反映两次测试分数的稳定程度。
满足假设:
a所测量的特指必须是稳定的;b遗忘和练习的效果相同c两测试期间被试对问题的熟悉程度情况没有差别
卡方检验1概念:
交叉列联表分析(crosstabulation),用于非连续变量的分析
零假设:
行列变量之间独立(即不存在相关性)2前提
1)两个变量必须是离散变量,即名称和顺序级变量,顺序级变量的分类控制在5个以内2)每个单元的期待值不能少于1.通过观察expectedvalue得知3)期待值少于5的单元不能超过20%,否则不能用卡方检验
4)如果观测值有数值小于5的单元,采用卡方检验结果表中的Fisher’sexacttest数
值。
实现形式:
analyze-descriptivestatistics-crosstabs效应幅度强弱值:
0.000。
10弱
0.110.30有限,尚可0.310.5中0.510.8强0.8以上极强
2×2phi超过2×2Cramer’s回归分析
1概念:
用数学方程式来表达两变量之间的非确定性因果关系,可利用该方程式,有自变量
的值来估计、预测因变量的估计值,这种分析就成为回归分析。
回归分析是处理两个及两个以上变量间线性依存关系或依存变化的数学关系的统计方法。
形式:
1)一元线性回归
一元线性回归是指只有一个自变量的线性回归。
回归线:
如果散点图有明确的直线趋势,我们就可以配置一条最能代表散点图上分布趋势的
直线,这条最优拟合线即称为回归线。
一元线性回归方程:
Y=a+bxY为因变量,X为自变量,a为截距,是个常数项,b为回归
系数
一元回归方程的检验:
1、对回归方程进行方差分析,检验统计量值为F。
当F足够大时,
拒绝接受b=0的假设2、对回归系数进行显著性检验,检验统计量的值为t,P小于.053、R2判定系数。
越大,拟合优度越好
实现形式:
analyze-regression-linear
2)多元线性回归
研究在线性关系下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。
Y=a+b1x1+b2x2++bnxn
应用范围:
1筛选有关变量(主要用途)2获得有实际意义的回归方程一般步骤:
1单因子模型分析2逐步筛选变量,建立多因素模型3综合单因子和多因素模
型,当两者矛盾时,结合专业知识分析原因
检验:
方差分析;偏回归系数与常数项检验,使用统计量t哪个自变量意义最大要看standardizedcoefficients拟合优度:
0.5以上最好,不低于0.3adjustedsquare
因子分析
1定义:
因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方
法,即用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息。
2因子的概念
代表各类信息的综合指标称为因子。
3特点:
因子数量少于原有的变量;根据原有的信息进行重新组构;不存在线性相关关
系;具有命名解释性4几个概念
因子载荷:
原有变量和因子变量的相关系数。
因子载荷的绝对值越大,则公共因子和原有变
量的关系越强。
变量共同度(公共方差):
衡量因子分析效果的一个指标。
反映全部公共因子的原有变量的
总方差解释说明比例,越接近1,说明解释信息越强。
公共因子的方差贡献:
反映该因子对所有原始变量总方差的解释能力。
其值越高说明因子重
要程度越高。
核心问题:
如何构造因子数量;如何对因子变量进行命名解释。
四个基本步骤:
1)确定带分析的原有若干变量是否适合于因子分析2)构造因子变量
3)因子变量的命名解释
4)计算因子得分就是确定原样本数据在不同因子上的具体数值。
Analyze-datareduction-factor统计方法T-test定义两组平均数形式单一样本、两独立样本、两配对样本实现过程Analyze-comparemeans-onesample/independentsample/pairedsample前提正态分布、数据随即抽取、因变量是连续数据、自变量是离散数据,水平是2效应幅度d=mean1mean22(sd12sd2)/20-0.2aweekeffect效果弱0.21-0.5amodesteffect效果弱强(尚可)0.51-1.00amoderateeffect效果中强>1.00astrongeffect效果强Etasquared=SSmod/SStotal0-0.1效应幅度弱0.1-0.3效应幅度弱强0.3-0.5效应幅度中强>0.5效应幅度强P值<.05才求效应幅度(相关系数的平方)方差分析多组平F-test均数单因素、多因素单一变量Analyze-comparemeans-one-wayANOVA/analyze-generallinearmodel-univariateAnalyze-correlation-bivariateAnalyze-correlation-partialAnalyze-correlation-distanceAnalyze-scale-reliabilityanalyze方差齐性、正态分布、数据随机抽样、因变量是区间级或分类不多的变量、自变量是名称或顺序变量连续性数据、正态分布、成对数据、线性关系Pearson相关分析等级相关偏相关距离相关相似性与不相似性量表的校度考核离散变量的相关分析个案间、变量间同质信度、分半信度、再测信度不一定呈正态分布、不一定大于30两变量同时与第三个变量有线性关系信度分析卡方检验Analyze-descriptivestatistics-crosstabs离散变量、期待数值不少于1、期待数值少于5的不能超过20%、小于5的用Fisher’sexacttest0.000.10弱0.110.30有限,尚可0.310.5中0.510.8强0.8以上极强2×2phi超过2×2Cramer’s回归分析因子分析线性依存关系多变量少变一元、多元Analyze-regression-linearAnalyze-datareduction-factor量
友情提示:
本文中关于《统计、科研的一些总结》给出的范例仅供您参考拓展思维使用,统计、科研的一些总结:
该篇文章建议您自主创作。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 科研 一些 总结