spss多元回归及非线性.docx
- 文档编号:2501604
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:8
- 大小:77.89KB
spss多元回归及非线性.docx
《spss多元回归及非线性.docx》由会员分享,可在线阅读,更多相关《spss多元回归及非线性.docx(8页珍藏版)》请在冰点文库上搜索。
多元回归
分析→回归→线性,
拟合优度检验
总离差平方和(tss)=回归平方和(ess)+残差平方和(rss);
可决系数的取值范围:
[0,1]。
R2越接近1,说明实际观测点离样本线越近,拟合优度高。
由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
调整的可决系数思路是:
将残差平方和与总离差平方和分别除以各自的自由度(df),以剔除变量个数对拟合优度的影响:
(2)方程总体线性的显著性检验(F检验
H0:
b1=b2=¼=bk=0
H1:
bj不全为0
F>Fa(k,n-k-1)或F£Fa(k,n-k-1)
来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。
(3)变量的显著性检验(t检验)
如果变量X对Y的影响是显著的,那么X前的参数应该显著的不为0
检验步骤:
1)对总体参数提出假设
H0:
b1=0,H1:
b1¹0
若|t|>ta/2(n-2),则拒绝H0,接受H1;(小概率事件发生)
若|t|£ta/2(n-2),则接受H0;
看指标选模型
·拟合程度AdjustedR2:
越接近1拟合程度越好
·回归方程的显著性检验F统计量的值,及其Sig
·回归系数表回归系数B和显著性检验Sig
(4)满足基本要求的样本容量
从统计检验的角度:
n>30时,Z检验才能应用;
n-k³8时,t分布较为稳定
四、预测
一元或多元模型预测的SPSS实现:
特征根和方差比
特征根是诊断解释变量间是否存在严重的多重共线性的另一种有效方法。
最大特征根的值远远大于其他特征根的值,则说明这些解释变量间具有相当多的重叠信息,原因是仅通过这一个特征根就基本刻画出了所有解释变量的绝大部分信息。
解释变量标准化后它的方差为1。
如果某个特征根既能够刻画某解释变量方差的较大部分(0.7以上),同时又可以刻画另一根解释变量方差的较大部分,则说明这两个解释变量间存在较强的线性相关关系。
4、条件指数
条件指数反映解释变量间多重共线性的指标。
当0<=Ki<10时,多重共线性较弱;当10<=Ki<100时,认为多重共线性较强;Ki>=100时,认为多重共线性很强。
v分析→回归→线性→绘制→选正态概率图→继续→确定→查看输出窗口→数据点围绕基准线还存在一定的规律性。
v分析→回归→线性→保存,选残差中的标准化→继续→确定→分析→非参数检验→1样本k-s
(1)把standardizedresidual放入检验变量列表→确定→查看输出窗口,sig(p)表明标准化残差和标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。
(该要求是要求残差服从正态分布)
v分析→回归→线性→保存,选距离中cook距离,杠杆值→继续→确定→查看输出窗口→没有发现强影响点。
(库克距离大于1对应的解释变量为强影响点。
杠杆值越高,对应的解释变量就越可能是强影响点)
曲线估计
分析→预测→序列图→把在外就餐放入变量框
分析→回归→曲线估计→因变量在外就餐;自变量年份→模型选指数分布,点保存。
非线性预测
估计
R方=1-(残差平方和)/(已更正的平方和)
相关术语ZRE残差标准话ZPR预测值标准化LEV距离杠杆值FIT预测值
时间序列
1数据的平稳性及其检验
一、时间序列数据的平稳性。
如果满足下列条件:
1)均值与时间t无关的常数;
2)方差与时间t无关的常数;
3)协方差只与时期间隔k有关,与时间t无关的常数。
则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)
若时间序列是一具有零均值同方差的独立分布序列:
(9.1.1)
该序列常被称为是一个白噪声(whitenoise)
如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。
检验样本自相关函数及其图形来判断平稳时间序列
首先定义随机时间序列的自相关函数,实际上我们对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数随着k的增加,样本自相关函数下降且趋于零。
但从下降速度来看,平稳序列要比非平稳序列快得多,
检验对所有k>0,自相关系数都为0的联合假设,这可通过如下统计量,Q值大于显著性水平为的临界值,拒绝所有(k>0)同时为0的假设,软件:
检验哪个序列,就打开该序列,点击菜单view下拉菜单corrdlogram,选择level,表示对原始序列的平稳性检验,lagstoinclude处,输入原始序列长度的一半或者稍小于一半的数值。
点击确定。
若概率很小,说明原序列并不是自相关系数均为零的。
说明原序列是非随机的。
如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。
这也正是随机时间序列分析模型的优势所在。
四、随机时间序列模型的识别
工具主要是时间序列的自相关函数(autocorrelationfunction)ACF及偏自相关函数(partialautocorrelationfunction)PACF。
偏自相关函数
自相关函数ACF(k)给出了与的总体相关性,偏自相关函数(partialautocorrelation,PACF)则是消除了中间变量,…,带来的间接相关后的直接相关性,它是在已知序列值,…,的条件下,与间关系的度量。
因此,在AR
(1)中,从中去掉的影响,则只剩下随机扰动项,显然它与无关,因此我们说与的偏自相关系数为零,记为AR(p)的一个主要特征是时,,即偏自相关函数在p以后是截尾的
识别规则:
若的偏自相关函数在p阶以后截尾,即时,=0,而它的自相关函数是拖尾的,则此序列是自回归AR(p)序列。
MA(q)过程
识别规则:
若随机序列的自相关函数截尾,即自q以后,而它的偏自相关函数是拖尾的,则此序列是移动平均MA(q)序列。
9.2.1ARMA(p,q)模型的ACF与PACF理论模式
模型
ACF
PACF
白噪声
AR(p)
衰减趋于零(几何型或振荡型)
P阶后截尾:
,k>p
MA(q)
q阶后截尾:
,,k>q
衰减趋于零(几何型或振荡型)
ARMA(p,q)
q阶后衰减趋于零(几何型或振荡型)
p阶后衰减趋于零(几何型或振荡型)
六、模型的估计
点击工作窗口quick下拉菜单中estimateequation在弹出的窗口中书写模型变量,Y建立ARMA(2,2)模型,
YcAR
(1)AR
(2)MA
(1)MA
(2)
七、模型的检验
由于ARMA(p,q)模型的识别与估计是在假设随机扰动项是一白噪声的基础上进行的,因此,如果估计的模型确认正确的话,残差应代表一白噪声序列。
如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。
在实际检验时,主要检验残差序列是否存在自相关。
可用第一节提出的统计量进行检验
八、软件实现
在估计结结果窗口的view,residualtest中的Correlogram–Q-statistics功能选择的滞后期随意,尽可能的多或样本的一半。
得到残差项的自相关系数和偏自相关系数值。
Q-stat所对应的列是相应自由度的Q统计量的值,最右侧Prob列中的数字表示相应自由度条件下统计量取值大于相应值得概率。
如果这一列概率值都大于0.05,说明所有值都小于检验水平为0.05的分布临界值(位于临界值左侧)。
结论是模型的随机误差项序列是一个白噪声序列
(1)绘制该序列的时序图。
(2)自相关图检验。
看autocorrelation)
(3)纯随机性检验,看统计量的P值,若P值很小<0.05,说明我们有95%,属于非白噪声序列。
(看Q-stat与prob)下面非白噪声序列进行建模及预测。
原假设:
该序列是白噪声序列,在原假设成立的条件下得到的Q统计量(看右侧第二列,)以及得到Q统计量的概率,发现是小概率事件,故拒绝原假设,即原序列不是白噪声序列
(5)在考察样本偏自相关系数图。
(6)估计。
在eviews估计窗口中,导入序列y,在估计窗口输入ycy(-1),
单击主窗口中的菜单Quick-Estimateequation,在空白对话框中依次输入
ycy(-1)
单击Ok。
至此,得到估计结果。
点击估计结果窗口name,给方程命名,默认即可。
主窗口空白处书写:
genre=resid,回车
也可估计结果窗口,点菜单view,下拉菜单中选择Actual,Fitted,residual—Actual,Fitted,residualTable,复制residual一列。
(7)检验A、主要是看模型提取的信息是否充分看残差序列view下拉菜单中的correlation,出现的图中看得到统计量的P值,若P值均较大,说明残差序列是一个白噪声序列。
B、参数的显著性。
检验每一个待估计的参数是否显著非零,这个检验的目的是为了使模型精简。
。
1.序列预处理。
看该序列的图形发现无明显趋势或周期,波动稳定。
2.根据相关图的自相关系数的2阶截尾,可以尝试MA
(2)
3.根据偏自相关的1阶截尾,尝试拟合AR
(1)。
比较(越大越好),(越小越好),
预测
1)扩大区间:
双击range和sample区域,在弹出的对话框中,将70,改为71。
22)
在估计结果窗口,点forecast,在弹出的窗口处
更改method处,点选staticforecast,其他默认即可。
在workfile窗口就出现了yf序列,第71个数据就是预测值。
具体步骤
1,、模型识别
1)数据录入
打开Eviews软件,选择“File”菜单中的“New--Workfile”选项,在“Workfilestructuretype”栏选择“Unstructured/Undated”,在“Daterange”栏中输入数据个数201,点击ok,见图2-1,这样就建立了一个工作文件。
点击File/Import,找到相应的Excel数据集,打开数据集,出现图2-2的窗口,在“Dataorder”选项中选择“Byobservation”即按照观察值顺序录入,第一个数据是从a2开始的,所以在“Upper-leftdatacell”中输入a2,本例只有一列数据,在“Namesforseriesornumberifnamedinfile”中输入序列的名字production或1,点击ok,则录入了数据。
(2)绘制序列时序图
双击序列production,点击view/Graph/line,则出现图2-3的序列时序图,时序图看出201个连续生产的数据是平稳的,这个判断比较粗糙,需要用统计方法进一步验证。
(3)绘制序列相关图
双击序列production,点击view/Correlogram,出现图2-4,我们对原始数据序列做相关图,因此在“Correlogramof”对话框中选择“Level”即表示对原始序列做相关,
(4)ADF检验序列的平稳性
通过时序图和相关图判断序列是平稳的,我们通过统计检验来进一步证实这个结论,双击序列production,点击view/unitroottest,
(5)模型定阶
1看,偏自相关系数在k=n,尝试拟合AR(n),自相关系数在k=m处显著不为0,考虑拟合MA(m)同时可以考虑ARMA(n,m)模型等,点击主菜单Quick/GenerateSeries,在对话框中输入赋值语句Seriesx=production-84.11940,
2、模型参数估计
(1)尝试AR模型
在主菜单选择Quick/EstimateEquation,
xar
(1)ar
(2)ar(3)ar(i)(i=1,2…)表示自回归系数;
(2)尝试MA模型,方程定义空白区键入xma
(1)ma
(2)(其中ma(j),j=1,2…代表移动平均系数)或在主窗口输入lsxma
(1)ma
(2)。
(3)尝试ARMA模型;在主窗口命令栏输入lsxar
(1)ar
(2)ar(3)ma
(1),由参数估计结果经过进一步筛选,同一个平稳序列建立多个适合模型,但比较AIC和SC的值,以及综合考虑其他检验统计量,考虑模型的简约原则,
3、模型检验
参数估计后,应对拟合模型的适应性进行检验,实质是对模型残差序列进行白噪声检验。
若残差序列不是白噪声,说明还有一些重要信息没被提取,应重新设定模型。
可以对残差进行纯随机性检验,也可用针对残差的检验。
通常有两种方法进行检验。
当一个模型估计完毕之后,会自动生成一个对象resid,它便是估计模型的残差序列值,对其进行相关图分析便可看出检验结果;另一种方法是在方程输出窗口中点击View/ResidualTests/Correlogram-Q-Statistics,输入相应的滞后阶数14,
4、模型预测
我们用拟合的有效模型进行短期预测,在方程估计窗口点击Forecast,预测方法常用有两种:
Dynamicforecast和Staticforecast,前者是根据所选择的一定的估计区间,进行多步向前预测;后者是只滚动的进行向前一步预测,即每预测一次,用真实值代替预测值,加入到估计区间,再进行向前一步预测。
选择Dynamicforecast,点击ok,预测值存放在XF序列中,此时我们可以观察原序列x和xf之间的动态关系,同时选中x和xf,击右键,点open/asgroup,然后点击view/graph/line,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 多元 回归 非线性