回归分析(毕业论文)Word文件下载.docx
- 文档编号:850973
- 上传时间:2023-04-29
- 格式:DOCX
- 页数:23
- 大小:136.05KB
回归分析(毕业论文)Word文件下载.docx
《回归分析(毕业论文)Word文件下载.docx》由会员分享,可在线阅读,更多相关《回归分析(毕业论文)Word文件下载.docx(23页珍藏版)》请在冰点文库上搜索。
CPI;
Predict
目 录
第1章 用电量预测引言 4
1.1研究现状 4
1.2主要研究内容 4
1.3关键性问题 4
1.4研究存在的问题 5
第2章 多元回归方程 5
2.1回归分析及多元回归概述 5
2.2多元回归方程 6
2.2.1数学模型和回归方程的求法 5
2.2.2回归方程的显著性检验 6
2.2.3偏回归平方和与因素主次的判别 9
2.3实际模型中的回归应用 7
第3章 多元回归模型参数的选择和建立 10
3.1参数选择 10
3.2模型建立与显著性检验 12
第4章用电量预测 16
4.1福建省生产总值GDP预测 16
4.2福建省总人口数预测 17
4.3福建省用电量预测 17
第5章 结束语 19
参考文献 22
致谢与声明 23
第1章 用电量预测引言
1.1电量预测研究现状
随着福建经济的高速发展,对电力的需求也在不断增加。
电力需求的飞速增长,引起福建电力供应紧张。
在电力供应紧张的背后充分说明了对电力市场的预测出现了偏差,这对中福建的经济和社会的全面发展带来了负面影响。
对福建未来的用电量进行预测分析,对于及时掌握电力需求的发展动态,经济合理地安排电网内部发电机组的生产计划,降低发电成本,保持电网运行的安全可靠,提高经济和社会效益,推动福建经济稳定高速发展有着重要的作用。
由于用电量预测对电源开发,电网建设,社会安定,居民生活及电力公司本身的发展都有很大的影响,因此世界各地的电力部门都十分重视电力需求预测工作,设置专门的机构,由经济分析,需电量预测,负荷预测等方面的专业人员来从事电力需求预测工作,由于起步较早,各自开发出一种或几种适合于本国经济运行特点的需电量预测方式,而且几种方式可以相互效验.方法有部门分析法进行预测,最终需求法,弹性系数法,,计量经济模型方法等。
在电量预测道路上,由于一些学者对计量经济模型缺少深入的了解,不合理的利用普通最小二乘法及其他的计量经济模型,得出不符合实际意义的参数估计,从而导致结论的不正确。
这将对近期年和远景年的负荷及电量预测的方向造成严重误导,给国家带来巨大的损失。
所以我们就这电量预测线性问题方面合理适当运用了多元线性回归分析方法。
1.2主要研究内容
基本要求是掌握回归分析的基本原理和方法,确定变量之间的相关关系和相关程度,建立回归模型,检验变量之间的相关程度,应用回归模型进行估计和预测等。
重点研究是如何应用回归分析的方法建立模型,对实际中遇到的一些问题进行估计和预测,并根据预测结果提出有效的控制方法。
1.3关键性问题
关键性问题是回归模型的成功与否,要看它对实际现象能否成功的作出预测。
因此,模型效果的检验不仅要看它对数据所提供的观察值的模拟效果,还应看它对于我们还没有观测的数值的预测效果如何。
可见,第一阶段数据的收集,是建
模过程的重要部分。
准确的数据不仅能为我们寻找所讨论的问题中有关变量的关系给出很好的提示,而且是建模其他阶段的可靠数据。
在建立线性回归模型时,为了得到既包含相同的情况,又能克服独立变量间相关关系的回归模型,必须剔除那些与其他独立变量有密切关系的变量。
在建模分析过程中,基础资料要可靠,统计分析要全面。
在进行数据处理分析和建立预测模型的过程中,要充分考虑外界因素的变化及未来相关因素的不确定性对中长期电力负荷预测的影响,还要考虑众多因素交互作用的结果,要对预
测专家的经验和意见加以有效的分析利用。
在电量预测中,参数估计也是必要的。
负荷预测时通常要通过客观数据的调研,寻找适当的数学模型,然后按照一定和
必要的参数估计方法求解其中若干个待定参数。
1.4研究存在的问题
线性回归模型使得我们在计算过程中过于复杂,又不能避免百分率方法中个案例计算结果之间差异过大的缺陷,因此回归方程的应用具有一定的期限,需要经常更正。
回归方程的最优性有两方面的含义:
一方面,方程中要含所有的有着显著作用的自变量,不能遗漏。
另一方面,希望所含的自变量尽可能少。
因为自变量多,计算量大,使用不方便,计算误差大,降低方程的精度;
而且方程中引入无意义的变量,反而会降低方程的稳定性,有害无益。
第2章 多元回归方程
2.1回归分析及多元回归概述
研究一个(或一组)变量与另一个或一些变量之间的关系在几乎所有科学分支中越来越受到重视。
对两个变量情况用严格的数学语言表达就是:
如果对于变量X的任意一个具体数值,存在一个变量Y的概率分布与其对应;
同时,对于变量Y的任意一个具体取值y0,存在一个X的概率分布与其对应,则称变量X与Y之间具有相关关系。
显然,X与Y之间的相关关系是两个随机变量之间平行的依赖关系。
在相关关系中,如果X容易确定或可人为控制,即将X看为非随机变量x0,那么x0与随机变量Y之间的关系称为回归关系(regression)。
显然,x与Y之间的回归关系是一个普通变量x与随机变量Y的因果关系。
回归分析的主要目的是寻求一个随机变量Y对一组随机变量X1、X2、…、Xm的统计依赖关系。
统计依赖关系不在是单纯的因果关系,而是变量之间的相关关系。
回归分析是一种处理变量的统计相关关系的一种数理统计方法。
回归分析的基本思想是:
虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。
回归分析主要解决以下几个方面的问题:
(1)确定几个特定的变量之间是否存在相关关系,如果存在的话,找出它们之间合适的数学表达式;
(2)根据一个或几个变量的值,预测或控制另一个变量的取值,并且可以知道这种预测或控制能达到什么样的精确度;
(3)进行因素分析。
例如在对于共同影响一个变量的许多变量(因素)之间,找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系等等。
2.2多元回归方程
2.2.1数学模型和回归方程的求法
实际应用中,很多情况要用到多元回归的方法才能更好地描述变量间的关系,因此有必要在本节对多元线性回归做一简单介绍,就方法的实质来说,处理多元的方法与处理一元的方法基本相同,只是多元线性回归的方法复杂些,计算量也大得多,一般都用计算机进行处理。
多元回归分析是研究多个变量之间关系的回归分析方法, 按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析。
下列主要介绍多元线性回归分析。
2.2.1.1多元线性回归的模型。
设因变量y与自变量x1,x2,……,xk之间有关系式:
y=b0+b1x1+...+bkxk+e
e~N(0,s2)
抽样得n组观测数据:
(y1;
x11,x21,……,xk1)
(y2;
x12,x22,……xk2)
……………………
(yn;
x1n,x2n,……xkn)
(1)
其中xij是自变量xi的第j个观测值,yj是因变量y的第j个值,代入
(1)得模型的数据结构式:
ì
y1=b0+b1x11+b2x21+...+bkxk1+e1
ï
y=b+bx+bx +...+bx +e
2 0
112
122
kk2 2
í
...
y=b
...
+bx
+bx
... ...
+...+bx +e
(2)
n 0
11n
22n
kkn n
e,e...e独立同分布N(0(s2(
î
1 2 n
我们称
(1)或
(2)为k元正态线性回归模型,其中b0,b1,……,bk及σ2都是未知待估的参数。
2.2.1.2未知参数的估计
与一元时一样,采用最小二乘法估计回归系数b0,b1,……,bk. 称使
Q(bb,...,b
)=ˆå
[y
-(b+bx
+...+bx
)]2达到最小的bˆ,bˆ,...,bˆ
为参数
0,1
k t
n
t=1
0 11t
22t
kkt
0 1 k
(b0,b1,……,bk)的最小二乘估计,利用微积分知识,最小二乘估计就是如下方程组的解:
l11b1+l12b2+...+l1kbk=L1y
l21b1+l22b2+...+l2kbk=L2y
lb
+l
b+...+l
b=L
(3)
k11k22
kkk ky
b0=y-b1x+b2x2+...+bkxk
1n 1n
其中y= å
yt,
xi= å
xit
(i=1,2,...,k)
L=1n(x
-x)(x-x)=L
(i,j=1,2,...,k)
ij å
it
i jt j ji
L=1n(x-x),(y
-y)
iy å
it i t
通常称方程组(3)为正规方程组,其中前k个方程的系数矩阵记为
L*=(lij)k´
k,当L*可逆时,正规方程组(3)有解,便可得b0,b1,……bk的最小二乘
估计bˆ,bˆ,K,bˆ
0 1 k
æ
bˆö
æ
L1yö
ç
1÷
ç
÷
即ç
M÷
=(L*)-1ç
M ÷
bˆ=y-bˆx1-...-bkxk
代入模型
(1),略去随机项得
bˆ
0 1
è
kø
è
Lkyø
经验回归方程为:
yˆ=bˆ+bˆx+...+bˆx
(4)
0 11 kk
类似一元可以证明
2
bˆ都是相应的bi(i=0,1,……,k)的无偏估计,且σ2’的
i
Q(bˆ,bˆ,...,bˆ)
无偏估计为:
sˆ
=0 1 k·
n-k-1
2.2.2回归方程的显著性检验
与一元的情形一样,上面的讨论是在y与x1,……,xk之间呈现线性相关的前提下进行的,所求的经验方程是否有显著意义,还需对y与诸xi间是否存
在线性相关关系作显著性假设检验,与一元类似,对yˆ=bˆ
+bˆx
+...+bˆx是否
有显著意义,可通过检验H0:
b1=b2=…=bk=0
0 11 kk
为了找检验H0的检验统计量,也需将总偏差平方和Lyy作分解:
n n
t
L=å
(yt
-y)2=å
(y
-yˆt
+yˆt
-y)2
=å
-yˆ)2+å
(yˆ
-y)2=&
Q+U
(5)
e
即L=U+Qe 其中L=Lyy,U=å
(yˆt
2
-
y),
Qe=å
-yˆ)2
这里yˆt=bˆ
+...+bˆx
. 分别称Qe,U为残差平方和、回归平方和,可以
0 11t
ˆ ˆ
ˆ
Dkˆ
证明:
U=b1l1y+b2l2y+...+bklky=å
bjljy
j=1
利用柯赫伦定理可以证明:
在H0成立下,U
s2
~c2(k)(Qe
~c2(n-k-1)且U
与Qe相互独立,所以有F= U/k
Q/(n-k-1)
(这里记Qe为Q,下同)
H0真
~
F(k,n-k-1)
(6)
取F作H0的检验计量,对给定的水平a,查F(k, n-k-1)分布表可得满足p(F³
Fa)=a的临介值Fa,由样本观测值代入(6)算出统计量F的观测值,若
F≥Fa,则不能接受H0,认为所建的回归方程有显著意义。
通过F检验得到回归方程有显著意义,只能说明y与x1,x2,……,xk之间存在显著的线性相关关系,衡量经验回归方程与观测值之间拟合好坏的常用统计量有复相关系数R及拟合优度系数R2。
仿一元线性回归的情况,定义:
R2=U
L
=1-Q
(7)
1-Q
|R|=
(8)
可以证明R就是观测值y1,……,yn与回归值的yˆ1,yˆ2,...,yˆn的相关系数。
实用中,为消除自由度的影响,又定义:
R2=1=Q/(n-k-1)
L/(n-1)
(9)
为修正的似合优度系数。
2.2.3 偏回归平方和与因素主次的判别
本段内容是多元回归与一元回归有本质差异的部分。
前一节所作的检验H0:
b1=b2=……=bk=0被拒绝,并不能说明所有的自变量都对因变量y有显著影响,我们希望从回归方程中剔除那些可有可无的自变量,重新建立更为简单的线性回归方程,这就需要对每个自变量xj做显著性检验。
于是考虑H0j:
bj=0的检验方法。
从原有的k个自变量中剔除xj,余下的k-1个自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 毕业论文