中央民族大学数学建模选拔赛论文格式.docx
- 文档编号:17641296
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:29
- 大小:107.96KB
中央民族大学数学建模选拔赛论文格式.docx
《中央民族大学数学建模选拔赛论文格式.docx》由会员分享,可在线阅读,更多相关《中央民族大学数学建模选拔赛论文格式.docx(29页珍藏版)》请在冰点文库上搜索。
中央民族大学数学建模选拔赛论文格式
关于北京市气候变化与大气污染的研究
中央民族大学马越龙、姚琨、朱爱丽
摘要
本文建立了一个关于分析北京市气候变化趋势和大气污染情况的统计模型。
本文主要研究以下三个问题:
北京市气候变化的趋势,验证北京市是否存在气候变暖现象;大气污染情况及变化趋势;大气污染和气候变化之间的关系。
首先就问题一,根据主成分分析思想,我们选用降水量、气温和风速来表征北京市气候变化,并从《北京市统计年鉴2010》获得了1978——2009年的相关数据,利用Matlab、Excel对这些数据进行时间序列分析并根据最小二乘法原理将散点图拟合成趋势曲线,又根据问题实际需要和判定系数等对其进行筛选,得到我们需要的最优回归方程及曲线。
据此验证北京市存在气候变暖现象,并选取气温的气候倾向率(气温线性回归方程的一次项系数)来度量气候变暖的程度。
其次就问题二,根据主成分分析思想,我们选用SO
浓度、NO
浓度、可吸入颗粒物含量来表征北京市大气污染状况,并从《北京市统计年鉴2010》获得了2000——2009年的相关数据。
利用内地空气污染指数的计算方法,计算出大气污染的评价度量指标API。
并利用问题一中的方法分析各数据,得到SO
浓度、NO
浓度、可吸入颗粒物含量及API的回归模型,从而分析度量大气污染情况的变化趋势。
然后就问题三,利用SPSS软件计算分析API与温度、降水量、风速的相关性。
通过分析比较相关系数得出大气污染与气候变化之间的关系。
最后我们利用F检验来判断以上所建立回归模型的回归效果。
综上,我们利用SPSS、Excel、Matlab等数学软件很好地实现了数据统计分析,并结合主成分分析及时间序列分析思想给出了北京市气候变化和大气污染变化趋势的分析。
将数据与图形相结合,既充分发挥了图形的直观功能,又根据数据进行了相关分析,排除了主观经验的干扰,使所建立的数学模型能较好的解决上述问题。
关键词:
气候变化大气污染变化趋势API回归模型F检验
一、问题的提出与分析
1、问题的提出
目前,气候变暖和大气污染成为当今人类社会亟待解决的两大问题,是人类必须面对的严峻挑战。
北京作为中国的首都,因其特殊的政治、经济地位,在国家乃至世界的发展中都占有特殊地位,因此研究北京的气候变化和大气污染及其之间的关系有着特别重要的意义。
气候是地球上某一地区多年时段大气的一般状态,是该时段各种天气过程的综合表现。
气象要素(温度、降水、风速等)的各种统计量(均值、极值、概率等)是表征气候的基本依据。
大气污染是指自然或人为原因使大气中某些成分超过正常含量或排入有毒有害的物质,对人类、生物和物体造成危害的现象[1]。
按中国《大气环境质量标准》规定的常规分析指标有总悬浮微粒、二氧化硫、氮氧化物、一氧化碳和光化学氧化剂。
现在我们所关心的问题就是:
(1)对获得的大量数据怎样进行合理有效的筛选及分析,进而建立适当的数学模型,来分析北京市气候变化的趋势,验证北京市是否存在气候变暖现象并选择一个指标来度量气候变暖的程度。
(2)导致北京市大气污染的因素众多,如何选取适当的指标评价和度量大气污染情况及变化趋势。
(3)如何依据现有数据分析大气污染和气候变化之间的关系。
(4)如何选取适当的方法在模型建立并求解之后进行模型的检验。
2、问题的分析
解决上述问题需要大量的数据,结合主成分分析思想筛选数据、掌握数据所代表的实际意义及变化趋势和数据间的联系至关重要。
为此我们需要结合时间序列分析思想对表征北京市气候和大气污染的要素做个别分析及联合分析。
根据问题的要求,我们分三个问题进行分析。
问题一:
对气候变化趋势的分析,可以先搜集历年的气候数据,选取适当的指标作散点图,采用一元回归的的方法建立模型,观察其波动性及变化趋势。
问题二:
对大气污染的度量和变化趋势的分析,可以先搜集历年相关污染物数据,并计算出适当的指标来度量大气污染情况,然后同问题一的方法进行变化情况分析。
问题三:
可以研究度量大气污染情况的指标与表征气候变化的要素之间关系,并用其来代表大气污染与气候变化之间的关系[2]。
二、基本假设
1.温度、降水量、风力可以完全表征北京市气候
2.假设北京市每个区的气候差异不大,北京市气象站的所测得的数据可以代表北京市整体的气候状况
3.在回归模型中,拟合的二次多项式可以较好模拟出数据的变化趋势
4.在变暖程度分析中,拟合的一次多项式系数可以作为气温的气候倾向率来进行变暖程度的度量
5.可吸入颗粒物、SO
和NO
可完全代表北京市大气污染的污染物
6.API指标能正确评价和度量大气污染情况
7.假设气温和API都是正态分布,或接近正态的单峰分布,从而可以用皮尔逊相关系数表示二变量间的相关关系
三、符号说明
1.API:
空气污染指数,具体分级标准见附录五
2.I:
某污染物的实际污染指数
3.C:
该污染物在大气中的实际的浓度
4.
与
:
在API分级限值表(附录五)中最贴近C值的两个值,
为大
于C的限值,
为小于C的限值
5.
与
:
在API分级限值表(附录三)中最贴近I值的两个值,
为大于
I的值,
为小于I的值
6.API=max(I1,I2,…,In):
取所有污染物污染指数的最大值作为API的实际值,这里只取n=3
7.
:
回归模型的判定系数
8.x:
气候特征值
9.a:
气候倾向率
四、模型的建立与求解
4.1利用实际数据分析北京市气候变化趋势,验证北京市存在气候变暖现象,并给出变暖程度的度量
4.1.1数据总体分析,并画出散点图
经查阅《北京市统计年鉴2010》,我们得到了1978——2009年的气候数据(见附录一),由模型假定,我们选取温度、降水量、风速表征气候情况,并给出了对应的描述统计量(见表1)及散点图(见附录二)。
1978年-2009年气候数据描述统计量
统计量
降水量(mm)
平均气温
最高气温
最低气温
平均风速(m/s)
平均
537.615625
12.753125
37.4625
-13.44375
2.334375
标准误差
26.17769
0.12668099
0.2981715
0.3489598
0.051118414
中位数
498.3
12.9
37.3
-14
2.4
众数
12.8
37.5
-15.4
2.4
标准差
148.0833769
0.71661587
1.6867128
1.9740147
0.289169417
方差
21928.68652
0.51353831
2.845
3.8967339
0.083618952
峰度
-1.1541088
0.57331017
0.4220035
0.0681798
10.26617233
偏度
0.089242538
-0.935646
0.7219566
0.7196512
-2.748726014
区域
546.3
3
6.9
8.3
1.5
最小值
266.9
11
35
-17
1.1
最大值
813.2
14
41.9
-8.7
2.6
求和
17203.7
408.1
1198.8
-430.2
74.7
观测数
32
32
32
32
32
最大
(1)
813.2
14
41.9
-8.7
2.6
最小
(1)
266.9
11
35
-17
1.1
置信度(95.0%)
53.38975055
0.25836757
0.6081248
0.7117082
0.104256692
表1
4.1.2气候变化回归模型的建立及气候变化趋势的分析
为分析北京市气候变化趋势,我们根据最小二乘法原理,使用Excel作了气候各表征量的各种回归分析并作出了相应的趋势变化图,包括线性回归、对数回归、多项式回归、乘幂回归、指数回归。
根据判定系数
的大小,我们发现多项式的拟合效果最佳且与阶次呈正相关。
又由于实际分析趋势的需求,我们不需要阶次>=3的曲线拟合,最终选取了二阶多项式非线性回归作为数学模型来近似表征气候变化趋势[3]。
相应变化趋势图及二阶多项式、
见下图。
图1
图2
图3
气候变化趋势分析:
从趋势线看,北京市1978年以来年降水量减少了200毫米以上,并继续呈缓慢下降趋势;平均气温呈上升趋势,在31年中上升了1摄氏度左右,且上升速度趋缓;风速虽有波动,但总体平稳。
4.1.3验证北京市是否存在气候变暖现象,如果存在,给出变暖程度的度量
根据图2可以看出北京确实存在气候变暖现象。
用气温的气候倾向率作为变暖程度的度量。
随着时间序列的增长,对要素序列的各值平均而言,或是增加或是减少,形成序列在相当长时期里向上或向下的缓慢移动,这种有一定规则的变化成为趋势。
序列的趋势变化[4]可以用一次线性回归方程表示:
x=at+b
式中:
x为年气候特征值;t为年;a则为气候倾向率,用于定量描述序列的趋势变化特征。
经过对北京市1978—2009年气温的系列值回归分析得到一次线性回归方程:
x=0.0593t-105.45
并用Excel作出了趋势变化图,见下图。
图4
由此得出,北京市气温的气候倾向率为0.0593,说明在这31年中北京市气温以0.0593摄氏度/年的速率缓慢上升。
4.2分析北京市大气污染情况,选取适当的指标评价和度量大气污染情况及其变化趋势
4.2.1数据总体分析,并画出散点图
2000年-2009年大气污染数据的描述统计量
统计量
PM10
SO2
NO2
平均
0.14772
0.0538
0.0661
标准误差
0.00522585
0.003940671
0.002726
中位数
0.1485
0.054
0.0685
众数
0.071
标准差
0.01652559
0.012461496
0.008621
方差
0.000273095
0.000155289
7.43E-05
峰度
-0.796844174
-0.829207309
0.698474
偏度
-0.60514815
-0.35508346
-1.23983
区域
0.045
0.037
0.027
最小值
0.121
0.034
0.049
最大值
0.166
0.071
0.076
续上表
求和
1.4772
0.538
0.661
观测数
10
10
10
最大
(1)
0.166
0.071
0.076
最小
(1)
0.121
0.034
0.049
置信度(95.0%)
0.011821695
0.008914417
0.006167
表2
图5
4.2.2API的计算
API(AirPollutionIndex的英文缩写)[5]是空气污染指数,就是将常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,并分级表征空气污染程度和空气质量状况,适合于表示城市的短期空气质量状况和变化趋势,也是目前世界上许多国家评估环境空气质量状况的一种方式。
根据我国空气污染的特点和污染防治重点,目前计入空气污染指数的项目暂定为二氧化硫、氮氧化物和可吸入颗粒物或总悬浮颗粒物。
我们选取其作为评价和度量大气污染情况及其变化趋势的指标。
空气污染指数的计算方法:
API=max(I1,I2…Ii…In)
基本计算式:
设I为某污染物的污染指数,C为该污染物的浓度。
则:
式中:
与
:
在API分级限值表(见附表三)中最贴近C值的两个值,
为大于C的限值,
为小于C的限值。
与
:
在API分级限值表中最贴近I值的两个值,
为大于I的值,
为小于I的值。
由附录三得到各种污染物的污染分指数见表3。
年份
SO2
NO2
PM10
(污染分指数)
(污染分指数)
(污染分指数)
2000
60.5
44.375
106
2001
57
44.375
107.5
2002
58.5
47.5
108
2003
55.5
45
95.5
2004
52.5
44.375
99.5
2005
50
41.25
96
2006
51.5
41.25
105.5
2007
47
41.25
99
2008
36
30.625
86
2009
34
33.125
85.5
表3
根据API=max(I1,I2…Ii…In),得到API年均值见表4。
年份
API
2000
106
2001
107.5
2002
108
2003
95.5
2004
99.5
2005
96
续上表
2006
105.5
2007
99
2008
86
2009
85.5
表4
4.2.3大气污染情况回归模型的建立及其变化趋势的分析及度量
为分析北京市大气污染情况及其变化趋势,我们根据最小二乘法原理,使用Excel做了大气污染各表征量的污染分指数及API的各种回归分析并作出了相应的趋势变化图,包括线性回归、对数回归、多项式回归、乘幂回归、指数回归。
根据判定系数
的大小,我们发现多项式的拟合效果最佳且与阶次呈正相关。
又由于实际分析趋势的需求,我们不需要阶次>=3的曲线拟合,最终选取了二阶多项式非线性回归作为数学模型来近似表征大污染变化趋势势。
相应变化趋势图及二阶多项式、
见下图。
、
图6
图7
图8
图9
北京市大气污染情况及其变化趋势分析:
从趋势线看,近10年北京市空气的SO
、NO
、可吸入颗粒物含量[6]均呈下降状,分别下降了约20、10、20个单位。
总体来看,即从API分析与度量,API以2.1424单位/年的速度呈递减趋势,10年中下降20个单位以上,也就是说,北京市空气质量日益进步,大气污染程度降低,并根据“空气污染指数范围及相应的空气质量类别”(见附录五)可知北京市空气质量等级由“轻度污染”转为“良”,大气污染治理情况比较乐观。
4.3研究大气污染和气候变化之间的关系
通过散点图可以判断两变量之间有无相关关系,并对变量间的关系形态作大致的描述,但散点图不能准确反映变量之间的关系强度。
因此,为准确度量大气污染与气候变化之间的关系强度,我们需要计算相关系数。
根据假设,我们选用Pearson相关性系数:
来研究大气污染和气候变化之间的关系
利用SPSS统计软件对大气污染指标API和气候各因子做相关性分析,可得到各个变量之间的Pearson相关性系数(见表5)。
Correlations
平均温度
API
平均温度
PearsonCorrelation
1
-.255
Sig.(2-tailed)
.
.477
N
10
10
API
PearsonCorrelation
-.255
1
Sig.(2-tailed)
.477
.
N
10
10
Correlations
API
降雨量
API
PearsonCorrelation
1
-.829(**)
Sig.(2-tailed)
.
.003
N
10
10
降雨量
PearsonCorrelation
-.829(**)
1
Sig.(2-tailed)
.003
.
N
10
10
**Correlationissignificantatthe0.01level(2-tailed).
Correlations
API
风速
API
PearsonCorrelation
1
.359
Sig.(2-tailed)
.
.309
N
10
10
风速
PearsonCorrelation
.359
1
Sig.(2-tailed)
.309
.
N
10
10
表5
我们定义两变量之间的强度关系如表6:
两变量间的强度关系定义
相关性系数
强度关系
存在显著性相关
高度相关
中度相关
低度相关
关系极弱
认为不相关
表6
依据表5,表6,我们可以看出年平均气温与API的相关性极弱,相关系数为-0.255;风速与API低度相关,相关系数为0.359;而降雨量和API之间存在高度相关性,其相关系数为-0.829。
由此可知,北京市的大气污染程度与气温、风速几乎没有关联,而与降雨量呈明显的正相关,即降雨量的减少与大气污染程度的降低几乎同时发生。
五、模型分析
(一)模型的结果
1.北京市的气候变化趋势为:
降水量呈缓慢下降趋势,平均气温呈上升趋势,风速缓慢减弱后又逐渐加强。
北京市存在气候变暖的现象,以0.0593摄氏度/年的速率缓慢上升。
2.北京市的大气污染大体情况为:
可吸入颗粒物所占比例最高,二氧化硫次之,二氧化氮最小。
随着年份的增加,可吸入颗粒物、二氧化硫、二氧化氮均呈下降趋势。
选取空气污染指数API作为评价大气污染情况的指标,API逐年变小,说明大气污染呈变小趋势。
3.大气污染和气候变化的关系具体体现为:
平均气温与API的相关性极弱,风速与API低度相关,而降雨量和API之间存在高度相关性。
这说明北京市的大气环境状况有了较为显著的改善。
(二)结果分析
1.由于所用数据较多,不便于宏观的分析北京市的气候变化和大气污染情况,可以取每五年的均值进行分析
2.北京市的特殊性,由于奥运会的举办,绿化环保工作比较好,只能用于短期检验。
3.问题一和问题三中所建立的模型只适合趋势变化的分析,不能用于具体数据的预测。
4.由气候变化与大气污染的关系可知大气污染是气候变化的一个因素。
5.近年来由于政府部门的整治措施,大气状况得到逐年改善,北京市空气质量等级由“轻度污染”转为“良”,大气污染治理情况比较乐观。
(三)模型检验
利用方差分析表对模型进行检验,即通过F检验来判断回归模型的回归效果[7]。
“回归分析”行计算的是估计值同均值之差的各项指标,“残差”行计算每个样本观察值与估计值之差的各项指标,“总计”行用于计算每个观察值同均值之差的各项指标,df列是自由度,SS列是离差的平方和,MS是均方差,它是离差平方和除以自由度,F列是F统计量,SignificanceF列是在显著性水平下的FR
对气候变化回归模型的显著性检验:
SUMMARYOUTPUT
回归统计
MultipleR
0.7761664
RSquare
0.6024343
AdjustedRSquare
0.5891821
续上表
标准误差
0.4593155
观测值
32
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
9.590565433
9.590565
45.4592
1.78805E-07
残差
30
6.329122067
0.210971
总计
31
15.9196875
表7
对大气污染回归模型的显著性检验:
SUMMARYOUTPUT
回归统计
MultipleR
0.783
RSquare
0.614
AdjustedRSquare
0.565
标准误差
5.458
观测值
10
方差分析
df
SS
MS
F
SignificanceF
回归分析
1
378.673485
378.6734848
12.7097
0.007346203
残差
8
238.351515
29.79393939
总计
9
617.025
表8
F的显著性检验用以说明自变量对因变量是否有解释力,即所建的回归模型是否有意义。
由表可知,F的值远远大于SignificanceF的值,因而所选的回归模型有意义。
六、模型评价
(一)模型优点
1.用最小二乘法,将离散问题连续化:
最小二乘法(又称最小平方法)是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
2.根据问题实际需要,运用了简单的回归模型建立趋势分析系统,既保证了一定的准确性,又避免了建立精确预测系统的空间、时间复杂度;
3.利用了Excel、SPSS、Matlab[8]等数学工具,简化了模型建立过程,通俗易懂。
4.可用于建立在大量数据基础上的总体趋势分析,在分析过程中忽略了特殊点的影响,进而可反映一般趋势。
5.模型建立的方法与思路可推广到其他趋势预测问题中。
(二)模型缺点
1.模型虽然考虑到了很多因素,但为了简化模型,理想化了许多影响因素,具有一定的局限性;
2.模型使用的是北京气象站的数据,可以反映北京气候与大气污染的总体情况,对北京市个别地区可能不适用。
3.由于北京政治、经济等各方面的特殊性,模型结果也不能推广应用到到全国其他地区。
4.模型只能反映气候、大气污染的变化趋势,不能用于准确的预测。
参考文献
[1]迈克尔·阿拉贝,《气候变化》上海:
科学技术文献出版社2006.10
[2]丁一汇等,《中国气候变化——科学、影响、适应及对策研究》北京:
中国环境科学出版社,2009.3
[3]王文圣,丁晶,衡彤,向红莲.《水文序列周期成分和突变特征识别的小波分析方法》[J].工程勘察,2003,22(6):
44-49.
[4]贾俊平,何晓群,金勇进编著《统计学》北京:
中国人民大学出版社,2007.1
[5]沈伯雄等,《大气污染控制工程》北京:
化学工业出版社2007.8
[6]赵越,潘钧,张红远等.《北京地区大气中可吸入颗粒物的污染现状分析》[J].环境科学研究,2004,17(11):
67-69.
[7]刘卫国,《MATLAB程序设计与应用》北京:
高等教育出版社,2006.7
[8]郭志军,《应用Excel对一元线性回归模型的分析》,辽宁:
宁波职业技术学院学报,2009,13(5)
附录:
附录一
4-19气象情况(1978-2009年)
年份
降水量
(毫米)
平均气温
最高
最低
日照时数
平均风速
平均气压
大风日数
雨日数
(℃)
(℃)
(℃)
(时)
(米/秒)
(百帕)
(日)
(日)
1978
664.8
11.6
37.5
-14.4
2865.4
2.6
1012.8
35
64
1979
718.4
11.1
35.9
-15.4
2667.4
2.5
1012.2
33
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中央民族大学 数学 建模 选拔赛 论文格式