书签分享收藏举报版权申诉 / 20

立即下载加入VIP,免费下载

当前位置：首页 > 幼儿教育 > 幼儿读物 > 多元统计分析Word文件下载.docx

多元统计分析Word文件下载.docx

文档编号：6855734
上传时间：2023-05-07
格式：DOCX
页数：20
大小：705.25KB

多元统计分析Word文件下载.docx

《多元统计分析Word文件下载.docx》由会员分享，可在线阅读，更多相关《多元统计分析Word文件下载.docx（20页珍藏版）》请在冰点文库上搜索。

多元统计分析Word文件下载.docx

70.28

14

辽宁

22037.88

2.86

73.14

15

陕西

19165.39

2.48

75.62

16

内蒙古

18632.6

2.41

78.04

17

江西

18364.4

2.38

80.42

18

广西

18245.07

2.36

82.78

19

天津

17885.4

2.32

85.10

20

重庆

17558.8

2.28

87.37

21

黑龙江

15386.09

1.99

89.37

22

吉林

14886.23

1.93

91.30

23

云南

14869.95

93.22

24

山西

12928.3

1.68

94.90

25

贵州

11734.43

1.52

96.42

26

新疆

9550

1.24

97.66

27

甘肃

7152.04

0.93

98.59

28

海南

4044.51

0.52

99.11

29

宁夏

3150.06

0.41

99.52

30

青海

2572.49

0.33

99.85

31

西藏

1150.07

0.15

100.00

将2016各省的GDP进行排名，可以发现，经济发达的的地区主要集中在东部地区。

西部gdp的占比较小。

作出2016各省的gdp直方图如下：

作业二多元回归分析

2.1多元线性回归

2.1.1数据来源

《福建省统计年鉴-2017》

年份

商品零售价格指数y

农业生产资料价格指数x1

工业生产价格指数x2

工业生产者购进价格指数x3

固定资产投资价格总指数x4

2000

98.9

97.4

100.5

112.4

100.2

2001

98

98.7

98.1

96.7

99.5

2002

98.3

99.9

97.6

99.7

2003

99.1

101.8

100.7

106.3

101.4

2004

102.7

112.5

102.6

113.3

103.4

2005

100.6

108.1

2006

100.9

99.2

103.9

102

2007

104.3

110.3

100.8

105.9

2008

105.7

123.6

110.2

2009

97.9

93.3

95.5

93.2

2010

102.4

103.2

107.7

103.3

2011

104.8

111.8

108

106.2

2012

97.7

100.3

2013

101.1

98.4

100.1

2014

98.6

100.4

2015

97

96.1

2016

100

2.1.2模型假设

商品的零售价格会受很多因素的影响，对于影响零售价格指数y的影响现在仅考虑农业生产资料指数x1、工业生产价格指数x2、工业生产者购进价格指数x3、固定资产投资的影响x4。

2.1.3模型建立

为了大致分析y与x1、x2、x3、x4，建立y关于x1、x2、x3、x4的散点图，可以看出y与X呈现出较为明显的线性相关关系。

由此可以建立y关于x的多元线性回归模型:

运用MatlabR2017a画y关于x的散点图如下：

2.1.4模型求解和分析

运用MatlabR2017a进行多元回归分析，使用命令为:

[b,bint,r,rint,stats]=regress（y,X,alpha）

在这里y是n*1的列向量，x是n*（m+1）的矩阵且第一列向量全是1，alpha采用默认值0.05。

将Excel的数据导入Matlab运行结果截图如下：

由计算结果可得：

参数

参数估计值

置信区间

a0

11.84

[-23.7566,47.4395]

a1

0.1304

[-0.0041,0.2648]

a2

0.5429

[-0.1834,1.2961]

a3

-0.1796

[-0.3628,0.0036]

a4

0.3945

[-0.1545,0.9432]

R2=0.8699统计量观测值F=20.0540检验值p=0.0000误差方差估计=0.9995

可知y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4

以上结果的置信度为95%，R2=0.8699，F=20.0540，p=0.0000<

0.05，可知回归模型成立。

分析其杠杆残差图如下：

执行rcoplot（r,rint）

由残差图可以看出，除第二个数据外，其它数据的残差离零点都较近，且残差的置信区间均包含零点，这说明回归模型y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4能较好的符合原始数据，而第二个数据为异常点。

由模型可以看出对商量零售价格影响最大的是工业生产价格指数，工业生产价格指数每上升一个点，商品零售价格指数约上升0.5。

2.1.5逐步回归分析

运用Matlab采用逐步回归的方法对数据进行建模分析，命令为

stepwise（x，y，inmodel，alpha）

这里inmodel采取所有变量，alpha采用默认值，输如命令得到下图：

可以看出，四条线均为实线，无需对变量进行剔除，选中四条线，可以得到下图：

由图可知，模型结果同2.1.4中的模型，即：

y=11.84+0.1304x1+0.5429x2-0.1796x3+0.3945x4

2.2非线性回归

2.2.1数据来源

工业总产值

（亿元）

能源生产量

（万吨标准煤）

1981

87.76

493

1999

3479.84

1634.16

1982

95.77

522

3994.86

1654.17

1983

103.97

609

4398.08

1850.44

1984

131.11

641

5260.2

1923.4

1985

173.13

690

6616.61

1816.8

1986

205.1

724

8544.5

1805.75

1987

265.87

806

9995.89

2488.47

1988

388.85

918

11855.68

2668.15

1989

488.96

950

14425.06

2625.28

1990

531.49

966.52

17141.44

2989.93

1991

658.86

854.43

18681.48

2939.48

1992

915.51

1013.39

23805.32

3260.42

1993

1522.37

1051.43

30330.59

2802.72

1994

2128.61

1169.96

32379.94

2989.65

1995

2638.52

1396.24

36724.66

2739.76

1996

2840.51

1406.04

41579.84

2924.01

1997

3066.76

1256.3

43888.84

3566.6

1998

3218.51

1177

47275.84

4490.8

2.2.2模型假设

工业生产总值会收到很多因素的影响，技术的进步会使得能源的利用率得到提高，假设工业生产总值与能源的生产量存在着非线性关系，作工业生产总值关于能源生产量的散点图如下，运用Matlab作散点图，命令为：

scatter（x,y），得到的散点图如下：

由散点图可知，工业生产总值y与能源生产量之间x存在着非线性关系，设y与x存在着指数函数关系，即。

2.2.3模型建立

由于是二维，可运用Matlab的cftool拟合工具箱对数据进行拟合，结果如下图所示：

由拟合结果可知，R2为0.8016，拟合效果一般，SSE为1132000000，RMSE为5856，模型为：

作业三主成分分析与聚类分析

3.1数据来源

《福建省统计年鉴——2017》

固定资产投资（亿元）

GDP（亿元）

财政总收入（亿元）

工业总产值（亿元）

第一产业（%）

第二产业（%）

第三产业（%）

GDP增长率（%）

人均GDP（元）

社会消费品零售总额（亿元）

城镇居民人均可支配收入（元）

995.38

3764.54

369.67

17.02

43.26

39.73

9.3

11194

1320.80

7432

1053.84

4072.85

428.33

15.99

44.28

8.7

11691

1442.32

8313

1148.76

4467.55

476.20

5260.20

14.88

45.59

39.53

10.2

12739

1593.76

9189

1411.45

4983.67

551.00

13.90

46.97

39.13

11.5

14125

1797.76

10000

1798.38

5763.35

622.57

8544.50

13.65

48.07

38.28

11.8

16235

2062.03

11175

2241.70

6554.69

788.11

12.62

48.45

38.92

11.6

18353

2351.72

12321

2998.45

7583.85

1012.77

11.42

48.72

39.86

14.8

21105

2717.62

13753

4186.67

9248.53

1282.84

10.84

48.40

40.76

15.2

25582

3212.34

15505

5148.31

10823.01

1516.51

10.70

49.14

40.16

13.0

29755

3866.69

17961

6180.94

12236.53

1694.63

9.67

49.08

41.26

12.3

33437

4481.00

19577

8067.33

14737.12

2056.01

9.25

51.05

39.70

13.9

40025

5310.03

21781

9885.67

17560.18

2597.01

9.18

51.65

39.17

47377

6276.17

24907

12452.24

19701.78

3008.88

9.02

51.71

39.27

11.4

52763

7256.54

28055

15245.24

21868.49

3430.35

8.57

51.81

39.62

11.0

58145

8275.35

28174

18141.37

24055.76

3828.40

8.38

52.03

39.60

9.9

63472

9346.74

30722

21300.91

25979.82

4144.03

8.15

50.29

41.56

9.0

67966

10505.93

33275

23107.49

28519.15

4295.36

8.29

48.55

43.17

8.4

73951

11674.54

36014

3.2主成分分析

经济发展系统包含11个指标：

全社会固定资产投资（亿元）、全部工业总产值（亿元）、GDP总量（亿元）、财政总收入（亿元）主要反应福建省的经济规模和总量；

第一产业、第二产业和第三产业比重主要反应福建省的经济结构；

GDP增长率、人均GDP（元）、城镇居民恩格尔系数、社会消费品零售总额（亿元）主要反应福建省的经济效益。

主成分分析法是利用降维的思想，把多个指标转换为少数几个综合指标（即主成分），其中每个主成分都能够反应原始数据的大部分信息，且所含信息互不重叠。

这里，运用MatlabR2017a进行主成分分析。

首先，需要对数据进行标准化处理，采用zscore函数，结果如下：

调用princomp函数函数对标准化处理后的数据进行主成分分析，由于princomp函数不返回贡献率，需要用协方差矩阵的特征值向量latent来计算，命令为explained=100*latent/sum（latent）。

为了直观，将处理后的数据储存在元胞数组中，命令如下：

处理结果如下：

由处理结果可知，第一主成分的贡献率达到78.91%，第二主成分贡献率为14.14%，累计贡献率为93.05%，超过85%，因此，只需提取前两个主成分。

由COEEF第一、二列可知：

y1=0.3332x1+0.3386x2+0.3380x30.3384x4+0.3077x5+0.2567x6

+0.1888x7+0.0786x8+0.3387x9+0.3372x10+0.3388x11

y2=0.1332x1+0.0346x2+0.0347x3+0.0126x4+0.3106x5+0.5009x6

+0.3537x7+0.0769x8+0.0222x9+0.0.0822x10+0.0163x11

3.3聚类分析

运用Matlab对数据进行分析，这里采用分部聚类法对福建省2000——2016的经济发展进行分析，对其发展的类型作一个简单的划分。

运用分步聚类对数据进行处理，首先寻找变量之间的相似性，这里运用pdlist计算相似矩阵，过程及谱系图如下：

X为原始数据，XZ为标准化处理后的数据。

由运行结果可以看出，当距离为0时，17年的经济情况各自为一类，当距离逐渐扩大时，17年的经济数据被依次聚类。

从谱系图我们可以看出，经济情况距离最小的两年2000、2001年首先被聚为一类，选取聚类标准距离为1.4，可以将2000—2017年的经济情况划分为三类：

第一类为2000～2005年，第二类为2006～2014年，第三类为2015、2016年。

由福建省2000—2016年的gdp数据我们可以看出，福建省的经济逐年增长，通过聚类分析，我们可以将福建省在2000—2016年的经济水平大致划分为三个阶段，由于时间跨度较小，选取的指标体系也存在一定的局限性，以及缺乏科学的评判标准，因此，对福建省的经济发展水平的阶段划分存在一定的科学性，但是，从聚类的结果来看，一定程度上可以反映出2000—2006年福建省经济发展的阶段。

作业四马尔科夫预测与线性回归

4.1数据来源

计量地理学P147.某地区1965-2014年农业收成变化的转移情况，“1”代表丰收，“2”代表平收，“3”代表歉收。

状态

1965

1966

1967

1968

1969

1970

1971

1972

1973

1974

1975

1976

1977

1978

1979

1980

4.2数据分析

运用Matlab对数据进行马尔科夫预测。

（1）求出状态转移概率矩阵

（2）对2015年农业收成状态进行预测

可以得到2005-2015年农业收成状态的概率预测值如下：

丰收

平收

签收

0.5385

0.1538

0.3077

0.3024

0.4148

0.2828

0.3867

0.3335

0.2799

0.3587

0.3590

0.2824

0.3677

0.3510

0.2813

0.3648

0.3535

0.2817

0.3657

0.3527

0.2816

0.3654

0.3529

0.3655

0.3528

（3）终极状态概率预测

由分析结果可知，丰收、平手、歉收的终极状态概率分别为：

0.3655、0.3529、0.2816，表明在经过无穷多次状态转移过后，丰收概率>

平手概率>

歉收概率。

4.2线性回归分析

4.2.1建立模型

生产I、II、III三种产品，都经过A，B两道工序加工。

设备A工序有A1、A2两台设备，B工序有B1，B2，B3三台设备。

已知产品I可在A，B任何一种设备上加工，产品II可在任一规格A设备上加工，但B工序只能在B2设备上加工，产品III两道工序只能在A2，B2设备上加工。

加工单位产品所需工序时间及其有关数据如下表所示。

应如何安排生产计划，使该厂获利最大。

解：

对产品1来说，设以A1、A2完成A工序的产品分别为X1、X2，转入B工序时，以B1、B2、B3完成B工序的产品分别为X3、X4、X5件；

对产品2来说，以A1、A2完成A工序的产品分别为X6、X7件，转入B工序时，以B1工序的产品为X8件；

对产品3来说，设以A2完成A工序的产品为X9件，则以B2完成B工序的产品也为X9。

可得：

maxZ=1.25-0.25X1+X2+2-0.35（X6+X7）+2.8-0.5X9-0.055X1+10X6-0.037X2+9X7+12X9-0.066X3+8X8-0.114X4+11X9-0.05*7X5

=0.75X1+0.79X2-0.36X3-0.44X4-0.35X5+1.15X6+1.38X7-0.48X8+0.73X9

s.t.X1+X2=X3+X4+X5

X6+X7=X8

5X1+10X6<

=6000;

7X2+9X7+12X9<

=10000;

6X3+8X8<

=4000;

4X4+11X9<

=7000;

7X5<

X1,X2,X3,X4,X5,X6,X7,X8,X9>

=0;

运用Matlab运行，建立M文件如下：

可得最优解为X1=1200,X2=230,X3=0,X4=859,X5=571,X6=0,X7=500,X8=500,X9=324

此时最大利润为1147元。

二、建立模型，并用单纯形解法解模型

现有某一江段，沿江设有两个工厂，第一个工厂每日向江中排放的污染物为20个单位，第二个工厂每日排污量为14个单位。

那些污染物在排入江中之前，曾作部分处理，每处理一个单位的污水处理费在第一个工厂为1000元，在第二个工厂为800元。

两个工厂沿江分布的位置，见图。

流经第一个工厂的河流在经过工厂以前未受污染的河流，其江水流量Q1为5M3/S，在第一个工厂到第二个工厂之间又有一小支流汇入，其流量Q2为2M3/S。

也未受污染。

另外，第一个工厂排入江中的污染物在未到第二个工厂以前由于自净作用而自净掉20%。

按国家城乡环保部的规定这条江对污染物的允许含量不得超过2个单位，既要满足江河的防治污染标准，又要使两个工厂因处理污水而花费的经费最少。

试问这两个工厂需要处理的污水单位是多少？

▲工厂1▲工厂2

Q1

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 多元统计分析

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：多元统计分析Word文件下载.docx
链接地址：https://www.bingdoc.com/p-6855734.html

多元统计分析Word文件下载.docx

热门标签