R语言主成分分析的案例.docx
- 文档编号:16690924
- 上传时间:2023-07-16
- 格式:DOCX
- 页数:15
- 大小:106.88KB
R语言主成分分析的案例.docx
《R语言主成分分析的案例.docx》由会员分享,可在线阅读,更多相关《R语言主成分分析的案例.docx(15页珍藏版)》请在冰点文库上搜索。
R语言主成分分析的案例
R语言主成分分析的案例
R语言也介绍到案例篇了,也有不少同学反馈说还是不是特别明白一些基础的东西,希望能
够有一些比较浅显的可以操作的入门。
其实这些之前SPSS实战案例都不少,老实说一旦用
上了开源工具就好像上瘾了,对于以前的SAS、clementine之类的可视化工具没有一点
感觉了。
本质上还是觉得要装这个、装那个的比较麻烦,现在用R或者python直接简单
安装下,导入自己需要用到的包,活学活用一些命令函数就可以了。
以后平台上集成R、
python的开发是趋势,包括现在BAT公司内部已经实现了。
今天就贴个盐泉水化学分析资料的主成分分析和因子分析通过R语言数据挖掘的小李
子:
有条件的同学最好自己安装下R,操作一遍。
今有20个盐泉,盐泉的水化学特征系数值见下表•试对盐泉的水化学分析资料作主成分分
析和因子分析•(数据可以自己模拟一份)
X2
)C3
Xd
KJ
X6
X7
1
0.4$
1444
ZS-21
an
临
2
IXftJ
14AM
2A.61
0l$1
3
5JJi
楝」
LI3
3
Mil
0J7
2SA2
26.0
0LB2
101
i
48JB7
0.3B6
14.5
s.n
2JS
阿
6
I7.9H
0J8
^7S
I7>5
3TbZ
(MW
MM
7
7.37
0-506
34刘
10.6^
B
4223
0L34
3.B
7.1
弗空
Ljl
0.97
P
(LI9
乱7
9.1
752
074
1.03
LQ
16.2H
039
3.1
5,4
L21J
L0
n
M2
IS
4J
1JM
0U7
啊
L2
1X3J1
QJ3
L6
斗点
ULI
门
5.3^8
DJZ
2.S
62
111.2
L14
1,Q7
L4
0.H8
1,763
2.WS
235.56
cm
L3
316.604
UJl?
2432
26i.4l
0J49
cm
la
3073]
0」T3
L.U7
1729
133.7
0.214
099
17
311315
0」立
1382
232
2U21
0.024
]00
ta
254.58
02V
Q砌
:
-rfi
4I0J
叮於
阿
19
Q-ZW
07*5
1J37
43K36
1.Q1
20
^DZ.446
C.04Z
0741
IM
JO9.T7
0.99
其中x1:
矿化度(g/L);x2:
Br?
103/CI;x3:
K?
103/工盐;x4:
K?
103/CI;x5:
Na/K;x6:
Mg?
102/CI;
x7:
eNa/eCl.
1.数据准备
导入数据保存在对象saltwell中
>saltwell<-read.table("c:
/saltwell.txt",header=T)
>saltwell
XIXI
1(114.JtiO25.ZlQ
U5^0.53*11AJ024.M0
1.33524.J0049.'(KJ
3jCB1037DirSTC2SLZD
4s_n7am14.50025.^00
5C4XiXiXI
25219,5100.9S
2^.0]0.9100.9*
1]JU6.JI20U.H5
Zfr.OflOHIO1.01
33322.1M09J
4
L7,9;fiO.SSD
9.7^Q|7.fl?
QJ7JQ
7
7J7O1*MO24.2801069190005«
£
d丄4Q
ASM
7JMSklOl.lLO^?
$
6.44ZQJ90
4.7W
9.1000.200J401J03
10
L«_254(H9O
3.100
JJOT(?
IJ0OJJO1.00
计
IQ一舄,0.+20
乙聊冲
4JOTU5-GQCJ-700,98
12
25.5350JZ3O
2.0M
4JD015I.8QO.3IOLDl
1?
口頤U12U
2.900
*.3t»H3.201140J.07
H2K3J49CHB
1763
223VA60.H00.98
IS0.317
1413
2.412263A1.0244S.9&
16107.J100.17J
I.&27
27Z9233.700JH0.W
17322.515OJ1;
IM
2.320282.210.024IM
192MSW0.297
ft.HK
L.4T6410.3002390.91
193[H.W>2O.2»1J
时阳
1J5?
43FJ4Q1193LOL
202DQ.4440PD4Z
0741
L.2ft6
2.数据分析
1标准误、方差贡献率和累积贡献率
>arrests.pr<-prcomp(saltwell,scale=TRUE)
>summary(arrests.pr,loadings=TRUE)
IntwitnecofcompArLenrs:
PCIPC2PCIPC*PCSPC*
PCT
Swnd«rddcviflii4n2040S1IPS0fl5*J2t>,S61S3QJJSJl0,17728-0,02614
PioponicnVaritnccC.ft0670.1784C.1514O.OM520016360.0M490.00010
CumuldiveProportion0WJ6-?
0.?
S51091650.97905099SJL0W99DI.DOODO
2每个变量的标准误和变换矩阵
>prcomp(saltwell,scale=TRUE)
^-Lmdanldr?
ialiens:
[1]10608m1.117^860.D5S1»K015J46O.33A4E22O.1T72T720.02A14]^
Rflinticin
PCIPC2PCIPC*PC5PCS
XIQ释囲时d0.5M5W85Q,£HB8434|0.53395^9Q.PH8JJ10
X20.1002JB-0.12fl2902i09Ja2J*7**0.171?
^O.OH76D-D2DI6?
U1L
XJ-0.441^7-fl.GSiSO^S-OJB01bS24-0.55343^0-0.15i605!
Ol19£OD44£7
X-t-0458M>tOO.(HI575570.1-527^574-040231030I4&2375MW9&I5L們
X5(UObfrOMU.4J&-&」対旳1L-[J/7PS4M7□.O79O269it
X*Q.4^49W41OJJSmBS€.283^120
OJiOftT12-O.J94S3Si2-0JIUJ22*』_2勢忖帖-0.1659059-0.6M72S2711
PTT
XI-C.0018643S7
X2-0.0D1522S52
JUQ怕■阳"MJ
X4-O.73S3393X(S
Xi-O.WJCM2?
^6
X«C.IS87653?
3
X7-C001295^
3查看对象arests.pr中的内容
>>str(arrests.pr)
Lmtor5
$ideY:
num[1:
7]2.06)EJ170勺阳0fi630J3B”,
$tmaudd;hUm(t:
7,L7]0J4?
或彳^0.441
.h-aor(*«"dimaatsn"J=Liiiat2
.,.£:
chf[L7]"XV"X2H^3"霜屮...
..1:
chf[LT]-per"pur*rpc」"pc丁一”
5tcnicr:
Nimcdnum|l:
7]109764fl293氏&W12*27349.8^Z...
..-4KTt*P'Mnjcr}=ihr[t:
7]^Xl"_X2"UC*._
SkiIc:
N«mcdnum{I:
7]D.13SS.781ZEIM.M2...
-Mirr”(hr【1旳"KI"*XTF"-X4"...
*:
num1120J:
7J-1.67-I.«4\
mrt*.Hdiaiiiua?
]i"卜7二曲vf2
„.S:
NULL
…ichr[1:
7]"PCI""PC2"H'PCJ'4PCT...
”artif,"cljsi">chr"precntp'
4利用主成分的标准误计算出主成分的累积方差比例
>cumsum(arrests.pr$sdevA2)/7
[1]0.60670600.78509680.91653410.97905240.99541280.9999024
1.0000000
5各个化学成分占主成分的得分
>arrests.pr$x
FCJTC2FCJ心PCS
[!
pi7.B!
297JeO1聞*日黔』弭4J隣姑帖时
PJ-Lfi$9240]J-t>.W29t91.16QH44)e*«□-D.1744DI$20.QSKHJ1:
③|£(WU笳北I』111$韻-2.567612 MJt2+^m2.7+9759tO£(JMTl却訓』仙4(醐「 [5JI.S8CJJJ54-O.J88WJ7l.67]9l7ff-OJ-C.57]]^5#ffJJl90S6|[tij4)^6550! 4)^728592-3.030Mj^-&I心。 対ML茄0JW1498J J.l£S4€? 3C |7J-4.75J2DW6.2.742A437! .i]JJHe-nO m-CJM3MSI-4.7LSU223J7169R01 PC4 [IJ0,OQ7J13n6 [2J0.028I41710015^512^1 PJ-0.152160]&0.01629«37 HJO.04BJ7M 6数据分析结果图形表示 >screeplot(arrests.pr,main="saltwell") saltwell >biplot(arrests.pr) 按第一主成分排序的结果: >data.frame(sort(arrests.pr$x[,1])) MirtJTTtsu.pr.Ji...l„ .1.88022254 -I6741*700 -I&S9244I5 -I.13辭刊M <0455133 4.(Kti33ASL OJlHa7366 0.22005394 0.2*14^770 IL711M89T fl.77537521 1.77061767 17T5OOT4? 1.8W371K 1.9653^11].9? 77ZL4? 212777B3K 2.50i4Z27t 主因子分析 计算数据的相关系数矩阵 saltwell.corv-cor(saltwell) >saltwell.cor XIX2XIX4XT XILOOOOOOOjO2^L1II]S-C.57iM®$J0.567AJ260.H4IS511-O.JRBSjU<]i1^951.A JO4)2QItai5t00000000.J725OI20_2S«2T47血14翻01』_1445W^ KI-0^704.^5027250121,41000001O^HMSOJSQffmDIWM«17』・门口2脑 JC454^11&0JSW7I7O.WfiS^LOOOOCBO(TT并邓7』#羽540理 JCS4J463He.TWiB^业巧將期71.0000040fl.41448! ! GJS1534W 叮曲础眄机(LT7T8ET业*肚&8弼LOOdOCM X~O.li&S? 3t8*344却*^.4707286-O^5«MSI59DJS35300-a.M7SUH91.000(X00 计算特征值和特征向量及因子的贡献率和累积贡献率 >saltwell.eigen<-eigen(saltwell.cor) >saltwell.eigen [)]4J.4W41M75|工冇3农$刃08^0昭雌04珂段阿阳总11赴孟64呻叩32玄21斟0位獅右丹| Ml阿tJ)l*]曰洌(.1) [1,] |2,]-C.ZDC2Z]iL12029023Q』如2M740』和*晦%12,a2jQL帖S«ltWJW皓逐忑 PJ'C.+*M__r- 1? ? D.】33W53O.! S6KM4^70石為9L67? 3 [4JQ.4fHVia^JMiJ7557 [SJO.K)34O0^Q 3C0.! WUlit4)7? 54597D«7W^eft0OTW: 7C6 |4.]乜+WfrJ刃"T*W*IAU8? »tlJJQ.2«$7I2«-4.IQL2HHO.7V93W4iyU45i7t^« [? ]C3306T2203W5M6I02U2JU5OjMMHWrfl1651IM5fl.6HT2J27! f-0.00129JM9 根据主成分分析结果确定公共因子个数. >saltwell.pr<-princomp(saltwell,cor=T) >summary(saltwell.pr) ofmtn尸mtiml CiHmp.ZCoaipJCrnnp--^Cmip.SCurap.i C-mipJ SimikmldcviiiiDii2.MOBII].1L746HA0194QdMl5K6J031M12M01772772191.6Ul^cO2 PrupunjcnofVanHEcc€.60-571□&0」7139K0.LJ1437J0.0625HIS01M&011O.OOW8%02».762l! Aflc-O5 CiDinhnvcEjBpMl皿jJMOfeCir窮《3»&8D.giWl□.^7W523&0_«5i«lJHDW902J721.(KHXOOtr^CK) 均值 >saltwell.pr$center XIX2X3K IW76B150.294KQ氐畑m皿UOl«842M>13S7I3OWIOO 标准误 >saltwell.pr$scale XImK3! UUIdX7 )30-J? 077W«.1X^73AJ飙斑Jbkf越眾風1九ft1Q1631? 2个因子的结 下面用特征值的平方根乘以相应的特征向量得到因子载荷矩阵.并且只显示前 果: >t(sqrt(saltwell.eigen$values)*t(saltwell.eigen$vectors))[,1: 2] [1Jd^|4S64Q-O.5M7S721 [ij PJ“嘟卿 [4.]-0WOWl-0.0473768^6 [5.]0.JJ5S66]^.4(^75]20 匾】-0.325^13*出^7050*$ [7J 用R语言自带的函数factanal()进行分析 >saltwell.fa<-factanal(saltwell,factors=2) >print(saltwell.fa,cutoff=0.001) Cdl: -iilfakalL(ibcian2> [血qurnMac: XIX2M3X-tX5X6X7 oMsio.oosouxac-*^0.0050.179 J_6*d已鲁* Ftdcr】Fartwi XI-fl.JW -0.1»3 X2 OJ73 OEMS X3 0.WD a.ns a.K? 5 a41} X5C52S <0.21J X& a.182 0耳H X7-C.1S1 -0.K8B T*口(itGr加恥〔肚缶皿任倍: 1呃jitsjUHd皿lhechis<]u«wsui: is[iuis42.^1tnidinuraoffreedmi.l'tiejj-vilueis9.14e-UT F面用回归方法(regression)计算因子得分并作图,然后对样本进行分类 > saltwell.fa<-factanal(saltwell,factors >saltwell.fa$scores FtddrlFu»r2 [1.1LS2IL7£J-445400554[2.]20*54 [3.i屮一丄砂3黑 [4.JL.43O2SS6-44)485040[3JI^2468904.11130601[ftjXT3J47C«<70fi7M44[? J•flJJWUL^WWAfitL開jgamxoifiuM [flj4).! 9fil0? 2<012116093400.]<43»»1<23052222[11.1_(UlU5U^jQj(Hmh2Ztl2,]XLJMr监7_^2^? 54U-1S|]J.l-皿匸山一期" -0.2rafijJ[15.]-fl.741S39Q^205W3J7U&J心梯乃(H右対倔旳$9LI7J-O.-6WM2726-O.22K25216[! 8J-O.S57044-*-O.l-3fi358]6[I9,j^.R5(U1]4-O.l肥120.)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 成分 分析 案例
![提示](https://static.bingdoc.com/images/bang_tan.gif)