1、毕业设计节理产状的动态聚类分析以及最大距离法统计方法的研究成绩: 题目节理产状的动态聚类分析以及最大距离法统计方法的研究专 业: 构造地质学 姓 名: 学 号: 班 级: 节理产状的动态聚类分析以及最大距离法统计方法的研究摘要:裂隙岩体内的节理往往是变化的, 有时甚至变化很大。 测得大量节理 产状以后, 对其分组是一项基础性的工作, 但是如何分组目前还没有很好的理论 和方法。采用动态聚类分析的方法, 将节理产状的样本数据划分为不同的簇, 通 过不同簇的概率模型计算及其簇心的分布特性比较说明了簇数分类的适度性。 形 成了解决这类问题的系统实用的方法。 又提出了一种合理、 科学和简便的节理统 计方
2、法最大距离法。其主要思路是对野外采集的节理产状数据做最优分组 , 使组间距离最大 ,而组内距离最小。该方法逻辑简单、明了 ,操作过程简便 ,而且能 有效地剔除原始数据中误差较大的数据 ,结果精确。通过应用 ,表明该统计方法正 确、可靠。关键词:节理产状;聚类分析;最大距离方法;地质统计。1 引言岩体中的节理裂隙系统往往由几个产状不同的节理组合成的, 在野外测得的 节理的倾向和倾角一般而言都是变化的, 有的甚至变化很大, 在测得大量节理的 产状后,对大量的数据进行分组或分类是一项基础性的工作。在实际的工程中, 有关学者用统计学的方法对岩石裂隙岩体围岩分类、 岩体裂化程度、 岩体裂隙分 形技术及岩
3、体裂隙的几何参数概率模型进行了研究, 本文不考虑地理空间的相关 性,将样本数据看作是相互独立的, 用统计学中 k 均值聚类分析的方法对节理分 组。聚类分析是统计学上研究分类问题的一种方法, 它的任务是把所有的样本数 据分配到若干的簇, 使得同一个簇的样本数据聚集在簇中心的周围, 它们之间距 离比较近, 而不同簇样本数据之间的距离比较远。 但如何评判节理的分组是否合 理?评判的依据又是如何?目前还没有很好的理论和方法。 本文的目的就是结合 工程意义,用 k 均值聚类分析的方法,将节理产状的样本数据划分为不同的组。用系统聚类法聚类,样品一旦划到某个类以后就不变了, 这要求分类的方法比较 准确,另一
4、方面系统聚类法要存贮距离矩阵, 尤其当研究的样品较多时,需占用 很多的存贮单元,计算方法中的迭代法德思想给我们以启发, 能否先给一个粗糙 的初始分类,然后用某种原则进行修改,直至分类比较合理为止。采用这种思想 产生的聚类法叫做动态聚类法。选择凝聚点 一A初始分迩一 分炎9習作理 皿终分类 不合理计算新(沟凝聚点| 修改分类 图i.i动态聚类分析流程图动态聚类分析的计算步骤(1) 首先随机指定k个簇中心,用欧氏距离计算每个样本数据距簇中心的 距离;(2) 将每个样本数据分配到距它最近的簇中心,得到 k个簇;(3) 分别计算各簇中所有样本数据的均值,把它们作为各簇新的簇中心;(4) 重复计算步骤(
5、2)和步骤(3)直到k个簇中心的位置都固定,簇的 分配也固定,簇中心是它的均值。2 SAS软件编程本文选取了,在野外选取的20组节理的产状作为实验的数据,运用 sas软件,做了动态聚类分析,得出了一下的结果。2.1 Sas软件程序title;goptions ftext=宋体;data d20;input group $ x1-x2; cards;1127 92240 12350 94306 105192 116149 97237 13819 129330 81016 1211199 101299 713264 1014232 261515 121689 717333 818176 10193
6、44 72099 7Jproc print data=b20;run;proc standard mean=0 std=1 data=d20 out=sta20; var x1-x2;run;proc fastclus data= sta20 out=out20 maxc=4list; var x1-x2;id group; run;proc sort data=out20;by cluster;run;proc print data=out20;var group cluster DISTANCE;run;proc candisc data=out20 out=can20;var x1-x2
7、;class cluster;run;proc plot data=can20;plot can2*can1=cluster;run;quit;22 sas程序得出的部分图表见附图2.3 分析结果通过动态聚类分析,将 20 组数据分别分为 2 类,3 类,4类数据,得出分为 4 类是较合理的分类。其中第 14 组数据单独为一类的分类较不合理,可能是野 外数据采集时引起的观测数据的不合理, 并不符合节理的发育特征受到区域性的 应力场影响的原则。 所以将数据剔除。 最终得到的结果是分为三类。 进行了与前 人所做的该地区的节理面产状等密度图分析。 分为三类符合当地的实际情况。 由 于该地区早期受到了
8、北 -西向的应力场的作用,发育了较多北西向或者正北倾向 的节理,即分类中有 9 个节理分到了一类当中。图2.1节理面产状等密度图3最大距离法统计方法最大距离法的基本原则是使分组后的节理组间距离最大,而组内距离最小。 现以节理倾向为例,介绍最大距离法的数学模型 :设有n个节理,按其倾向从0360排列。以X表示节理倾向,X i表示第i个节理的倾向。用i,j 表示由第i个节理至第j个节理终止的节理组,其中K ij n。组间距离以S e=(S j+1-X j)表示,即组间距离为相邻两组中前一组最小值与后一组最大值之差。组 内距离用组内极差d(i,j)=X j-X i表示。n个节理倾向总极差S总=X n
9、-X 1,为一常数。设n个节理被分为k组,以 X k,0和Xk,1分别表第k组节理中第1个和最后一个节理的倾向。则内距离 差和为S 组内=(X n-X k,0)+(X k-1,1-X k-1,0)+ +(X 1,1-X 1)组间距离和为S 组间=(X k,0-X k-1,1)+(X k-1,0-X k-2,1)+(X 2,0-X 1,1)S 组内 +S 组间=(X k,0-X k-1,1)+(X k-1,0-X k-2,+ +(X 2,0-X 1,1)+(X n-X k,0)(X k-1,1-X k-1,0)+(X 1,1-X 1)=S 总因此当S组间最大时,S组内最小。由于组间距离为相邻节理
10、倾向之差,女口果把n1个(Xi+1-Xi)(1 in -1)按从大到小排列,把个节理分成k组只需找前k-1个(X i+1-X i)所对的X i作为分组点即可。用最大距离法进行节理统计,整个过程可由电子表格 Microsoft Excel,Micrsoft Access完成,操作非常简便。也可选取不同的统计量,做成柱状图、饼状 图等,使结果更加清晰。现以某地一个测量点上得到的节理产状资料 3为例(表1),用最大距离法对该节理根据其倾向分组。操作过程如下(1)对节理按倾向由小到大排序(2)计算排序后相邻节理倾向之差(3)对上一步计算出来的差按从小到大排序(4)剔除误差较大的数据,并找出最大距离,对
11、节理进行分组(5)选择一定的统计量,计算并作图。倾向倾角相邻两组的差值3447333&42330839306103326410312401228237132723226241991 10_ 241981122_ 1761022149911127910997589738973509阖191211612.115120图3.1节理数据图3.2第一分组点左右的节理产状柱状图图3.3第二分组点左右的节理产状柱状图图3.3第三分组点左右节理产状柱状图可得2个最大距离(42 , 39 ),将该区节理根据其倾向分为 3组。取?值 为25,由于已分组的3组组内极差均在25以内,故本区节理仅有3组。计 算每组节理
12、倾向的平均方位,分别为 64, 188, 300。其对应的频度百分比为30%,45%,25%。比较符合前面所做的动态聚类的分析结果4结论(1) 本文聚类分成的四簇时,通过 sas程序所做的检验,是比较好的分类 方法。在结果上结合实际,剔除了一组数据。得到最终的分类。(2) 簇分得太多会使样本数据在簇内的分布不连续(3) 聚类的簇数据较少时,一般需要50个左右的数据,动态聚类分析得出 的结果并不是十分的准确,用最大距离法得出的结果更贴合实际。 但是当样本数 据较多时,动态聚类分类方案更为准确。附图:The FASTCLUS ProcedureReplace=FULL Maxcluters=4 M
13、axi ter31Initial SeedsClusterxlx210,5135143193.76009591420.00327453-OJ088130853-1.4692722860.37480055741.536888050-0.834233493ClusterL i st i ng.DistancefromObsgroupClusterSeed1120.41522323230.97200.58014545420,4695D.4047S620,2935112LQ352g98834GJ895D.062510103D.11S111112D.286112122QJ949The FASTCLUS
14、ProcedureRep Iace=FULL Radius=0 iaxclusters=4 Maxiter=1Cluster Listi隧Distance fromObsI roupClusterSeed131340.7237141410151530.2031161620.9633171740.0744181820.1225191940.3348202020.8949CriterionBased onFinal Seeds =0.3930r!htAr SummaryClusterFrequencyRMS Std Deviat ionM&ximun Distanee from Seed to O
15、bservationRadius ExceededNearest ClusterDistance Between Cluster Centroids11034.03712100.51501.035231.3101340.27840.590121.3101ObsgroupCLUSTERDISTANCE1120.415242220.871963330.590074440.469475520.404706620.233537721.035168830.189469940.06253101030.19913111120.28610121220.89487131340.72368141410.00000
16、151530.20307161620.96325171740.07442181820.1224B191940.33477202020.89487.ClusterFrequtneyThe FASTCLUS ProcedureRteplace=FULL RadiusOl Maxclusters-4 Waxiter1Distance GelweenCfcusttr CentroidsRMS Sid Deyi ali cnCluster SunhiAryMax itmdm Distftrce from Seed to ObstrvAt i onRadiusExceededNeftrtst Cluste
17、r450J23721.4802Statisties for 阪iableVariableTotal STDWithin STDR-ScKiar&RSQ/(1-RSQ)xlLOO&C0,41354G.S51773x2f.OOOOC0.446070.S324SE;4.967860OVER-ALLi.oonafl乩 433(11C.fi42lC75.333403PseudoF Stfttistlc 二28.44ApprtMtiKale Expected Over-ril I R-Squared = Q.82545Cubic Cluster inc Cr iterion - Q JB4ffARNTNE
18、: The two vaIues above are invalid fcr correlated variables.圉:Can2*Canl.捋昙县 CLUSTER 的佰.Can?44 44-Car.l参考文献:1章荣岫节理等角度统计法J.桂林冶金地质学院报,1989,9(2):219-222.2王青节理裂隙统计方法研究J.勘察科学技术,1992,(2):27-31.3孙宪春等.节理产状分组的k值聚类分析及其分组结果的费歇尔分布验 证法J.岩土力学,2008, 29,533-536.4范雷等.节理岩体结构面产状的动态聚类分析 J.岩土力学,2007,28(11): 2406-2410.5徐云峰等 .一种简便的节理统计方法 J. 地质找矿丛论, 2003( 12):18 24):262-265.