数理统计课程设计.docx
- 文档编号:9004627
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:19
- 大小:129.66KB
数理统计课程设计.docx
《数理统计课程设计.docx》由会员分享,可在线阅读,更多相关《数理统计课程设计.docx(19页珍藏版)》请在冰点文库上搜索。
数理统计课程设计
课程设计
第六题
刘洋
2013215028
数学与应用数学
(2)班
谭长春
2015年12月6日
设计
题目
第六题
成绩
课
程
设
计
主
要
内
容
应用相对排名成绩重复第六题:
相对排名
;
将所有成绩按照相对排名重新计算之后再做下面的高考总成绩、各学期平均成绩之间的相关性分析,计算相关系数;(画散点图、表格等文字分析)
指
导
老
师
评
语
签名:
20年月日
数理统计课程设计
——第六题
1.数据读取
对于第六题,我采用matlabR2012b为编辑程序解题的工具。
由于个人电脑上读取表格文件的xlsread函数无法使用,因此我将表格中的数据复制到文本文档中,使用importdata函数对数据进行读取。
数据读取之后,对两个专业的学生成绩进行判断,其中有部分省市的高考不分文理科,故需要将该部分的综和成绩记为文理科成绩之和;部分省市高考语文等单科学分超过150分,需要将之化为150分制;部分同学在大学几个学期内成绩数值为空或产生错误为X14等,我皆认为该名同学没有选修该科课程;在计算平均分时,我采用以学分为权的加权平均数作为该学期排名的依据(所有课程学分以教学计划为准,有部分课程学分值可能不准确但不影响结果)。
2.分析数学专业
由程序计算得到数学专业的高考成绩与其他七个学期的相关系数如下图所示:
图1:
数学专业的高考与各学期的相对排名的相关系数矩阵
其中1表示高考成绩,2-8分别表示第1-7学期。
由上图可知:
在数学专业的八次考试中,每两学期之间的相关系数均为正值,可见每两个学期之间均成正相关关系;而高考成绩与大学时期各学期的成绩的相关系数最高也不超过0.25,可见高考成绩与大学成绩之间相关性较弱;而除了高考之外的大学七个学期两两之间的相关系数平均都超过0.75,可见大学各学期的排名之间的相关性较强。
另外鉴于可能相邻的两次考试之间的关联性可能较高,我们选出高考与第一学期、高考与第三学期、第二学期与第三学期、第四学期与第六学期的相对排名之间的差异做出以下各图:
图2:
数学专业高考与第一学期相对排名之差图3:
数学专业高考与第三学期相对排名之差
图4:
数学专业第二学期与第三学期相对排名之差图5:
数学专业第四学期与第六学期相对排名之差
由上述四图也可以很容易得到高考与各学期之间的相对排名相差较多,但大学期间相对排名变化不大。
3.分析信息专业
与对数学专业的处理方法一样,对于信息专业的成绩进行处理:
图6:
信息专业的高考与各学期的相对排名的相关系数矩阵
同样,1表示高考,2-8分别表示第1-7学期。
在上图中,我们可以发现:
与数学专业相同,信息专业同学的成绩中,高考与大学各学期的成绩相对排名相关性较差,而大学各学期之间的相对排名的相关性较强。
同样,我们考虑高考与第一学期、高考与第三学期、第二学期与第三学期、第四学期与第六学期的相对排名之间的差异做出以下各图:
图7:
信息专业高考与第一学期相对排名之差图8:
信息专业高考与第三学期相对排名之差
图9:
信息专业第二学期与第三学期相对排名之差图10:
信息专业第四学期与第六学期相对排名之差
在上图9中,有一点的相对排名的变化额度超过了0.6,经过查询原成绩表格,发现该名同学只有高考与第一学期的成绩,推测可能退学了等其他原因,在去掉该学生之后,大体结论与数学专业得到的结论相同。
4.高考成绩与单科的相关性分析
我选取高考总成绩与解析几何、中国近现代史纲要和数学建模与实验这三门单科之间的相关性进行分析,得到相关系数如下表所示:
表1:
高考与各科的相关系数
相关系数
解析几何相对排名
中国近现代史纲要相对排名
数学建模与实验相对排名
高考相对排名
0.3090
0.1735
0.0878
我们可以认为高考成绩与大学四年的绝大多数成绩的相对排名之间均为较弱的正相关关系。
5.程序
1)程序shuxue:
%%数学专业
%%总体成绩数据
sxdata=importdata('6.1.txt');
%%高考成绩排名
sxgk=sxdata(:
1:
5);%读取高考成绩
s=size(sxgk);
fori=1:
s
(1)
ifisnan(sxgk(i,5))~=1
sxgk(i,4)=sxgk(i,4)+sxgk(i,5);%部分省份不分文理科,文理综合成绩相加
end
ifsxgk(i,1)>150%部分省份总分为750分
sxgk(i,1)=sxgk(i,1)/750*150;
end
ifsxgk(i,2)>150
sxgk(i,2)=sxgk(i,2)/750*150;
end
ifsxgk(i,3)>150
sxgk(i,3)=sxgk(i,3)/750*150;
end
ifsxgk(i,4)>300
sxgk(i,4)=sxgk(i,4)/900*300;
end
end
k=0;
xgd=zeros(1,1);
fori=1:
s
(1)
ifsxgk(i,4)<50%部分成绩中的数发生丢失,原本255丢失数据化为25
sxgk(i,4)=inf;
k=k+1;
xgd(k)=i;%需要改动的行数
end
end
a=sxgk(:
1);b=sxgk(:
2);c=sxgk(:
3);d=sxgk(:
4);
aa=sort(a);bb=sort(b);cc=sort(c);dd=sort(d);
fori=1:
k
a1=find(aa==sxgk(xgd(i),1));
b1=find(bb==sxgk(xgd(i),2));
c1=find(cc==sxgk(xgd(i),3));
pj=(a1
(1)+b1
(1)+c1
(1))/3;%按其他三门课的平均排名得到数据丢失的课的分数
sxgk(xgd(i),4)=(dd(ceil(pj))+dd(floor(pj)))/2;
end
clearabcdaabbccdda1b1c1d1pjxgd
sxgk(:
5)=sxgk(:
1)+sxgk(:
2)+sxgk(:
3)+sxgk(:
4);%高考总分
fori=1:
s
(1)
k=1;
forj=1:
s
(1)
ifsxgk(i,5) k=k+1;%每找到一个总分比其高的,其排名加1 end end sxgk(i,6)=k;%绝对排名 sxgk(i,7)=1-(k-1)/s (1);%相对排名 end %%各学期的平均成绩 sz=[7,14,16,24,26,33,35,41,43,51,53,57,59,64]; sxxq=cell(7,1); fori=1: 7 sxxq{i}=sxdata(: sz(2*i-1): sz(2*i)); end sxxf{1}=[5.5,4,3,1,3,1.5,2,1.5]; sxxf{2}=[5.5,4,4,3,3.5,3,3,1.5,0]; sxxf{3}=[5,4,3,1,1,2,1,0]; sxxf{4}=[3,4,3,3,1,2.5,0]; sxxf{5}=[1,0,3.5,2.5,3,3.5,0,2.5,3]; sxxf{6}=[3.5,2,0,2,2]; sxxf{7}=[0,6,3,3.5,3.5,3.5];%七学期各课程的学分(有些不知道的均以2学分代替) s=cell(7,1); forkk=1: 7 s{kk}=size(sxxq{kk}); fori=1: s{kk} (1) forj=1: s{kk} (2) ifisnan(sxxq{kk}(i,j))==1 sxxq{kk}(i,j)=0;%若该项成绩为NaN,认为其没有选修,记为0分,并且不计入平均分 end end end sxxq{kk}(: s{kk} (2)+1)=0; fori=1: s{kk} (1) wxf=0; forj=1: s{kk} (2) ifsxxq{kk}(i,j)~=0 sxxq{kk}(i,s{kk} (2)+1)=sxxq{kk}(i,s{kk} (2)+1)+sxxq{kk}(i,j)*sxxf{kk}(j);%总成绩 wxf=wxf+sxxf{kk}(j);%总学分 end end sxxq{kk}(i,s{kk} (2)+1)=sxxq{kk}(i,s{kk} (2)+1)/wxf;%获取每个人的学期平均成绩 end fori=1: s{kk} (1) k=1; forj=1: s{kk} (1) ifsxxq{kk}(i,s{kk} (2)+1) (2)+1) k=k+1;%每找到一个均分比其高的,其排名加1 end end sxxq{kk}(i,s{kk} (2)+2)=k;%绝对排名 sxxq{kk}(i,s{kk} (2)+3)=1-(k-1)/s{kk} (1);%相对排名 end end clearijkkksszwxfsxxf %%相对排名汇总 sxxdpm(: 1)=sxgk(: 7);%高考成绩的相对排名 fori=2: 8 sxxdpm(: i)=sxxq{i-1}(: end); end cleari %%绘图、制表、求相关系数 a=1: 85; sxr=zeros(8,8); fori=1: 8 sxr(i,i)=1; forj=1: 8 ifj>i plot(a,sxxdpm(: i)-sxxdpm(: j))%画出第i次与第j次考试间的相对排名之差的图像 figure%重新画出一张新图 A=cov(sxxdpm(: i),sxxdpm(: j)); sxr(i,j)=A(1,2)/sqrt(A(1,1)*A(2,2));%相关系数矩阵 sxr(j,i)=sxr(i,j); end end end clearAaij 2)程序xinxi: %%信息专业 %%总体成绩数据 xxdata=importdata('6.2.txt'); %%高考成绩排名 xxgk=xxdata(: 1: 5);%读取高考成绩 s=size(xxgk); fori=1: s (1) ifisnan(xxgk(i,5))~=1 xxgk(i,4)=xxgk(i,4)+xxgk(i,5);%部分省份不分文理科,文理综合成绩相加 end ifxxgk(i,1)>150%部分省份总分为750分 xxgk(i,1)=xxgk(i,1)/750*150; end ifxxgk(i,2)>150 xxgk(i,2)=xxgk(i,2)/750*150; end ifxxgk(i,3)>150 xxgk(i,3)=xxgk(i,3)/750*150; end ifxxgk(i,4)>300 xxgk(i,4)=xxgk(i,4)/900*300; end end xxgk(: 5)=xxgk(: 1)+xxgk(: 2)+xxgk(: 3)+xxgk(: 4);%高考总分 fori=1: s (1) k=1; forj=1: s (1) ifxxgk(i,5) k=k+1;%每找到一个总分比其高的,其排名加1 end end xxgk(i,6)=k;%绝对排名 xxgk(i,7)=1-(k-1)/s (1);%相对排名 end %%各学期的平均成绩 sz=[7,15,17,25,27,34,36,43,45,54,57,64,66,70]; xxxq=cell(7,1); fori=1: 7 xxxq{i}=xxdata(: sz(2*i-1): sz(2*i)); end xxxf{1}=[1,4,3,5.5,0,3,3,1.5,2]; xxxf{2}=[5.5,4,4,3.5,3,2.5,0,3,1]; xxxf{3}=[5,3,3,1,2.5,0,2,1]; xxxf{4}=[4,3,3.5,4,2.5,0,3.5,1]; xxxf{5}=[4,3,3.5,3,3,3,4,3,0,3.5]; xxxf{6}=[2.5,3,2,2.5,3,2.5,2.5,0]; xxxf{7}=[0,6,3.5,2,0];%七学期各课程的学分 s=cell(7,1); forkk=1: 7 s{kk}=size(xxxq{kk}); fori=1: s{kk} (1) forj=1: s{kk} (2) ifisnan(xxxq{kk}(i,j))==1 xxxq{kk}(i,j)=0;%若该项成绩为NaN,认为其没有选修,记为0分,并且不计入平均分 end end end xxxq{kk}(: s{kk} (2)+1)=0; fori=1: s{kk} (1) wxf=0; forj=1: s{kk} (2) ifxxxq{kk}(i,j)~=0 xxxq{kk}(i,s{kk} (2)+1)=xxxq{kk}(i,s{kk} (2)+1)+xxxq{kk}(i,j)*xxxf{kk}(j);%总成绩 wxf=wxf+xxxf{kk}(j);%总学分 end end ifwxf==0 xxxq{kk}(i,s{kk} (2)+1)=0; else xxxq{kk}(i,s{kk} (2)+1)=xxxq{kk}(i,s{kk} (2)+1)/wxf;%获取每个人的学期平均成绩 end end fori=1: s{kk} (1) k=1; forj=1: s{kk} (1) ifxxxq{kk}(i,s{kk} (2)+1) (2)+1) k=k+1;%每找到一个均分比其高的,其排名加1 end end xxxq{kk}(i,s{kk} (2)+2)=k;%绝对排名 xxxq{kk}(i,s{kk} (2)+3)=1-(k-1)/s{kk} (1);%相对排名 end end clearijkkksszwxfxxxf %%相对排名汇总 xxxdpm(: 1)=xxgk(: 7);%高考成绩的相对排名 fori=2: 8 xxxdpm(: i)=xxxq{i-1}(: end); end cleari %%绘图、制表、求相关系数 a=1: 81; xxr=zeros(8,8); fori=1: 8 xxr(i,i)=1; forj=1: 8 ifj>i plot(a,xxxdpm(: i)-xxxdpm(: j))%画出第i次与第j次考试间的相对排名之差的图像 figure%重新画出一张新图 A=cov(xxxdpm(: i),xxxdpm(: j)); xxr(i,j)=A(1,2)/sqrt(A(1,1)*A(2,2));%相关系数矩阵 xxr(j,i)=xxr(i,j); end end end clearAaij 3)程序danke: %%在运行完shuxue与xinxi两个程序后运行该程序 gkf(1: 85)=sxgk(: 5);%数学专业高考成绩 gkf(86: 166)=xxgk(: 5);%信息专业高考成绩 ls=sort(gkf); gk=zeros(166,1); fori=1: 166 aa=find(ls==gkf(i)); gk(i)=167-aa (1);%高考排名 gk(i)=1-(gk(i)-1)/167;%相对排名 end clearlsaa %%考虑高考成绩与解析几何之间的相关性 sff(1: 85)=sxxq{1}(: 3); sff(86: 166)=xxxq{1}(: 3);%读取解析几何成绩 ls=sort(sff); sf=zeros(166,1); fori=1: 166 aa=find(ls==sff(i)); sf(i)=167-aa (1);%解析几何排名 sf(i)=1-(sf(i)-1)/167;%相对排名 end clearlsaa A=cov(gk,sf); r1=A(1,2)/sqrt(A(1,1)*A(2,2)); clearA %%考虑高考成绩与中国近现代史纲要之间的相关性 sjf(1: 85)=sxxq{3}(: 6); sjf(86: 166)=xxxq{3}(: 7);%读取中国近现代史纲要成绩 ls=sort(sjf); sj=zeros(166,1); fori=1: 166 aa=find(ls==sjf(i)); sj(i)=167-aa (1);%中国近现代史纲要排名 sj(i)=1-(sj(i)-1)/167;%相对排名 end clearlsaa A=cov(gk,sj); r2=A(1,2)/sqrt(A(1,1)*A(2,2)); clearAsjfsj %%考虑高考成绩与数学建模与实验之间的相关性 sjf(1: 85)=sxxq{6}(: 4); sjf(86: 166)=xxxq{6}(: 3);%读取数学建模与实验成绩 ls=sort(sjf); sj=zeros(166,1); fori=1: 166 aa=find(ls==sjf(i)); sj(i)=167-aa (1);%数学建模与实验排名 sj(i)=1-(sj(i)-1)/167;%相对排名 end clearlsaa A=cov(gk,sj); r3=A(1,2)/sqrt(A(1,1)*A(2,2)); clearA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 课程设计