定量分析考试题型docxWord文档下载推荐.docx
- 文档编号:6545732
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:32
- 大小:88.67KB
定量分析考试题型docxWord文档下载推荐.docx
《定量分析考试题型docxWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《定量分析考试题型docxWord文档下载推荐.docx(32页珍藏版)》请在冰点文库上搜索。
3.相关原则
・预测对象可能与某些事物之间有相关关系。
变量之间往往存在着一定的相关性,表现岀有一定的因果关系。
・例如计量经济学就是通过一组经济变量的分析研究,确定出原因和结果后,利用这些变量的实际统计资料建立回归分析模型,进行预测分析。
4.统计规律性原则
•由于未知因素作用之和具有不确定性,使预测对象的未来变化呈现随机变化形式,此时只能利用观测数据得出其统计规律,以一定的概率分布模型对预测对象的未来变化作出预测。
5.反馈原则(与时俱进)
・一般来说,预测值总不可能正好等于实际观测值。
两者之差就是预测误差。
误差的大小和符号说明了数学模型与实际相符合的程度,预测人员应当及时利用反馈得到的预测误左对预测模型或参数进行修正,从而减少新的预测误左。
2、仿真和模拟
蒙特卡罗模拟的概念、步骤和作用,结合实际工作谈作用。
蒙特卡洛法系指依照某种预定概率分布而随机抽样的一种模拟技巧。
这是美籍匈牙利科学家冯.诺伊曼(J.VonNeumann,1903-1957)等在第二次世界人战中,为帮助物理学家解决中子动态问题时,所提议的一种求解方法。
蒙特卡洛法又称随机模拟法或统计试验法。
它是现代数值方法中的一种重要方法。
该法把问题化成■个概率模型(例如随机向量、随机过程),使模型的若干数字特征(例如数学期望等)与所要计算的量相重合,然后用抽样试验和统计方法求这些数字特征的估值,去近似地代替所求的量,并估计其误左或方左。
•蒙特卡洛法解题的主要步骤如下:
(1)对原求解问题建立简单而易于实现的概率模型;
(2)产牛所用的各种随机变量的抽样值;
(3)进行模拟计算并估计其方差;
(4)根据计算实践,进一步改进模型,设计降低方差的方法,加速模拟结果的收敛。
结合工作蒙特卡洛法可解决以下问题:
•通过蒙特卡洛法,排队问题•般得解。
因为排队的人或物是随机地参加的,而对他(它)们
服务所需的时间也是随机的,所以往往采用随机数表以模拟不同时点的情况。
因此,假定观察表明,任何时点排队人数为1-20名,每一个人服务时间为3-5分钟,那么,任何时点排队人数的模拟可任取1-20之间的数字,然后,再和代表服务时间的3-5之间的随机数字相结合。
•如果,假定说,用这种方法模拟的有100种或更多的可能性,研究者就要有一个实样,表明整个系统是如何实际工作的。
当然,模拟应当有足够的次数方能保证实样有代表性。
•于是,研究者就测定任何人的平均排队时间或最长等候时间。
例如,车工在等候工具的过程中所引起的损失,研究者经过测定和计算,就可以同增添发放人的开支进行比较。
•至于某些无法计算损失的排队,例如,顾客因不耐久候而跑到其他地方去,则只有根据判断决定最优的办法。
但是,平均排队时间和最长等候时间仍然是作岀决定的依据。
•同样的技术也可以用于零售商的库存量问题。
在营业未可预卜的情况下,寻求一个最优库存量是最重要的关键。
在处理机器替换(更新)问题上,机器什么时候出问题是未可预卜的,一般也采用蒙特卡洛法。
蒙特卡洛法也存在着与一般模拟法类似的问题。
5种概率抽样可能性大)
3、抽样方法(10种抽样方法中选几种,描述特点。
抽样调查(samplingsurvey)
抽样方式
非概率抽样
从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数
据收集方法
(一)概率抽样(probabilitysampling)
1、根据一个已知的概率来抽取样余单位,也称随机抽样
2、每个单位被抽中的概率是已知的,或是可以计算出来的
3、最常用的概率抽样方法包括:
简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样[基本概念:
答题时不答
“随机抽样”VS“随便抽样”
•随机抽样:
在抽取样本时排除主观上有意识地抽取调查单位,使每个调查单位都有一定的机会被抽中。
・随便抽样:
带有人为的主观的因素。
•举例:
在一栋楼内抽取10位居民作样本。
“概率抽样”和“等概率抽样”
•概率抽样是指总体中的每个单位有一定的非零概率被抽中,单位之间被抽中的概率可以相
等,也可以不等。
・若相等,成为等概率抽样,不等,则称为不等概率抽样。
抽样框
・进行概率抽样必须要有抽样框
•抽样框:
包括所有总体单位的名单。
如企业名录(抽选企业)、住户门牌号码(抽选住户)。
•抽样框的作用:
提供备选单位的名单以供抽选;
计算各单位入样概率的依据。
]
(1)简单随机抽样(simplerandomsampling)
1、从总体N个单位中随机地抽取n个单位作为样本,使得总体中每一个单元都有豹同的机会(概
率)被抽中。
2、最基本的抽样方法,是其它抽样方法的基础
3、抽取元素的具体方法有童复拓徉和不重复^痒
(2)分层抽样(stratifiedsampling)
将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点
-保证样本的结构与总体的结构比较相近,从而提高估计的精度
-组织实施调查方便
-既可以对总体参数进行估计,也可以对各层的目标量进行估计
(3)系统抽样(systematicsampling)
•将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位
•先从数字1到&
之间随机抽取一个数字r作为初始单位,以后依次取严斤,严2斤…等单位
•如何抽取?
•当N不是n的整数倍,即抽样间距不是整数时,k可取一个与最为接近的整数。
注意到:
当n大于50时造成的干扰很可能是微不足道的。
•优点:
操作简便,可提高估计的精度
・缺点:
对估计量方差的估计比较困难
(4)整群抽样(clustersampling)
•将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查
•特点
・抽样时只需群的抽样框,可简化工作量
•调查的地点相对集中,节省调查费用,方便调查的实施
•缺点是估计的精度较差
(5)多阶段抽样(multi-stagesampling)
•先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若T个单位进行调查
-群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将该方法推广,使抽样的段数增多,就称为多阶段抽样
•具有整群抽样的优点,保证样本相对集中,节约调查费用
•需要包含所有低阶段抽样单位的抽样框;
同时由于实行了再抽样,使调查单位在史广泛的
范围内展开
•在大规模的抽样调查中,经常被采用的方法
2、非概率抽样(non-probab订itysampling)
•相对于概率抽样而言抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查
•有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式
方便抽样
•调查过程中由调查员依据方便的原则,自行确定入抽样本的单位
-调查员在街头、公园、商店等公共场所进行拦截调查
-厂家在出售产品柜台前对路过顾客进行的调查
容易实施,调查的成本低
•缺点:
样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体
判断抽样
•研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本
-有重点抽样,典型抽样,代表抽样等方式
•判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性
•抽样成本比较低,容易操作
•样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体
自愿样本
•被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息
•例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本
•自愿样本与抽样的随机性无关
•样本是有偏的
・不能依据样本的信息推断总体
滚血球抽样
•先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应
•适合于对稀少群体和特定群体研究
容易找到那些属于特定群体的被调查者,调查的成本也比较低
配额抽样
•先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位
•操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似
•抽取具体样本单位时,不是依据随机原则,属于非概率抽样
4、数据整理和图表展示方法(参见统计方法讲义P49-)
答:
数据的整理与显示基本问题
数据整理首先要弄清所面对的数据类型
・不同类型的数据,采取不同的处理方式和方法数据主要分为两大类:
品质型数据(包含:
顺序数据和分类数据)数值型数据
・对分类数据和顺序数据(品质型数据)主要是作分类整理
・对I数值型数据I则主要是作分组整理
•适合于低层次数据的整理和显示方法也适合于高层次的数据;
但适合于高层次数据的整理和显示方法并不适合于低层次的数据
(1)品质型数据整理和显示分为:
分类数据和顺序数据
分类数据整理的基本过程:
1.列出各类别
2•计算各类别的频数
3.制作频数分布表
4.用图形显示数据分类数据的整理——可计算的统计量
•频数(frequency):
落在各类别中的数据个数
•比例(proportion):
某一类别数据占全部数据的比值
•百分比(percentage):
将对比的基数作为100而计算的比值
•比率(ratio):
不同类别数值的比值进行频数统计的方法:
频数分布表、用“数据分析”-直方图
分类数据的图示可用:
条形图、柱状图、帕雷托图、对比条形图、饼图展示。
条形图:
•用宽度相同的条形的高度或长短来表示各类别数据的图形,
•有单式条形图、复式条形图等形式,
•主要用于反映分类数据的频数分布,
•绘制时,各类别可以放在纵轴,称为条形图(barchart),也可以放在横轴,称为柱形图(columnchart)
帕雷托图(Paretochart)
•按各类别数据出现的频数多少排序后绘制的柱形图
•主要用于展示分类数据的分布
分类数据的图示一对比条形图(side-by-sidebarchart)
•分类变量在不同时间或不同空间上有多个取值
•对比分类变量的取值在不同时间或不同空间上的差异或变化趋
饼图(piechart)
•也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形
・主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题
•绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比占360°
的相应比例确定。
[顺序型数据的整理和图示方法:
(可能不考)顺序数据的整理
(可计算的统计量)
1.累积频数(cumulativefrequencies):
各类别频数的逐级累加
2.累积频率(cumulativepercentages):
各类别频率(百分比)的逐级累加
顺序数据的频数分布表
顺序数据的图示一累计频数分布图(例题分析)
环形图(doughnutchart)
•环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示
•与饼图类似,但又有区别
-饼图只能显示一个总体各部分所占的比例
-环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为
•个环
•用于结构比较研究
•用于展示分类和顺序数据]
(2)数值型数据的整理和展示
・数据分组和数值型数据的图示
1.数据分组方法
单变量值分组
1.将■个变量值作为•组
2.适合于离散变量
3.适合于变量值较少的情况
组距分组
•将变量值的一个区间作为一组
•适合于连续变量
•适合于变量值较多的情况
•需要遵循“不重不漏”的原则
•可采用等距分组,也可采用不等距分组
组距分组(步骤)
•确定组数:
组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数
■般为5<
A'
<
15,可以按Sturges提出的经验公式确定组数斤
•确定组距:
组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最
小值及所分的组数来确定,即
组距=(最大值-最小值)十组数
3.统计出各组的频数并整理成频数分布表[组距分组(几个概念)
1.下限(lowlimit):
―个组的最小值
2.上限(upperlimit):
一个组的最大值
3.组距(classwidth):
上限与下限之差
4.组中值(classmidpoint):
下限与上限之间的中点值
注意:
确定好组距后,一般要求第一组的下限低于最小变量值,最后一组的上限应高于最大变量值。
但是,如果全部数据中的最大值或最小值与其它数据相差悬殊,按照“(最大值-最小值)/组数”确立了组距后容易出现空白组(即没有变量值的组),此时,建灰将这少数离群值(outlier)先剔出再分组。
第一组或最后一组可以写成开口组“XX以下”“XX以上”。
等距分组表包括:
上下组限重叠、上下组限间断、开口组。
4.数值型数据的图示
・分组数据:
直方图和折线图(注意横坐标轴折线)直方图(histogram)
・用于展示分组数据分布的一种图形
•用矩形的宽度和高度来表示频数分布
•本质上是用矩形的面淋表示频数分布
•在直角坐标系中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图,直方图下的总面积等于1
不能选择Parto,因为它只能用于分类数据,而此处是有大小的数值型数据,不宜按照频率高低排列。
折线图(frequencypolygon)
折线图也称频数多边形图
•是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉
•折线图的两个终点要与横轴相交,具体的做法是
-第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴
-折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布一致未分组数据
茎叶图、箱线图、
二、网络与图论(两道题)
1、利用简单网络特性,可以解决某些具体问题:
安排路线接人。
(例如巡回路线问题等。
•大街小巷的交叉点有的是奇结(T字口、二岔口、五岔口),有的是偶结(十字口、四岔口、厂形转角)。
•练习题:
如下图的网络代表一个邮递路线,数字表示弧的长短(不按比例尺)。
试找出最短路程和邮局。
E
•解:
(首先确定有几个奇结点,判断是否为连会开路或闭路图)
•图中共育A、B、C、D、F、G六个奇结,所以,必须把两对奇结联结起来,使可减少四个奇结,使网络变成连绘开路。
•联结奇结应考虑从最短距离开始,故联结FC
(2)和GD(3)。
•在传递时,应以A或B为起点,以B或A为终点,并且在DG和CF各重复行走一次,其余的路线可单行而不重复,故最短的巡回路线为:
•A-»
E-»
D-»
G-»
D->
C-»
F-»
B-»
A-»
B
•此题可变化为:
考察路线的安排,如果走完所有路线,不走重复路线,设计接人的地点。
•按照最短路程:
A-*E-*D-D-F-*CfB->
F-E->
F-*A->
在G点和F点接人,走重复路线GD和FC。
运用基本概念:
•如果■个连绘网络没有起点和终点(即起点和终点在同•个结上),称为连绘闭路网络;
始点和终点不在同一结上的连绘网络,称为连绘开路网络。
•理论证明:
连绘闭路网络的结必然全部是偶结,连绘开路网络只能有两个奇结,否则就不能连绘。
“连绘开路网络的奇结只有两个”
•如果街巷有奇结,那就要根据“连绘开路网络的奇结只有两个”的原则,把多于两个的全部奇结在交通图上用虚线一对一对地联结起来。
那么,虚线就是要走重复路(回头路)的路线。
联结原则
•如奇结超过四个时,可把奇结成对地联结起来,联结时有如下两条原则必须遵循:
•
(1)联线不得有重迭线段;
•
(2)在每一个环路中,联线的总长度不得超过环路全长的一半。
2、应用最大流最小分割法,确定瓶颈,分析提高运量问题。
例题:
运输量问题:
瓶颈
•图(11-10)代表一个铁路网,弧旁的数字表示该段铁路每日能作的单行最高运输量(以万吨计)。
请问由A到B的每日最高运输量是多少?
解决方案:
(1)最大流最小分割
•在A、B之间任何处作种种虚线,把各段铁路路线截成两段。
•从图上可知,各虚线所截断的铁路的单行最高运输之和(自左至右)分别为32、65、31、40、24,其中以65为最大,(此图还应有一条同时切割EB,DE,CD和AD虚线,切断单行运量43)24为最小。
根据“最大流最小分割”的定理,24万吨是A、B间的每日最大流。
(2)提咼运量
第一步,打破瓶颈24万吨,选择DE段增加或DB段增加7个流量,将DE和DB两段流量只合增加到31万吨。
系统最大运量为31万吨。
第二步,31万吨成为瓶颈,此后,每再提高系统流量1个单位,需要在DB增加1个流量的同时,在AD段同时增加1个单位流量。
由于AD和DB分别为系统原状态单行截断流量31、32和65、40的共享路段,突破31以后,只要此两段同时增加单位运量,系统运量就会相应增加1个单位的运量。
其他虚线截断单性运量也回相应增加,不会成为系统总运量的瓶颈。
如果每增加一个运量的费用是1亿元,在系统运量从24增加到31,需要7亿元。
而系统达到31后,每增加1个运量需要投入2个亿的资金,用来同时提高两个路段的运量。
如高目标是提高到32亿需要总投资7+2=9个亿,提高到40亿需要投入7+18=25个亿。
提高到65需要7+(65-31)*2=41个亿。
三、线性规划
用图解法(5分)和单纯型法(15分)求最优解
考题为两个变量,三个约束条件参见课本158页例题。
解:
第一步列出数学模型
1、图解法
只要图画准,很容易看出(4,2)为最优解。
2、单纯型表法:
列出数学模型,
增加松弛变量
求出基础解,X(0)={0,0,8,16,12,},Z=0
检验Cj-Zj,>
0非最优,再变形
确定旋转变量,X2代X5
求基础可行解,X(l){0,3,2,16,0}Z=9,
检验Cj-Zj,存在大于0,非最优,再变形
XI代X3
求基础可行解,X⑵{2,3,0,8,4}Z=13,
重复以上步骤
求基础可行解,X⑶{4,2,0,0,4}Z=14,
检验Cj-Zj<
0,最优解,
迭代共三次,每步检验直到Cj-Zj《0为最优
四、排队论
单线等候系统案例
•某医院急诊室每24小时内平均有96名病人就诊。
每一病人需10分钟的紧张抢救。
医院的设备次仅能处理•个病人。
描述系统内顾客平均人数(平均稠密度),排队等候平均病人数,设备闲置率,病人平均等候时间。
经过调查得出下面的参数和提高效果的措施:
假定按目前医疗水平,平均每10分钟抢救一例病人的情况,院方每起需支出100元;
倘欲缩短时间,每一例缩短1分钟需多支出10元。
.
若实现管理目标:
(1)平均等候人数减少到1/2人,问预算将受到何等的影响?
如果你是院长,如何改善服务质量?
(2)病人平均等候时间减少?
(3)病人必须等候时间W*减少多少?
解题步骤:
.
(一)医院的排队程度描述如下:
•到达率:
•服务率:
入=96/24=4人/小时
□=1/10x60=6人/小时
•服务因子:
p=X/pi=4/6=2/3
•平均稠密度(顾客平均人数):
T=p/(l-p)=2人
•正在抢救中的平均病人数:
S=p=2/3人
•排队等候的平均病人数:
Q=T-S=4/3人
•没有病人的时间比例:
p0=l-p=l/3
•病人平均等待时间:
W=Mj()i-入)=4/6(6-4)=1/3病人平均必须等待时间:
W*=T/p=2/6=l/3
•根据上述情况,平均有4/3个病人必须排队等候抢救。
(二)实现管理目标
•新目标是使排队等候的平均病人数变成
•Q=p2/(l_p)=1/2
•解方程,得服务因子p=l/2
•我们将达到这个目的所需的服务因子p=l/2代入
•pt=X/p=4/(1/2)=8人/小时故若实现管理目标,应采取以下措施:
•平均抢救时间=1/)1小时=7.5分钟,即比原来缩短2.5分钟。
每一起需多支出25元,每天多出25x96=2400元。
•但是,没有病人的时间部分为
•p()=1—p=1—1/2=50%,
•换言之,除了增加开支之外,设备闲置率也提高了1/2-1/3=1/6=16.7%。
W=Mj(h-Q=4/8(8-4)=1/8
病人必须等候时间:
W*=W/p=l/8/l/2=l/4
病人必须等候时间由1/3减少到1/4小时。
五、搏弈论(未完)
参见
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定量分析 考试 题型 docx