书签分享收藏举报版权申诉 / 27

立即下载加入VIP,免费下载

当前位置：首页 > 幼儿教育 > 幼儿读物 > 第九章博弈论.docx

第九章博弈论.docx

文档编号：15782580
上传时间：2023-07-07
格式：DOCX
页数：27
大小：92.92KB

第九章博弈论.docx

《第九章博弈论.docx》由会员分享，可在线阅读，更多相关《第九章博弈论.docx（27页珍藏版）》请在冰点文库上搜索。

第九章博弈论.docx

第九章博弈论

内容提要

一、博弈论概述

1.博弈论及其基本概念

博弈论研究人与人之间相互“斗智”的形式和结果。

当经济主体之间的利益存在冲突时，每一方所获得的利益不仅取决于自己采取的行动，也取决于其他各方采取的行动或对自己行动的反应。

简单地说，博弈论主要研究决策主体在给定信息结构下如何决策以达到效用最大化和不同决策主体之间决策的均衡。

博弈论的基本概念包括：

一是参与者或局中人。

二是策略和策略空间。

策略是在给定条件博弈中，局中人完整的一套相机行动方案。

局中人可选择的策略的全体构成了策略空间（或策略集）。

三是支付函数与支付矩阵。

博弈论中，可用数值表示各局中人从博弈中所获得的收益或效用水平，该数值称为支付。

支付依赖于各个局中人所作出的策略，这种收益与策略的依赖关系构成了支付函数。

参与博弈的多个局中人的收益可用一个矩阵或框图表示，这种矩阵或框图叫做收益矩阵。

除此之外，博弈论中的基本概念还包括：

行动、信息、结果和均衡。

它们关系是：

行动是局中人的决策变量；信息是局中人在进行博弈时有关其他局中人的特征和行动的知识；结果是博弈分析者感兴趣的要素的集合；均衡是所有局中人的最优策略或行动的集合。

2.博弈类型

博弈论总体上可分为合作博弈和非合作博弈。

两者的区别在于局中人在博弈过程中能否达成一个有约束力的协议。

如果不能，则为非合作博弈。

非合作博弈是现代博弈论的研究重点。

合作博弈强调的是集体主义，是团体的公平和效率；而非合作博弈则强调个人理性、个人最优决策，其结果有时有效率，有时没有。

根据局中人行动的先后顺序，博弈论可分为静态博弈和动态博弈。

前者指在博弈中，局中人同时选择行动或虽然不是同时但后行动者不知道先行动者所采取的行动；后者是指局中人的行动具有先后顺序，且后行动者可观察到先行动者所选择的行动。

根据局中人对有关其他局中人的特征、策略空间及支付函数的了解，博弈论可分为完全信息博弈和不完全信息博弈。

前者是指在博弈中，每一个局中人能对所有其他局中人的特征、策略空间和支付函数有准确的了解；而后者是指在博弈中，有局中人不能对其他局中人的特征、策略空间和支付函数有准确的了解。

在动态博弈中，轮到行动的博弈方若完全了解此前对方的行动，则称之为具有完美信息的动态博弈，如下棋；否则，就是不完美信息的动态博弈，其结果只能是概率期望。

把以上两个角度交叉结合，可得到四种博弈类型：

完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈（表9-1）。

3.最小最大值（或最大最小值）策略

在两人博弈中，不管对方采取何种策略，局中人先从收益矩阵中找出自己的每一种策略下至少可以获得的收益（即所能获得的最小收益），然后从这些最小收益策略中选择收益最

大的策略，这种策略叫做最小最大值策略，与之相反的策略叫做最大最小值策略。

表9-1博弈的分类及对应的均衡

静态

动态

完全信息

完全信息静态均衡

纳什均衡

完全信息动态均衡

子博弈精炼纳什均衡

不完全信息

不完全信息静态均衡贝叶斯纳什均衡

不完全信息动态均衡

精炼贝叶斯纳什均衡

、完全信息静态博弈

1.占优策略均衡

在博弈中，占优策略是指一个局中人的最优策略不依赖于其他局中人的策略选择。

如果所有的局中人都有占优策略存在，则博弈将在所有局中人的占优策略基础上达到均衡，这种均衡被称为占优策略均衡。

表9-2囚徒困境

囚徒B

坦白

抵赖

囚徒A

坦白

10，10

0，20

抵赖

20，0

1，1

囚徒困境是博弈论中的经典例子，如图9-2。

从图中可以看出，坦白是犯罪嫌疑人A的

占优策略，同样也是犯罪嫌疑人B的占优策略。

因而，“A坦白，B坦白”就是占优策略均

衡。

但在大多数博弈中，占优均衡并不存在。

尽管如此，在有些博弈中仍可运用占优的逻辑找出均衡。

其方法是：

先找出某一局中人的严格劣策略，将它剔除，并重新构造一个不包括

已剔除策略的新博弈；然后重复这一过程，直至剩下唯一的局中人策略组合为止。

这个唯一

的策略组合，就是该博弈的均衡解，它被称为重新剔除的占优策略均衡。

2.纳什均衡

纳什均衡是完全静态博弈解的一般概念，它是指所有局中人的最优策略所组成的一个策

略组合，也就是说，给定其他人的策略，每个局中人都不能因单方面改变自己的策略而获利，从而也就没有任何人有积极性去打破该均衡。

容易验证，囚徒困境中的（坦白，坦白）是纳什均衡。

占优策略均衡一定是纳什均衡，但纳什均衡不一定是占优策略均衡。

纳什均衡是有条件的占优策略均衡，其条件是其局中人不改变策略。

如果其他局中人改变策略，则该局中人也要改变策略。

因而，占优策略均衡比纳什均衡更为稳定。

3.纯策略和混合策略纳什均衡

如果博弈方采取“要么做，要么不做”的策略形式，则该策略为纯策略。

而博弈方根据一组选定的概率，在两种或两种以上可能的行为中随机选择的策略，被称为混合策略。

表9-3纯策略和混合策略

游戏者B

左

右

左

右

游戏者A

上

-1，1

1,-1

游戏者A

上

2，1

0，0

下

1，-1

-1，1

下

0，0

1，2

在表9-3中，左边的博弈不存在纯策略纳什均衡。

而在右边的博弈中，不仅存在纯策略的纳什均衡，而且也存在混合策略的纳什均衡。

、完全信息动态博弈

1.子博弈精炼纳什均衡

子博弈精炼纳什均衡是完全信息动态博弈解的一般概念，它是指在每一个子博弈（包括

原博弈）上都构成一个纳什均衡的策略组合。

它要求局中人的决策在任何时点上都是最优的。

2.重复博弈

影响重复博弈均衡结果的主要因素，是博弈的次数和信息的完备性。

重复次数决定了局

中人在短期利益和长期利益之间的权衡，当博弈只进行一次时，每个局中人都只关心一次性

支付；如果博弈重复多次，局中人可能为长远利益而牺牲眼前利益。

就信息的完备性而言，当一个局中人的支付函数还不为其他人所知时，该局中人可能有积极性建立一个良好的声誉

以换取长远利益。

以产品定价为例说明博弈次数对局中人策略选择的影响，见表9-4。

表9-4产品定价博弈

局中人B

低价

高价

局中人A

低价

0,0

10，-5

高价

-5，10

5，5

在表9-4中，如果只进行一次博弈，则占优策略均衡为（低价，低价）。

而从企业的角

度看，这并不是一个理想的结局。

但在博弈重复无穷次时，若满足下列条件，将会出现相互勾结的均衡（高价，高价）。

第一，双方都采取“冷酷的策略”，即：

①从选择合作（高价）开始。

②只要对方一直选择合作（高价），便一直合作；如果对方在某一阶段博弈中选择不

合作，就将选择永远不合作。

第二，贴现因子1（r-1）（r为利率）足够大。

这意味着将

来的收益贴现后价值较大，人们对时间比较有耐心，而不是贪图眼前利益。

如果博弈重复有限次，则在最后阶段的博弈中，所有理性的局中人都会选择占优策略一—给自己的产品制定低价，从而构成与完全信息静态博弈相同的占优策略均衡。

采用逆向归

纳法，可推出：

在每个阶段博弈出现的都是一次性博弈的均衡结果，即局中人都选择占优策

略。

3.动态博弈战略行动

（1）先动优势。

先动优势是指在博弈中首先作出选择并采取相应行动的局中人可以获

得较多的利益。

斯塔克博格模型提出了这一分析范式。

在存在一个支配企业和众多小企业的产业中，首先宣布产量计划的往往是支配企业，而小企业则根据支配企业的产量计划相应地调整自己的产量，前者称为领导者，后者称为追随者。

领导者在估计追随者的反应函数的基础上做出有利于自身利益最大化的产量决策。

（2）可信威胁与承诺。

先动优势没有考虑后动者的威胁，但在通常的动态博弈中，由

于理性的博弈者善于识别它们，从而使得这种威胁是不可信的。

承诺是指当事人使自己的威

胁策略变得可信的行动。

一般地，只有当当事人在不实施这种威胁就会受到损失时，他的威

胁才会变得可信。

四、不完全信息动态博弈

1.不完全信息静态博弈

不完全信息静态博弈解的一般概念是贝叶斯纳什均衡，它是一种类型依赖型策略组合，即在给定自己的类型和其他局中人类型的分布概率的条件下，使得每个局中人的期望效用最

大化。

可用市场进入博弈进行说明，如表9-5。

表9-5市场进入博弈

潜在进入者B

高成本

低成本

默许

阻挠

默许

阻挠

垄断者A

进入

50，60

-20，0

30，100

-20，150

不进入

0，200

0，500

表9-5中，如果潜在进入者B知道垄断者A的类型（阻挠成本是低还是高），则博弈有重复剔除的占优策略均衡。

但在一般情况下，B并不知道A的类型，此时，B将遇到不确

定性下的选择问题。

B虽然不知道A的真实类型，但他知道A在两种不同阻挠成本下的选择，以及不同阻挠成本（类型）的分布概率。

设高成本的概率为x，则低成本的概率为1-x。

因此，B选择进入的期望利润为50x"20）（1—x），选择不进入的期望利润为0。

结果是，当A阻挠成本高的概率大于0.29时，进入是B的最优选择。

此时的贝叶斯纳什均衡为，B选

择进入，高成本垄断者选择默许，低成本垄断者选择阻挠。

2.不完全信息动态博弈

存在不完全信息、且局中人的行动又有先后之分的博弈被称为不完全信息动态博弈。

精

炼贝叶斯均衡是不完全信息动态博弈解的一般概念，它是指当事人要根据他所观察到的其他

人的行为来修正自己对后者类型的信念（在修正信念的过程中使用贝叶斯规则），并由此来

选择自己的行动。

同时，这也意味着每个参与者都假定其他参与者选择的是均衡策略。

具体

而言，精炼贝叶斯均衡是所有参与者策略和信念的一种集合，它满足以下两个条件：

一是给

定每个人有关其他人类型的信念的情况下，他的策略选择是最优的；二是每个人有关其他人

类型的信念都是使用贝叶斯规则从所观察到的行为中得到的。

精炼贝叶斯均衡的一个重要应

用是信号传递模型；另外，成本在精炼贝叶斯均衡中具有重要的地位，任何行动只有在负担

了一定的成本之后才是可信的。

练习题

一、选择题（选出至少一个正确答案）

1.博弈论中，局中人从一个博弈中得到的结果常被称为（）：

A.效用；B.支付；C.决策；D.利润。

2.下列关于策略的叙述哪些是正确的（）：

A.策略是局中人选择的一套行动计划；

B.参与博弈的每一个局中人都有若干个策略；

C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的；

D.策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

3.下列关于最小最大策略的叙述正确的有（）：

A.最小最大策略是一种激进策略；

B.最小最大策略是一种稳妥策略；

C.最小最大策略的合理性表现为，不管对方采取何种策略，某局中人至少可获得其每一种策略下最小收益之中的最大值；

D.最小最大策略不仅是一种稳妥策略，而且博弈的结果必然是确定的。

4.囚徒困境说明（）：

A.双方都独立依照自己的利益行事，则双方不能得到最好的结果；

B.如果没有某种约束，局中人也可在（抵赖，抵赖）的基础上达到均衡；

C.双方都依照自己的利益行事，结果一方赢，一方输；

D.（坦白，坦白）是占优策略均衡。

5.一个博弈中，直接决定局中人支付的因素是（）：

A.策略组合；B.策略；C.信息；D.行动。

6.纳什均衡与占优策略均衡及重复剔除的占优策略均衡的关系是（）：

A.占优策略均衡不一定是纳什均衡；

B.重复剔除的占优策略均衡一定是纳什均衡；

C.纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的策略组合；

D.每一个纳什均衡都是占优策略均衡或重复剔除的占优策略均衡。

7.下列有关策略和纳什均衡的叙述正确的有（）：

A.纯策略是博弈方采取“要么做，要么不做”的策略形式；

B.混合策略是博弈方根据一组选定的概率，在两种或两种以上可能的行为中随机选择的策略；

C.有些博弈不存在纯策略纳什均衡，但存在混合策略的纳什均衡；

D.有些博弈既存在纯策略纳什均衡，也存在混合策略的纳什均衡。

8.子博弈精炼纳什均衡（）：

A.不是一个一般意义上的纳什均衡；

B.和纳什均衡没有什么关系；

C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡；

D.要求某一策略组合在原博弈上都构成一个纳什均衡。

9.下列关于重复博弈的叙述哪些是正确的（）：

A.重复博弈又称为序贯博弈；

B.影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性；

C.如果博弈重复无限次，则局中人采取的针锋相对策略意味着任何一方参与人的一次性不合作将触发永远的不合作；

D.在有限次重复博弈中，若阶段博弈纳什均衡的唯一性存在，则每个阶段出现的都是一次性博弈的均衡结果。

10.在动态博弈战略行动中（）：

A.首先作出选择并采取相应行动的局中人往往可以获得更多的收益；

B.斯塔克博格模型与古诺模型对两个垄断厂商行为的分析方法及得出的结论相同；

C.一般而言，只有当局中人从实施某一威胁所能获得的总收益大于不实施该威胁所获得的总收益时，该威胁才是可信的；

D.承诺是当事人使自己的威胁策略变得可信的行动，但它也是有风险的。

11.下列有关精炼贝叶斯均衡的叙述正确的有（）：

A.精炼贝叶斯均衡是完全信息动态博弈的子博弈精练纳什均衡与不完全信息静态博弈

的贝叶斯（纳什）均衡的结合；

B.精炼贝叶斯均衡需满足的条件之一是，在给定每个局中人有关其他人类型的信念的情况下，他的策略选择是最优的；

C.在精炼贝叶斯均衡中，每个局中人有关其他人类型的信念都是使用贝叶斯规则从所观察到的行为中获得的；

D.精炼贝叶斯均衡的一个重要应用是信号传递模型。

12.关于策略式博弈，正确的说法是（）：

A.策略式博弈无法刻划动态博弈；

B.策略式博弈无法表明行动顺序；

C.策略式博弈更容易求解；

D.策略式博弈就是一个支付矩阵。

13.下面关于共同知识的说法，正确的是（）:

A.每一个局中人都知道的事，就是共同知识；

B.一般地，假定支付为共同知识；

C.共同知识的假定要求局中人的计算能力不是很强；

D.纳什均衡不需要共同知识的假定。

二、计算与分析题

1.两家计算机厂商A和B正计划推出办公信息管理系统。

两厂商可开发的管理系统有高速、高质（H）和低速、低质两种（L）。

市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。

厂商B

H

L

厂商A

H

30，30

50，35

L

40，60

20，20

（1）如果两厂商同时做出决策且使用极大化极小（低风险）策略，结果将是什么？

（2）假设两厂商都试图最大化利润，且A先开始计划并实施，结果会怎样？

如果B先开始，结果又会如何？

2.北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们

合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞

争厂商将获利900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

3.A、B两企业利用广告进行竞争。

若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，

A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。

4.博弈的收益矩阵如下表：

乙

左

右

甲

上

a，b

c，d

下

e，f

g，h

（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些

关系？

（尽量把所有必要的关系式都写出来）

（2）如果（上，左）是纳什均衡，则

（1）中的关系式哪些必须满足？

（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？

为什么？

（4）在什么情况下，纯战略纳什均衡不存在？

5.Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同，John给Smith

3美元，如果不同，Smith给John1美元。

（1）列出收益矩阵。

（2）如果参与者以1/3的概率选择每一个数字，证明该混合策略存在一个纳什均衡，它为多少？

6.假设双头垄断企业的成本函数分别为：

C^20Q!

，C2=2Qf，市场需求曲线为P=400-2Q，其中，Q=Q1Q2。

（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反应和等利润曲线，并图示均衡点。

（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并以图形表示。

（3）说明导致上述两种均衡结果差异的原因。

7.假设有两个游戏者A和B,他们分别代表两家企业，生产不同的部件，但生产的部

件在型号选择上有“大”、“小”之分。

若一家企业选择的型号为“大”，另一家企业选择的

型号为“小”，则会发生不匹配的问题。

只有当两家企业选择的型号匹配时，才会有均衡。

下表给出了这一合作博弈的形式。

B企业

大

小

A企业

大

2,2

-1，-1

小

-1,-1

1，1

三、论述题

1.举一个你在现实生活中遇到的囚犯两难困境的例子。

2.给定两家酿酒企业A、B的收益矩阵如下表：

A企业

白酒

啤酒

B企业

白酒

700,600

900，1000

啤酒

800,900

600，800

表中每组数字前面一个表示B企业的收益，后一个数字表示B企业的收益。

（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？

（2）存在帕累托改进吗？

如果存在，在什么条件下可以实现？

福利增量是多少？

（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？

如何改变上述A、B企业的收益才能使该博弈不存在均衡？

3.在博弈论中，占优策略均衡总是纳什均衡吗？

纳什均衡一定是占优策略均衡吗？

4.在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F是偷税罚款，且C

S为税务机关检查的概率，E为纳税人逃税的概率；不存在纯战略纳什均衡。

（1）写出支付矩阵。

（2）分析混合策略纳什均衡。

5.判断下列说法正确：

（1）斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

（2）由于两个罪犯只打算犯罪一次，所以被捕后才出现了不合作的问题即囚徒困境。

但如果他们打算重复合伙多次，比如说20次，那么对策论预测他们将采取彼此合作的态度，

即谁都不招供。

6.简要评论博弈论在微观经济学运用中的优缺点。

参考答案

选择题

1.

B；

2.A、B、D；3.B、C；

4.A、D；

5.A；

6.

B、C；

7.

A、B、

C、D;8.C、D；

9.B、C、

D；

10.A、

C、D；

11.

.A、B、

C

、D；

12.B；13.B

、计算与分析题

1.答：

（1）如果两厂商同时做出极大化极小的低风险决策，大家都会力求避免做出L

决策，而都在H决策中选择，选择结果将出现一个左上的均衡（30，30）。

（2）如果A先开始行动并力求使利润最大，则会选择H中的50，B厂商如果在A厂

商行动的基础上做出选择，则会选择L决策，结果将出现一个（50，35）的均衡。

如果B

先开始行动，结果会出现（40,60）的均衡。

事实上，这两个结果都是纳什均衡。

2.答：

（1）用囚徒困境的博弈表示如下表:

北方航空公司

合作

竞争

新华航空公司

合作

500000，500000

0，900000

竞争

900000，0

60000，60000

（2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（60000>0）;若新华

航空公司选择合作，北方航空公司仍会选择竞争（900000>500000）。

若北方航空公司选择

竞争，新华航空公司也将选择竞争（60000>0）；若北方航空公司选择合作，新华航空公司

仍会选择竞争（900000>0）。

由于双方总偏好竞争，故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润均为600000元。

3.答：

（1）由题目中所提供的信息，可画出A、B两企业的支付矩阵（如下表）。

B企业

做广告

不做广告

A企业

做广告

20，8

25，2

不做广告

10，12

30，6

（2）因为这是一个简单的完全信息静态博弈，对于纯策纳什均衡解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利润8大于

不做广告获得的利润2，故在8下面划一横线。

如果A厂商不做广告，则B厂商的最优选择也是做广告，因为做广告获得的利润为12,而不做广告的利润为6，故在12下面划一横线。

如果B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。

如果B厂商不做广告，A厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解，因此，最终的纯策略纳什均衡就是A、B两厂

商都做广告。

4.答：

（1）ae，cg，bd，fh。

本题另外一个思考角度是从占优策略均衡的

定义出发。

对乙而言，占优策略为（b,f）.（d,h）；而对甲而言，占优策略为（a,c）.（e,g）。

综

合起来可得到所需结论。

（2）纳什均衡只需满足：

甲选上的策略时，bd，同时乙选左的策略时，ae。

故

本题中纳什均衡的条件为：

bd，ae。

（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。

（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。

5.答：

（1）此博弈的收益矩阵如下表。

该博弈是零和博弈，无纳什均衡。

John

1

2

3

Smith

1

3,-3

-1，1

2

-1，1

3，-3

-1，1

3

-1，1

3，-3

（2）Smith选（1/3,1/3,1/3）的混合概率时，

1111

John选1的效用为：

U1•V1=—

3333

1111

John选2的效用为：

U21（-3）1=

3333

1111

John选3的

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第九博弈论

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第九章博弈论.docx
链接地址：https://www.bingdoc.com/p-15782580.html

第九章博弈论.docx

热门标签