欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    12 导论:博弈论与经济学.pptx

    • 资源ID:15138334       资源大小:624.46KB        全文页数:81页
    • 资源格式: PPTX        下载积分:30金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    12 导论:博弈论与经济学.pptx

    1、导论:博弈论与经济学,一、博弈论与经济学的联系与区别1、传统经济学主要研究经济市场的两个极端情况:(1)垄断市场(2)完全竞争市场价格制度(或称市场制度、价格理论)是其集中的体现。两个基本假设:1、市场的参与人较多;2、所有参与人对信息的把握是完全对称的;这两个假设在现实中是不完全存在的。两个决策主体:1、经济主体人;2、市场。但市场是千千万万个消费者的消费意愿和消费能力的总和,所以它已不再具有人格化的面貌。,2、博弈论与微观经济学各自对均衡问题探讨的不同:一般均衡理论是整个经济学的理论基石 在完全竞争的市场和民主政府下,平等和效率可以兼顾。然而在下列情况下,一般均衡理论是不成立的:(1)非完

    2、全竞争;(2)外在性;(3)公共产品;(4)逆向选择问题(信息不对称会造成市场失灵)(5)道德风险问题(是新制度经济学和企业理论的核心)价格学说与策略对局;微观中均衡会导致帕累脱最优;博弈存在着多样性的均衡:一个均衡点、多个均衡点、稳定 均衡、概率均衡 3、博弈论更贴近现实,分化出丰富的实证模型;,4、博弈论是伴随着经济学对信息的重视而发展起来的(1)完全信息:对参与人特征、战略空间、支付函数有 准确的知识;(2)完全信息静态博弈:纳什均衡;(3)不完全信息静态博弈:海萨尼转换把不同的信息看成是不同的类型,不同类型的出现有其不同的主观判断的概率;贝叶斯均衡对不完全信息的均衡有贝叶斯技术 给出,

    3、利用条件概率,把先验分布经由似然函 数向后验分布转化;,5、博弈论为解决经济学的时序问题提供了有力的工具(1)完全信息动态博弈子博弈精练纳什均衡 逆向推理演绎法(2)不完全信息动态博弈精练贝叶斯纳什均衡 委托代理:参与约束;激励相容约束;信号传递与逆向选择:委托人在签定合同时不知道 代理人的类型,问题是选择什么样的合同来获 得代理人的私人信息。,二、经济学的发展方向,博弈论进入主流经济学,反映了经济学发展的以下几个趋势:1、经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数,消费最大化等,一切从个人效用函数及其约束条件开始,解约束条件下的效用最大化问题而导出行

    4、为及均衡结果。这正是博弈论的范式:给出个人的支付函数及战略空间,然后看当每个人都选择其最优战略以最大化个人支付函数时将发生什么。,2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用(冲突与一致、竞争与合作)。特别注意到个人理性行为可能导致的集体非理性。3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。在70年代,当经济学家们开始将注意力集中于研究具有理性行为、但只拥有有限信息的个体时,信息就成了许多模型的焦点形成完全信息与不完全信息博弈论。当个体行为受到重视之后,他们采取行动的时间顺序也开始被明确的结合了起来形成由静态到动态的博弈论。,三、博

    5、弈论的历史,*1、起步于冯诺依曼(Von Neumann)与摩跟斯坦恩(Morgenstern)1944年出版的博弈理论与经济行为。普林斯顿*2、塔克(Tucher)发展了“囚徒困境”(1950)(库恩)*3、纳什(Nash)发表了关于均衡的定义与存在性的文章。4、纳什与夏普利(Sharpley)发展了关于“讨价还价博弈”文章(1953)。到了1953年,所有将被经济学家们在此后二十年中运用到的博弈理论事实上都已被发现了。但直到70年代中期,博弈论还保持着独立领域的地位,之后经济学家开始发现将博弈论与复杂的经济问题结合起来可能会得到什么结果。在80年代,博弈论迅速成为主流经济学的重要组成部分。

    6、事实上,他几乎吞并了整个微观经济学。,重要的文献还有:5、泽尔腾(Selten)关于“完美性”的文章(1965)德国波恩大学6、海萨尼(Harsanyi)关于“不完全信息”的文章(1967)。美国伯克利大学7、克瑞普斯(Kreps)和威尔逊(Wilson)对完美性加以扩展的文章(1982)。8、Kreps、Milgrom(米尔格罗姆)、Roberts(罗伯茨)&Wilson关于不完全信息重复博弈的文章。,四、实例化理论,与推崇最基本假设和最大化行为的潮流同时兴起的还有对简洁的追求:称做“实例化理论”。简单的说,就是把某一类现象精练成一个简洁而把握其精髓的故事,并模型化形成理论,然后用于解决实际

    7、问题。实例理论如:囚徒困境、智猪博弈、斗鸡博弈、福利博弈等。,五、博弈论的架构,完全信息静态博弈:纳什均衡完全信息动态博弈:子博弈精练纳什均衡不完全信息静态博弈:贝叶斯纳什均衡不完全信息动态博弈:精练贝叶斯纳什均衡,第一章 引论,11 策略博弈,从故事开始例1:如果给你两个师的兵力,有你来当“司令”,任务是攻克“敌人”占据的一座城市,而敌人的守备力量是三的师,规定双方的兵力只能整师调动。通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你胜;你的兵力少于或等于敌人守备的兵力,你就失败。问:敌我各有几种布兵策略?敌我取胜的概率各多少?分析:(一)敌军的四种部署方案A、三个师住守甲

    8、方向,B、两个师守甲方向,一个师守乙方向,C、一个师守甲方向,两个师守乙方向,D、三个师住守乙方向。,(二)我军的三种部署方案a、集中全部的两个师的兵力从甲方向进攻,b、分兵两路同时攻击,一从甲方向,一从乙方向,c、集中全部的两个师的兵力从乙方向进攻。,,+,+,,,+,,+,+,,,+,,+,,+,+,,+,,+,,+,,敌 方 3-0 2-1 1-2 0-3,我军,,+,,+,,+,,+,+,,+,,敌 方 2-1 1-2,我军,,+,,+,+,,+,,我军,2-01-10-2,2-01-10-2,2-00-2,敌 方 2-1 1-2,一、什么是博弈论“博弈”字面解就是“丰富多彩的对抗性游

    9、戏”。例1 石头、剪刀、布。,张 威 石头 剪刀 布,进步,原地,小 刚,石头 剪刀布,进步,原地,进步,原地,原地,原地,原地,原地,原地,原地,原地,进步,原地,进步,原地,进步,小刚、张威分别出什么招,关键在于他们对对手可能出什么招的“猜测”上。即他们各自的策略是相互依存的。,1-2、博弈的基本概念和囚徒困境,例2 鸽派与鹰派,鸽派代表妥协路线鹰派代表强硬路线 为了最大化自身的利益,美苏各方的政策选择,依赖于对手策略的选择。,博弈的定义:博弈是指决策主体人在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。注意:博弈论是专门研究博弈如何出现均衡的规律的科学。,1、博弈中

    10、的参与者各自追求的利益具有冲突性。2、博弈是一个过程的集合。3、博弈的一个本质特征就是策略的相互依存性。,二、一个博弈中必不可少的要素包括:参与人(players)行动(action)信息(information)策略(strategies)支付函数(payoff)结果(outcome)均衡(equilibria)1、参与人:指的是博弈中选择行动以最大化自己效用的决策主体(可能是个人,也可能是团体,如国家、企业;)2、行动:是参与人的决策变量,即参与人所能做的某一选择。3、战略:是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动(如“人不犯我,我不犯人,人若犯我,我必犯人”是一种战略)

    11、,4、信息:指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识;5、支付函数:是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数;(支付可以是实数,也可以是序数)6、均衡:是所有参与人的最优战略或行动的组合。,三、二人博弈的支付矩阵 博弈的矩阵型表示,此种表示的博弈叫矩阵型博弈。它不同于数学中的矩阵:1、符号不同;2、一是单矩阵一是双矩阵;,-1,1,1,-1,-1,1,-1,1,1,-1,-1,1,-1,1,-1,1,1,-1,1,-1,1,-1,1,-1,敌 方 3-0 2-1 1-2 0-3,我军,2-01-10-2,概念行参与人列参与人,四、囚徒困境

    12、 例1:囚徒困境 两个嫌疑犯被警察 抓住,分别被关在不 同的屋子里审讯。警 察告诉他们:如果两 人都坦白,各判刑8年徒刑;如果两个都抵赖,各判2年徒刑,如果其中一人坦白另一人抵赖,坦白的放出去,不坦白的判刑10年徒刑。(一)给出囚徒困境的战略式表述1、参与人:囚徒A,囚徒B。2、博弈的策略:(都有两策略)坦白、抵赖3、支付函数:(二)囚徒困境的矩阵式表示(见右上图)(三)三人博弈、多人博弈的表示。,囚徒A,1-3“抓钱博弈”一、利益一致的“抓钱博弈”1、游戏过程描述2、游戏特点分析 同时决策博弈,属静态博弈;决策有先有后的序贯决策博弈,属动态博弈3、动态博弈的表示博弈树 决策节点、起始(根)节

    13、点、末端节点、节点决策人、枝(棱)代表决策可能的选择;支付顺序;树型博弈(展开型博弈)。,二、“你死我活”的抓钱游戏1、此博弈规则 时刻1 时刻2 时刻52、注意在“利益一致”抓钱游戏和“你死我活”的抓钱游戏中,在对应的各步的两参与人的支付总和是相同的,但制度安排不同,结果就大相径庭。3、关于故事的编排和博弈名称的说明。,(10,0),三、“温和对抗”的抓钱游戏是一个小跌、大涨、小跌、大涨的循环游戏。结论:制度设置不同,参与人的支付就不同,博弈的结果就不同。,(2,0),(1,3),(4,2),(3,5),(6,4),1-4 利益是交易的前提一、建立在自愿交易上的命题:1、在交易的当时,交易各

    14、方都不会吃亏;2、事后叫吃亏,涉及到信息结构发生了变化的问题。二、几个概念 1、交易价格 2、买方的保留价格 3、卖方的保留价格 4、交易利益 5、标的物的评价 6、私人信息,三、市场曲线生产者剩余:在存在市 场的条件下,众多卖者 所分享的交易利益的总 和。消费者剩余:在存在市 场的条件下,众多买者 所分享的交易利益的总 和。,P,Q,S,D,四、在一对一的交易中,交易价格取决交易双方的讨价 还价的能力。,五、互利大局下的利益冲突 1、资源配置 2、无差异曲线 3、纺锤形的交易 互利区域,D,M,C,B,A,六、艾奇沃斯交换 的竞争均衡1、主体人的提供曲线2、竞争均衡点,C,M,D,B,A,E

    15、,七、艾奇沃斯交换 的垄断均衡,M,C,E,A,B,三、博弈的分类一)按两者行动的先后顺序划分,从这个角度,博弈可以划分为静态博弈和动态博弈。1、静态博弈:指的是博弈中,参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动;2、动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。,二)从参与人对有关其他人(对手)的特征、战略空间及支付函数的知识的角度,博弈可以划分为完全信息博弈和不完全信息博弈1、完全信息博弈指的是每一个参与人对所有其他参与人的特征、战略空间及支付函数有准确的知识;2、否则,就是不完全信息。3、将上述两个角度的划分结合起来,我们就

    16、得到四种不同类型的博弈:完全信息静态博弈;不完全信息静态博弈;完全信息动态博弈;不完全信息动态博弈。4、与上述四种博弈相对应的四个均衡概念:纳什均衡;子博弈精练纳什均衡;贝叶斯纳什均衡;精炼贝叶斯纳什均衡;见下表0.1,表0.1 博弈的分类及对应的均衡概念 行动顺序 信息 静 态 动 态,完全信息,不完全信息,完全信息静态博弈;纳什均衡纳什(1950,1951),完全信息动态博弈;子博弈精练纳什均衡 泽尔腾(1965),不完全信息静态博弈;贝叶斯纳什均衡 海萨尼(1967),不完全信息动态博弈;精练贝叶斯纳什均衡;泽尔腾(1975),Kreps&Wilson(1982)Fudenberg&Ti

    17、role(91),博弈的分类还有以下几种:一、完美信息博弈与不完美信息博弈 二、零和博弈和非零和博弈 三、合作博弈(存在具有行动约束力的联盟)和非合作博弈(不存在具有行动约束力的联盟),2.1 完全信息静态博弈:纳什均衡,一、什么是“纳什均衡”具体讲,假设有n个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略,所有参与人选择的战略一起构成一个战略组合。纳什均衡指的是由所有参与人所选择的最优战略组成那种战略组合。也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡。,例1:囚徒困境 两个嫌疑犯被警察 抓住,分别被关在不 同的屋子里

    18、审讯。警 察告诉他们:如果两 人都坦白,各判刑8年徒刑;如果两个都抵赖,各判2年徒刑,如果其中一人坦白另一人抵赖,坦白的放出去,不坦白的判刑10年徒刑。1、表0.2给出囚徒困境的战略式表述(解释表的意义),囚徒A,返回应用,2、博弈论的表述方式:战略式表述(或称矩阵式表述)3、在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白。事实上,这里(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡,就是说,不论对方如何选择,个人的最优选择是坦白。*4、纳什均衡可以从另一个角度来理解:假设博弈中的所有参与人事先达成一项协议,

    19、规定出每个人的行为规则;在没有外在的强制力约束时,当事人是否会自觉地遵守这个协议?,5、囚徒困境反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。6、囚徒困境的事例:(1)两个寡头企业选择产量的博弈。(2)公共产品的供给也是一个囚徒困境问题。(3)军备竞赛。(4)教育减负 还有象盗版书与正版书、劣币驱逐良币、劣行遇到良行、拍卖出价、推销员的努力、政治上的讨价还价等,从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡;否则,这种制度安排便不能成立。,例2:智猪博弈。这个例子讲的是,猪圈里圈两头猪,一头大猪,头小猪。猪圈的一头有一个猪食槽,另一头

    20、安装一个按钮,控制着猪食的供应按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃到1个单位;若同时到,大猪吃7个单位,小猪吃3个单仪,若小猪先到,大猪吃6个单位,小猪吃4个单位。1、什么是本例的纳什 均衡?答案是大猪按;小猪等待,各得4个 单位。多劳者不多得。因为不论大猪选择“按”还是“等待”,小猪的最优选择均是“等待”“等待”是小猪的占优战略。给定小猜总是选择“等待”,大猪的员优选择只能是“按”。,小猪 按 等待,大猪,按等待,5,1,4,4,9,-1,0,0,2、智猪博弈的应用:(1)比如说股份公司中,大股东和小股东之间,大股东

    21、承担着监督的任务及监督成本。纳什均衡是,大股东担当起搜集信息、监督经理的责任,小股东则搭大股东的便车。(2)股票市场上炒股票,大户与小户的关系。(3)大企业与小企业之间,在新产品的研究、开发、打广告问题上。(4)北约中,美国承担超出比例的防务费用。(4)优秀学生与一般学生在文明寝室的建设上等等。所以,智猪博弈的纳什均衡常被称做“富人的绅士风度”或称“小国对大国的剥削”、“搭便车”。,例3:性别战 讲的是热恋中的情人,安排业余活动,或者去看足球比赛,或者看芭蕾舞演出男的偏好足球,女的则更喜欢芭蕾,但他们都宁愿在一起,不愿分开表0.4给出支付矩阵。这个博弈中,有两个纳什均衡:(足球,足球),(芭蕾

    22、,芭蕾)。那么,究竟哪一个纳什均衡会实际发生?这里有一个先动优势,或者形成一种默契。(另:两要好同学选课、二战英美在支持巴顿还是蒙哥玛利的问题、两企业合建共水站等),1、二战例 2、两同学选课,哲理:在利益一致的前提下,又存在各自的小算盘,即有利大利小的冲突。,例4:斗鸡博弈设想两个人举着火棍从独木桥的两端走向中央进行火拚;每个人都有两种战略:继续前进,或退下阵来。若两人都继续前进,则两败俱伤,若一方前进另一方退下来;前进者取得胜利,退下来的丢了面子;若两人都退下来,两人都丢面子。支付矩阵如表0.5所示。这个博弃里也有两个纳什均衡:如果一方进,另一方的最优战略就是退。两人都进或都退都不是纳什均

    23、衡。这个例子也有许多应用1)冷战期间,苏美两个军事集团在世界各地抢占地盘,也是一种斗鸡博弈。2)还有警察与游行队伍的例子。3)夫妻间矛盾也是个斗鸡问题。,B 进 退,进 退,A,-3,-3,2,0,0,2,0,0,例5:市场进入阻挠 设想有一个垄断企业已在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以就要阻挠进入者进入。进入者有两种战略:进入、不进入;在位者也有两种战略:默许、斗争其支付矩阵如表0.6所示。这个博弈也有两个纳什均衡,即(进入,默许)(不进入,斗争)*,作业:纳什均衡是什么?均衡收益各多少?,例6:杂货铺定位与西方两党政治的

    24、稳定性和欺骗性,例7:电台节目选择博弈,谢 林 点多纳什均衡的存在,说明纳什均衡从理论上说是不完美的。实际中到底哪一个均衡会发生?谢林给出了回答。在节目选择博弈中,如果库尔电台一直是一家成功的摇滚乐电台,则维德当然会选择乡村音乐。谢林从历史线索中,判断出一个均衡发生的概率大于另一个均衡,这种以线索为基础选择出的均衡称为谢林点。,帕累托优势与风险优势问题讨论例9:推与不推均衡 假如吉姆和卡尔驾车行驶在同一条公路上,横卧在路上的一棵大树挡住了他们的去路。他们只有齐心协力移走大树才能继续前进,否则只能回头。面临着推与不推的博弈矩阵如图所示:(推,推):收益占优均衡(不推,不推):风险占优均衡,吉姆

    25、推 不推,推 不推,卡尔,再谈风险优势,乙 猎鹿 打兔,猎鹿 打兔,甲,10,10,0,4,4,0,4,4,乙 左 右,上 下,甲,6,6,-1000,5,5,-1000,4,4,再谈帕累托优势:猎人博弈,博弈有什么用?1、囚徒困境2、智猪博弈3、斗鸡博弈再举几个例子:4、领先还是不领先:(1)帆船竞赛,美国的“自由号”与“澳大利亚二号”。(2)剑桥大学五月舞会的轮盘赌问题。后动优胜策略。,二、看穿对手的策略 在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不能通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。每一个人不得不同时担

    26、任两个人的角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。你怎样才能看穿所有那些错综复杂而又看不见的策略呢?这里基于两个简单的概念:优势策略与均衡,推出三个简单法则。,相继进行的博弈动态博弈的均衡方法,例二、分蛋糕博弈 1、一次性分蛋糕 2、二次性分蛋糕 3、三次性分蛋糕 4、N次性分蛋糕,原则一:向前展望,到后推理例一 吸尘器市场“快洁”独占市场,现在“新洁”决定 是否进入市场,其博弈过程和支付如下图:,例三,例四:课堂实验学生分分数问题,一次、二次、三次分配;公平性问题:1、平均分配原则 2、所得与自己的贡献相等例五 八个金币的故事 约克和汤姆结对旅游。约克带了3块饼,汤姆带了5

    27、块饼。一路人路过,被邀一起吃饼。吃完后路人感谢了8个金币。两人为金币的分配争执起来:汤姆坚持自得5给约克3,约克坚持各得4。你认为怎样分配这8个金币呢?,海盗分宝石:公平原则下的不公平 例六 5个强盗把抢来的100颗宝石进行分配,分配规则是:1、抽签确定分配顺序;2、由抽到1号签的海盗提出分配方案,然后5人进行表决,有半数及以上的人同意,则按其方案进行,否则,将提出方案的人扔进大海;3、如果1还被扔进大海,2号提出分配方案,规则同前 问题:1号海盗提出怎样的方案才能既不使自己被扔进大海,又能使自己得到最多的宝石?,寻找均衡的方法1、优势策略均衡用严格(弱)劣势策略逐次消去法2、相对优势策略 划

    28、线法3、箭头指向法,上下,B,1,3,0,1,0,2,2,0,左 中 右,1,0,0,4,坦白抵赖,囚徒B,-8-8,,-100,,0-10,,-2-2,,坦白 抵赖,A,囚徒A,法则二:假如你有一个优势策略,请按优势策略办。说明:1、以策略的观点来看,各方均有一个优势策略的博弈是最简单的博弈。占有战略均衡只要求每个参与人是理性的,而并不要求每个参与人知道其他参与人是理性的,即不要求“理性”是共同知识。2、囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。本来,(抵赖,抵赖)策略,各只判刑1年,比8年好,但这个帕累托改进做不到,因为它不满足个人理性的要求。3、帕累托效率准则:经济效率体

    29、现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。达到帕累托效率,是指要改善任何人都必须损害别的人。如猎人博弈,0.2.3 重复剔除的占优均衡一、定义:优势策略均衡 如果无论其他参与人选择什么策略,策略 都是 参与人 i 的强最佳应对,那么 就称为占优战略。这意味着无论别人选择什么策略,都是参与人 i 的支付最大化。从数学上讲,就是 对于参与人 i 而言较差的策略即所有的 称为劣势策略。定义:在博弈的战略式表述中,如果对于所有的 i,是i的占优战略,战略组合 称为占优战略均衡。,但有时候,某参与者有一个优势策略,其他参与者没有。由此我们可以推出重复剔除的占优均衡。考虑“智猪博弈”

    30、的例子,显然,这个博弈里,小猪有占优战略,而大猪没有。因而博弈没有占优战略均衡。(区分:占优战略与占优战略均衡)假如小猪是理性的,则小猪会选择“等待”;又假如大猪也是理性的,并知道小猪是理性的,则大猪会正确的预测到小猪会选择等待,在这个预测下,大猪的最优选择只能是“按”,则“按,等待”是这个博弈的唯一均衡。这正是应用了“重复剔除严格劣战略”的思路。,一、重复剔除严格劣战略的思路,1、劣战略的定义 策略 劣于另一个策略,如果对于其他局中人的每一个策略,后者与 至少一样好,而对于其他局中人的某些策略,严格地好于,以致 则 称为 的劣策略。2、非劣策略:如果一个策略不劣于任何其他策略,则称非劣策略,

    31、2、思路 首先找出某个参与人的劣战略(假如存在),把这个劣战略剔除掉,重新构成一个不包含已剔除战略的新的战略;然后再提出这个新的博弈中的某个参与人的劣战略;继续这个过程,一直到只剩下一个唯一的战略组合为止。此组合即为“重复剔除的占优均衡”例1:,参与人B L M N,UD,参与人A,1,0,0,3,2,0,0,1,0,1,1,2,L M,UD,参与人A,1,0,0,3,0,1,1,2,L M,U,参与人A,1,0,1,2,参与人B,练习题:俾斯麦海之战 木村受命运兵到新几内亚,其间要穿过俾斯麦海,有两条航线:较短的北线和较长的南线。肯尼奉命予于轰炸。支付矩阵如表1.5。分析其均衡策略。均衡的敏

    32、感性问题 尽管重复剔除的占优均衡是一个合理的预测,但这一点受到下列极端情况的挑战。见下表1.6占优战略均衡是(U,L)但实际中均衡极有可能是(D,L),因为B的策略只要有一点扰动,A就会受到很大的损失,即博弈的结果对行为的不确定性是很敏感的。,参与人B L M,UD,参与人A,8,10,7,6,6,5,-1000,9,木村 北 南,北南,肯尼,2,-2,1,-1,3,-3,2,-2,表1.6,表1.5,法则三:剔除所有劣势战略,不予考虑,如此一步一步的做下去。,例2:假如在海湾战争中,伊拉克舰艇在 I 点,伊企图发射一导弹击毁美国在A点的舰艇,为避免美军发射导弹进行拦截,伊导弹采取每隔20秒随

    33、机直角转弯的策略,美拦截导弹也有同样的90度转弯功能。导弹可能的行进路线如右图。导弹所装的燃料只够它飞行1分钟,即它只能走过三个节点。问双方各有多少种导弹发射策略?找出双方的最佳策略。,例2的矩阵表述:击中与错过图,美国的策略,美国的策略,表一,表二,*利用重复剔出劣势策略的原则所得到的结果,此结果没有均衡。*均衡概念的误区:当我们说博弈的结果是均衡,并不意味着这就是对所有参与者最有利的结果。更不意味着是对整个社会作为一个整体而言最有利的结果。法则三:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。,美国的策略,伊拉克的策略,表三,二、多均衡问题 1、行车问题 2、打电话问题五、无纯策略均衡问题混合策略 1、美、伊导弹问题 2、网球与税务审计:说明策略的优胜在于不可预测性。,六、案例分析:股票收购问题 罗伯特.坎普在第一次投标收购联盟商店的时候,运用了一个称为两阶段


    注意事项

    本文(12 导论:博弈论与经济学.pptx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开