温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
只读
第10章
博弈论初步
只读
10
博弈论
初步
国内外经典教材名师讲堂国内外经典教材名师讲堂高鸿业西方经济学(微观部分)(第5版)第1010章博弈论初步博弈论初步主讲教师:郑 炳第十章博弈论初步第十章博弈论初步10.1本章框架结构图10.1本章框架结构图博弈论的几个基本概念博弈参与人策略支付函数支付矩阵同时博弈:纯策略均衡占优策略纳什均衡寻找纳什均衡的方法条件策略下划线占优策略与纳什均衡的关系囚徒困境囚徒困境模型囚徒困境模型的扩展应用:寡头厂商合作的不稳定性重复博弈:走出囚犯困境威胁和承诺的可信性同时博弈:混合策略均衡序贯博弈10.2 重难点解读10.2 重难点解读博弈论在20世纪50年代由数学家约翰冯诺依曼(Von Neumann)和经济学家奥斯卡摩根斯坦(Morgenstern)引入经济学,目前已成为主流经济分析的主要工具,对寡头理论等经济理论的发展作出了重要贡献。一、博弈论的几个基本概念一、博弈论的几个基本概念博弈论(game theory)又称对策论,是描述、分析多人对策行为的理论。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。任何一个博弈有三个基本要素:参与者、策略和支付。在每一个博弈中,至少有两个参与者,每一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬,即各自得到一笔支付,其支付可以为正,也可以为负。每一个参与者所得到的支付都是所有参与者各自所选择的策略的共同作用的结果。1博弈参与人参与人(players)是指博弈中的决策主体。参与人既可以是个人,也可以是团体(企业或国家)。每个参与人的目标是通过选择行动使自身利益最大化。2策略策略(strategies)是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。3支付函数支付函数(payoff function)表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。4支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表10-1即为一个支付矩阵。表10-1 支付矩阵2,37,11,55,6不合作合作乙厂商不合作合作甲厂商二、同时博弈:纯策略均衡二、同时博弈:纯策略均衡“同时博弈”也称为“静态博弈”,是指博弈中参与人同时行动,或者他们虽非同时行动,但后行动者并不知道先行动者具体采取了什么行动。1占优策略(dominant strategy):以不变应万变在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。即无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略(There is one optimal choice of strategy for each player no matter what the other player does.)。如表10-2所示,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strategies)。表10-2 广告博弈的支付矩阵10,26,815,010,5不做广告做广告厂商B不做广告做广告厂商A2纳什均衡并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,厂商A的最优决策取决于厂商B的选择。这种均衡就是纳什均衡(Nash equilibrium)。表10-3 广告博弈的支付矩阵20,26,815,010,5不做广告做广告厂商B不做广告做广告厂商A所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡(each person is making the optimal choice,given the other persons choice)。从另一个角度来理解,“纳什均衡”策略组合代表这样一种协议,在给定其他参与人都遵守这个协议的情况下,即使没有外在的强制约束,第 个参与人也会遵守这个协议,因为遵守这个协议所带来的效用大于违反这个协议的效用。i3寻找纳什均衡的方法条件策略下划线法对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。具体步骤如下:(1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。(2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。(3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。(4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。(5)在带有下划线的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。表10-4 寡头博弈:合作与不合作2,37,11,55,6不合作合作乙厂商不合作合作甲厂商4占优策略与纳什均衡的关系占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者的任何策略选择来说,其最优策略都是惟一的。而纳什均衡只要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,有时候又存在好几个纯策略纳什均衡。表10-5 没有纳什均衡的同时博弈2,87,39,14,6右左乙厂商下上甲厂商三、囚徒困境三、囚徒困境1囚徒困境模型囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑合谋偷窃,被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。按照警方交待的量刑原则,表10-6的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。表10-6 囚徒困境-2,-2-7,-1-1,-7-5,-5不坦白坦白乙不坦白坦白甲囚徒困境的博弈有一个占优策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映一个矛盾:即个人理性和团体理性的冲突囚徒困境的占优策略均衡反映一个矛盾:即个人理性和团体理性的冲突。囚徒困境表明了每个人追求个人利益最大化时不一定会导致社会福利的增加,相反,可能会导致集体的灾难,从而对斯密学说做出了挑战。2囚徒困境模型的扩展应用:寡头厂商合作的不稳定性表10-7 寡头厂商合作的不稳定性8,812,66,1210,10不合作合作乙不合作合作甲从表10-7可以看出,如果甲、乙两个寡头勾结,形成卡特尔组织,就可以避免由于双方都采取不合作策略和相互竞争所造成的两败俱伤的局面。但是,这种合作是不稳定的,每一个寡头都有强烈的利己动机去背离协议,以获得自身的更大的利益。也就是说,寡头们之间所达成的卡特尔协定往往是不稳定的。3重复博弈:走出囚犯困境重复博弈是动态博弈的一种特殊情况。重复博弈中,一个结构相同的博弈被重复多次。假定条件是:在结成合作同盟的寡头厂商之间都采取一种“以牙还牙以牙还牙(tit-for-tat strategy)”的策略。结合表10-7可以看出,在具有“以牙还牙”策略的无限次重复博弈中,所有的寡头厂商都会遵守协议,采取合作的策略。可以看出,有限次的重复博弈不能解决囚徒困境中的背叛问题。如果囚徒困境可以重复无数次,那么理性的选择就有可能导致帕累托有效的结果。4威胁和承诺的可信性表10-8 不可信的威胁如表10-8所示,在位者的抵制这一威胁是不可信的。换句话说,在位者的威胁只是一种摆设,它不会被真正实施。1300,900900,12001300,900800,600不进入进入进入者不抵制抵制在位者表10-9 可信的威胁如表10-9示,在位者的抵制威胁可信。此时,潜在进入者采取的行动只能是不进入。1300,900700,12001300,900800,600不进入进入进入者不抵制抵制在位者四、同时博弈:混合策略均衡四、同时博弈:混合策略均衡并不是所有的博弈都存在纳什均衡。如表10-10所示,就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。表10-10 社会福利博弈0,0-1,1-1,33,2游荡寻找工作流浪者不救济救济政府混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率最优概率。可以证明,混合策略均衡总是存在的混合策略均衡总是存在的。五、序贯博弈五、序贯博弈“序贯博弈”是参与人的决策和行动有先有后的博弈。描述序贯博弈的工具是“博弈树”,由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。图10-1 博弈树在序贯博弈中,可能存在多个纳什均衡的情况,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常使用“逆向归纳法”,具体包括以下两个步骤:第一步,先从博弈最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。第二步,再对简化博弈重复步骤一,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。10.3 名校考研真题详解10.3 名校考研真题详解【例10.1】【例10.1】甲、乙两个学生决定是否打扫宿舍。无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。(1)请用一个博弈简单描述上述情景。(2)找出该博弈的所有纳什均衡。中山大学2010研解:解:(1)共有以下四种情况:当甲乙都参与时,各自收益为。当甲参与乙不参与,甲收益为,乙收益为。当甲不参与乙参与,甲收益为,乙收益为。当甲乙都不参与时,每个人的收益均为0。5 282=5 1 83=5 1 05=5 1 05=5 1 83=具体博弈矩阵如表10-11所示:表10-11 博弈的收益矩阵乙参与不参与甲参与2,2-3,5不参与5,-30,0(2)从表10-11中可以看出,该博弈的纳什均衡是甲不参与乙也不参与,这一均衡解也是占优策略均衡,即双方都没有动力去改变这一局面,最后谁都不去打扫宿舍。可看出,如果甲乙两人都参与打扫宿舍,则他们的境况就要比在其他选择下更好一些。双方从自己的理性出发的最优策略,从社会看来是最糟糕的策略。【例10.2】【例10.2】“鹬蚌相争,渔翁得利”说明双方相互争夺的过程中,反而会受到损失。请用博弈论的知识说明这一现象,并指出实际生活中的例子。西南财经大学2011研答:答:(1)“鹬蚌相争,渔翁得利”是典型的囚徒困境,是非合作博弈中的纳什均衡,虽然双方知道合作比非合作各自的收益都大,但是因为非合作是各自的占优策略,所以最后的结果只能是两败俱伤的非合作。用一个简单的博弈模型来解释这一现象,如表10-12所示,很显然本博弈的纳什均衡就是二者都采取争斗策略。表10-12 鹬蚌相争的博弈模型(2)实际生活中这样的例子很多。比如中国移动和中国联通就经常就某一产品进行价格战,结果是二者都被迫采取低价策略,二者在该产品上的盈利能力都很低。事实上,假如二者合作采取高价策略,则二者在该产品上都可以赚大钱,但是由于采取争斗策略是各自的占优策略,收益合作是不可能的,最终二者只能在低价策略上获得纳什均衡,个体理性战胜了集体理性。【例10.3】【例10.3】纳什均衡(Nash equilibrium)纳什均衡(Nash equilibrium)浙江大学2005研;厦门大学2006、2008研;中南财经政法大学2007、2009研;财政部财政科学研究所2008研;西安交通大学2009研答:答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰纳什的名字命名。纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优策略所组成的一个策略组合,即给定其他人的策略,任何个人都没有积极性去选择其他策略,从而这个均衡没有人有积极性去打破。与其相联系的一个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者采取的策略都是最优策略。