单一决策主体决策变量目标函数约束条件决策主体的决策行为发生直接相互作用(相互影响)博弈模型非合作博弈合作博弈三要素博弈(对策)模型(GameTheory)多个决策主体优化模型(Optimization)静态、动态信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛第十章博弈模型第十章博弈模型10.1点球大战10.2拥堵的早高峰10.3“一口价”的战略10.4不患寡而患不均10.5效益的合理分配10.6加权投票中权力的度量完全随机选择策略(50%对50%)?假设:同时决策(球速很快,否则来不及反应)如果不是,射门方向和扑球方向应该有什么规律?假设:不考虑球踢向中路及守门员停在中间位置问题背景扑向左侧扑向右侧踢向左侧???踢向右侧???守门员基本策略罚球队员基本策略10.1点球大战不应完全随机选择策略•共同知识:所有人都知道(所有人知道)以上信息“方向”以其中一人如罚球队员的位置为基准问题背景扑向左侧扑向右侧踢向左侧0.580.95踢向右侧0.930.70守门员罚球队员经验进球概率(1400次罚球)决策(方向选择)相互影响完全信息静态博弈•参与人(局中人,决策者)•战略/策略空间(决策变量的取值范围)•效用函数(决策的目标函数)博弈模型的基本要素点球大战的博弈模型•参与人集合N={1,2}(1:罚球队员,2:守门员)•罚球队员效用函数u1(a1,a2),即进球概率•罚球队员策略a1A1={1,2}(1:左,2:右);(纯战略)守门员策略a2A2={1,2}(1:左,2:右).(纯战略)•守门员效用函数u2(a1,a2)=-u1(a1,a2)(零和博弈)•假设博弈双方完全理性:使己方支付尽可能大点球大战的博弈模型u1(i,j)=mij扑向左侧(1)扑向右侧(2)踢向左侧(1)0.580.95踢向右侧(2)0.930.7070.093.095.058.0}{22ijmM支付矩阵(PayoffMatrix)守门员的支付矩阵为–M(或:1–M,即不进球的概率)u2(i,j)=-mij会出现什么结果?博弈模型的解——纳什均衡(NE:NashEquilibrium)不存在(纯)NE}.2,1{),,(),(},2,1{),,(),(22*12*2*121*211*2*11aaauaauaaauaau(纯战略)纳什均衡Nash:1994年获诺贝尔经济学奖NE:单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的(称为最优反应).(纯)NE:a*=(a1*,a2*)=(2,2)70.093.095.058.0M70.093.065.058.0'M混合策略纳什均衡罚球队员混合战略集期望支付S1={p=(p1,p2)|}211,10iiipp守门员混合战略集S2={q=(q1,q2)|}211,10iiiqq可类似地定义...