完全信息动态博弈
(一) 定义
完全信息动态博弈描述了参与者在决策过程中具有完全信息的情形。在这种博弈中,每个参与者都清楚地知道博弈的规则、其他参与者的策略以及可能的结果。动态博弈考虑到时间的因素,即参与者的决策是连续进行的,每个参与者的行动会影响到未来的结果。
在完全信息动态博弈中,博弈的过程可以被建模为一个博弈树,其中每个节点代表一个决策点,每个边代表一个参与者的行动选择,子节点表示游戏的终止,并给出了每个参与者的支付。这种博弈形式适用于许多现实世界的情况,例如价格竞争、战略合作、资源分配等。
(二) 逆向归纳
逆向归纳法(Backward Induction)是完全信息动态博弈中常用的分析方法,特别是在博弈树模型中。这种方法从博弈的最后阶段开始,逐步向前推导出每个决策节点的最优策略和最终结果。
具体步骤如下:第一步,确定最终阶段(终局)。确定博弈的最后阶段,即博弈树的叶子节点,也是游戏结束时的状态。在这些节点上,确定每个参与者获得的支付。第二步,倒推分析。从最后一个阶段开始向前分析。对于每个参与者来说,从他们可能做出的最后一个决策节点开始,根据他们能够获得的最大收益或最小损失来选择最优策略。第三步,逐步向前。在每个决策节点,根据参与者对未来决策的最佳反应,向前推导。对于每个决策者来说,他们会考虑其他决策者的最优策略,并选择使自己获得最大利益的行动。第四步,确定均衡。通过逆向归纳法确定所有决策节点的最优策略,从而找到整个博弈的均衡解。这就是通过逆向归纳法找到的完美子博弈均衡(Perfect Subgame Perfect Equilibrium)。
逆向归纳法的关键在于,通过从后向前的推导,可以逐步确定每个决策节点的最优行动,最终确定整个博弈的最优解。这种方法非常适用于完全信息动态博弈,因为在这种情况下,每个参与者都清楚地了解到博弈的所有信息,可以做出理性的决策。
(三) 经典案例——斯塔克博格博弈
斯塔克博格模型(Stackelberg model)是一种领导者-追随者结构的动态博弈。在这个模型中,有一个领导者首先做出决策,然后其他参与者根据领导者的决策做出反应。
领导者考虑追随者的最佳反应,选择使自己获得最大利益的行动。假设领导者的决策是生产数量。追随者知道领导者的决策后,会选择使自己获得最大利益的反应。通常追随者的反应是生产数量。推导过程可归纳为,第一步,确定博弈的最后阶段,即追随者做出反应的阶段。第二步,逆向归纳,从最后阶段开始,追随者做出反应,领导者根据追随者的反应选择最优决策。第三步,领导者根据追随者的反应选择能够最大化自己利益的决策。最后,追随者根据领导者的决策选择能够最大化自己利益的反应。确定斯塔克博格均衡,即领导者和追随者的策略组合,使得领导者和追随者都无法通过单方面改变策略来获得更好的结果。