假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1]),则此策略组合被称为纳什均衡
纳什均衡
。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。
子博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。
对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
博弈论专家常常使用“序惯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法: 最后一个结点上的子博弈(纳什均衡)→倒数第二个(纳什均衡) → ······ → 初始结点上的子博弈(纳什均衡)。
纳什均衡(Nash Equilibrium)和子博弈完美纳什均衡(Subgame perfect Nash equilibrium)所反映的博弈都包括了一个基本假设:即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数(payoffs)都是共同知识(common knowledge)。满足这样一个假设的博弈称为“完全信息博弈”(games of complete information)。但在现实生活中这一假设往往得不到满足。在非合作博弈论中,局中人对博弈的结构以及其他局中人的特征并没有准确的知识的情况叫“不完全信息博弈”(games of incomplete information)。在1967年以前,博弈论专家对不完全信息博弈是束手无策的。 Harsanyi(1967—1968)的贡献解决了这个问题,填补了博弈论乃至经济学的一大空白,他也因此而获得了诺贝尔经济奖。John C.Harsanyi引入了一个虚拟的局中人——自然(nature)。与一般的局中人不同,“自然”没有自己的支付和目标函数,即所有结果对它而言是无差异的。自然首先行动,决定局中人的特征。被选择的局中人知道自己的真实特征,而其他局中人并不清楚这个被选择的局中人的真实特征,仅知道各种可能特征的概率分布。另外,被选择的局中人也知道其他局中人心目中的这个分布函数,也就是说,分布函数是一种共同知识(common knowledge)。John C.Harsanyi的这项工作被为“Harsanyi转移”(the Harsanyi transformation),通过这个转换,John C. Harsanyi把“不完全信息博弈”转换成“完全但不完善信息博弈”(complete but imperfect information)。这里“完全但不完美信息” 指的是,自然作出了它的选择,但其他局中人并不知道它人具体选择是什么,仅知道各种选择的概率分布。这样一来,不完全信息博弈就变得可以进行分析了。在这个基础上,John C.Harsanyi定义了贝叶斯纳什均衡(Bayesian-Nash equilibrium)。
精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。有些书上或论文中也写成精炼贝叶斯纳什均衡。
具体来说,精炼贝叶斯均衡是所有参与人策略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。
完美贝叶斯纳什均衡的要点是在于当事人要根本所观察到的他人的行为来修正自己的有关后者特征的“信念”(主观概率),并由此选择自己的行动。完美贝叶斯纳什均衡是所有局中人策略和信念的一种结合,它满足如下条件:(a)给定每个局中人关于其他局中人特征的概率分布的信息,他的策略选择应该在每一个子博弈都构成贝叶斯均衡,也就是说,给定每个人有关其他人特征的信息的情况下,他的策略等待是最优的;(b)每个人有关他人特征的信念都是使用贝叶斯法则从所观察到的行为中获得的。
纳什均衡是完全信息静态博弈中的均衡,求解方法我想楼主一定会。子博弈精炼纳什均衡是完全信息动态博弈中的均衡,求解的方法主要就是逆向归纳法。贝叶斯均衡是不完全信息下的静态博弈,可以看成是完全信息静态博弈中的混合战略纳什均衡的极致。至于精炼贝叶斯纳什均衡,老师说太难了,所以我们也没学~建议LZ还是得静下来看看书,一两句话真的说不明白~
推荐一本书,概率论与数理统计。。