重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。
首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。
奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。
其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这种分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。