重复博弈(Repeated Games)与演化稳定策略(Evolutionarily Stable Strategies, ESS)是博弈论中两个至关重要的概念,它们帮助我们理解如何在长期的互动中维持合作,以及为什么某些行为模式在种群中能够稳定存在。与一次性博弈不同,重复博弈引入了时间维度,使得玩家能够考虑未来互动的结果,从而影响当前的决策。而演化稳定策略则从生物学的角度,解释了在竞争环境中,哪些策略能够抵抗“入侵”并持续下去。

重复博弈

重复博弈是指同一个阶段性博弈(如囚徒困境)被重复进行多次。这种重复性为玩家提供了奖励或惩罚过去行为的机会,从而可能改变博弈的均衡结果。

1. 有限重复博弈

如果博弈重复的次数是有限且已知的,那么根据逆向归纳法,理性玩家往往会选择在最后一个回合背叛(如果背叛是单次博弈的最优策略)。一旦最后一个回合背叛,倒数第二个回合的玩家也会预期到这一点,从而也选择背叛,依此类推,最终导致每个回合都背叛。这表明,在有限重复的囚徒困境中,合作是难以维持的。

2. 无限重复博弈与贴现因子

当博弈的重复次数是无限的,或者玩家不知道博弈何时结束时,合作就有了维持的可能。这是因为玩家不再有“最后一个回合”可以毫无顾虑地背叛。在无限重复博弈中,未来的收益变得重要。我们引入“贴现因子”(discount factor),用 δ\delta 表示,其中 0δ<10 \le \delta < 1。贴现因子反映了玩家对未来收益的重视程度:δ\delta 越大,未来收益越重要;δ\delta 越小,未来收益越不重要。

3. 合作策略:一报还一报与冷酷策略

在无限重复博弈中,一些策略能够促成合作:

  • 一报还一报(Tit-for-Tat):这是一种非常成功的策略。它最初合作,然后复制对手上一回合的行动。如果对手合作,我也合作;如果对手背叛,我也背叛。这种策略简单、善良(从不首先背叛)、可宽恕(如果对手重新合作,它也会重新合作)且坚决(对背叛会立即惩罚)。

    • 示例:在重复囚徒困境中,如果双方都采用一报还一报,那么它们会一直合作下去,获得持续的合作收益。
  • 冷酷策略(Grim Trigger):这种策略更为严厉。它最初合作,但一旦对手背叛,它将永远背叛。这种策略可以有效地阻止背叛,但缺乏宽恕性。

    • 示例:如果一个玩家采用冷酷策略,另一个玩家知道一旦背叛一次,将永远面临背叛,所以为了长期的合作收益,会更倾向于合作。

4. 民间定理(Folk Theorem)

民间定理是重复博弈理论中的一个核心成果,它指出在无限重复博弈中,只要贴现因子足够高,任何能带来比威胁点(minimax value)更高收益的合作结果,都可以通过纳什均衡来维持。这意味着在长期互动中,几乎任何形式的合作都有可能发生,只要玩家足够重视未来,并且能够有效惩罚背叛行为。

演化稳定策略(ESS)

演化稳定策略(Evolutionarily Stable Strategy, ESS)是约翰·梅纳德·史密斯(John Maynard Smith)和乔治·普莱斯(George R. Price)在生物学中引入的概念,用于描述在自然选择下,种群中能稳定存在,且不会被新策略“入侵”的行为策略。

1. ESS 的定义

一个策略 E 被称为演化稳定策略,如果满足以下两个条件之一:

  • 对于任何其他竞争策略 I(IEI \ne E),当种群中的大多数都采用策略 E 时,采用策略 E 的个体在与 E 交互时的期望收益,严格大于采用策略 I 的个体在与 E 交互时的期望收益。 E(E,E)>E(I,E)E(E, E) > E(I, E)
  • 如果当种群中的大多数都采用策略 E 时,采用策略 E 的个体在与 E 交互时的期望收益,等于采用策略 I 的个体在与 E 交互时的期望收益(即 E(E,E)=E(I,E)E(E, E) = E(I, E)),那么采用策略 E 的个体在与 I 交互时的期望收益,必须严格大于采用策略 I 的个体在与 I 交互时的期望收益。 E(E,I)>E(I,I)E(E, I) > E(I, I)

简而言之,ESS 是一种能够抵抗“突变”或“入侵”的策略。如果一个种群中的所有个体都采用 ESS,那么任何少量采用其他策略的个体都不会比 ESS 个体做得更好,甚至会更差,因此这个“突变”策略无法在种群中扩散。

2. 鹰鸽博弈(Hawk-Dove Game)

鹰鸽博弈是解释 ESS 的经典例子。假设有两种策略:鹰(Hawk)和鸽(Dove)。

  • :总是战斗,直到对手撤退或自己受伤。
  • :总是撤退,避免战斗。

假设:

  • 胜利获得价值 V。
  • 受伤损失 C。
  • 冲突中的时间浪费损失 T (通常忽略或设为0)。

收益矩阵可能如下:

鹰(Hawk)鸽(Dove)
(VC)/2(V-C)/2VV
00V/2V/2

通过计算,可以发现纯鹰策略或纯鸽策略都不是 ESS。而是混合策略——即在一定概率下表现为鹰,在一定概率下表现为鸽——才是演化稳定的。这解释了为什么自然界中动物间的竞争并非总是你死我活,很多时候存在仪式性的打斗或退让行为。

3. ESS 与纳什均衡的联系与区别

  • 联系:所有的纯策略 ESS 都是纳什均衡,但并非所有纳什均衡都是 ESS。ESS 是纳什均衡的一个子集,它增加了对“入侵”的鲁棒性要求。
  • 区别:纳什均衡关注理性个体在一次性互动中的选择,而 ESS 关注种群层面在演化过程中的策略稳定性,不要求个体具有理性思考能力,策略往往是“遗传”或“习得”的。

总结

重复博弈揭示了长期互动中合作维持的机制,特别是通过“一报还一报”和“冷酷策略”等条件性合作策略。它强调了未来预期和惩罚机制在塑造行为中的作用。演化稳定策略则从更宏观的生物演化视角,解释了为什么某些行为模式能够在种群中稳定下来,抵抗外部入侵,例如鹰鸽博弈中混合策略的稳定性。这两个概念都深化了我们对合作、竞争和策略稳定性的理解,无论是在经济、社会还是生物领域,都具有广泛的应用价值。

登录以使用 AI 功能

登录后可将此内容复制到你的账户,解锁全部 AI 学习工具。

登录