重复博弈（Repeated Games）与演化稳定策略（Evolutionarily Stable Strategies, ESS）是博弈论中两个至关重要的概念，它们帮助我们理解如何在长期的互动中维持合作，以及为什么某些行为模式在种群中能够稳定存在。与一次性博弈不同，重复博弈引入了时间维度，使得玩家能够考虑未来互动的结果，从而影响当前的决策。而演化稳定策略则从生物学的角度，解释了在竞争环境中，哪些策略能够抵抗“入侵”并持续下去。

重复博弈

重复博弈是指同一个阶段性博弈（如囚徒困境）被重复进行多次。这种重复性为玩家提供了奖励或惩罚过去行为的机会，从而可能改变博弈的均衡结果。

1. 有限重复博弈

如果博弈重复的次数是有限且已知的，那么根据逆向归纳法，理性玩家往往会选择在最后一个回合背叛（如果背叛是单次博弈的最优策略）。一旦最后一个回合背叛，倒数第二个回合的玩家也会预期到这一点，从而也选择背叛，依此类推，最终导致每个回合都背叛。这表明，在有限重复的囚徒困境中，合作是难以维持的。

2. 无限重复博弈与贴现因子

当博弈的重复次数是无限的，或者玩家不知道博弈何时结束时，合作就有了维持的可能。这是因为玩家不再有“最后一个回合”可以毫无顾虑地背叛。在无限重复博弈中，未来的收益变得重要。我们引入“贴现因子”（discount factor），用 $\delta$ 表示，其中 $0 \le \delta < 1$ 。贴现因子反映了玩家对未来收益的重视程度： $\delta$ 越大，未来收益越重要； $\delta$ 越小，未来收益越不重要。

3. 合作策略：一报还一报与冷酷策略

在无限重复博弈中，一些策略能够促成合作：

一报还一报（Tit-for-Tat）：这是一种非常成功的策略。它最初合作，然后复制对手上一回合的行动。如果对手合作，我也合作；如果对手背叛，我也背叛。这种策略简单、善良（从不首先背叛）、可宽恕（如果对手重新合作，它也会重新合作）且坚决（对背叛会立即惩罚）。
- 示例：在重复囚徒困境中，如果双方都采用一报还一报，那么它们会一直合作下去，获得持续的合作收益。
冷酷策略（Grim Trigger）：这种策略更为严厉。它最初合作，但一旦对手背叛，它将永远背叛。这种策略可以有效地阻止背叛，但缺乏宽恕性。
- 示例：如果一个玩家采用冷酷策略，另一个玩家知道一旦背叛一次，将永远面临背叛，所以为了长期的合作收益，会更倾向于合作。

4. 民间定理（Folk Theorem）

民间定理是重复博弈理论中的一个核心成果，它指出在无限重复博弈中，只要贴现因子足够高，任何能带来比威胁点（minimax value）更高收益的合作结果，都可以通过纳什均衡来维持。这意味着在长期互动中，几乎任何形式的合作都有可能发生，只要玩家足够重视未来，并且能够有效惩罚背叛行为。

演化稳定策略（ESS）

演化稳定策略（Evolutionarily Stable Strategy, ESS）是约翰·梅纳德·史密斯（John Maynard Smith）和乔治·普莱斯（George R. Price）在生物学中引入的概念，用于描述在自然选择下，种群中能稳定存在，且不会被新策略“入侵”的行为策略。

1. ESS 的定义

一个策略 E 被称为演化稳定策略，如果满足以下两个条件之一：

对于任何其他竞争策略 I（ $I \ne E$ ），当种群中的大多数都采用策略 E 时，采用策略 E 的个体在与 E 交互时的期望收益，严格大于采用策略 I 的个体在与 E 交互时的期望收益。 $E(E, E) > E(I, E)$
如果当种群中的大多数都采用策略 E 时，采用策略 E 的个体在与 E 交互时的期望收益，等于采用策略 I 的个体在与 E 交互时的期望收益（即 $E(E, E) = E(I, E)$ ），那么采用策略 E 的个体在与 I 交互时的期望收益，必须严格大于采用策略 I 的个体在与 I 交互时的期望收益。 $E(E, I) > E(I, I)$

简而言之，ESS 是一种能够抵抗“突变”或“入侵”的策略。如果一个种群中的所有个体都采用 ESS，那么任何少量采用其他策略的个体都不会比 ESS 个体做得更好，甚至会更差，因此这个“突变”策略无法在种群中扩散。

2. 鹰鸽博弈（Hawk-Dove Game）

鹰鸽博弈是解释 ESS 的经典例子。假设有两种策略：鹰（Hawk）和鸽（Dove）。

鹰：总是战斗，直到对手撤退或自己受伤。
鸽：总是撤退，避免战斗。

假设：

胜利获得价值 V。
受伤损失 C。
冲突中的时间浪费损失 T (通常忽略或设为0)。

收益矩阵可能如下：

	鹰（Hawk）	鸽（Dove）
鹰	$(V-C)/2$	$V$
鸽	$0$	$V/2$

通过计算，可以发现纯鹰策略或纯鸽策略都不是 ESS。而是混合策略——即在一定概率下表现为鹰，在一定概率下表现为鸽——才是演化稳定的。这解释了为什么自然界中动物间的竞争并非总是你死我活，很多时候存在仪式性的打斗或退让行为。

3. ESS 与纳什均衡的联系与区别

联系：所有的纯策略 ESS 都是纳什均衡，但并非所有纳什均衡都是 ESS。ESS 是纳什均衡的一个子集，它增加了对“入侵”的鲁棒性要求。
区别：纳什均衡关注理性个体在一次性互动中的选择，而 ESS 关注种群层面在演化过程中的策略稳定性，不要求个体具有理性思考能力，策略往往是“遗传”或“习得”的。

总结

重复博弈揭示了长期互动中合作维持的机制，特别是通过“一报还一报”和“冷酷策略”等条件性合作策略。它强调了未来预期和惩罚机制在塑造行为中的作用。演化稳定策略则从更宏观的生物演化视角，解释了为什么某些行为模式能够在种群中稳定下来，抵抗外部入侵，例如鹰鸽博弈中混合策略的稳定性。这两个概念都深化了我们对合作、竞争和策略稳定性的理解，无论是在经济、社会还是生物领域，都具有广泛的应用价值。

重复博弈与演化稳定策略 25 分钟