“合作的进化”:经典结果的一个简述


我对the evolution of cooperation的兴趣始于阅读Axelrod的同名著作,写这篇小文章的直接动因则是因为了解到William Press和Freeman Dyson (此老绝对是“廉颇”而不是“冯唐”)最近的研究成果。必须事先声明的是我对进化博弈论的认识是很浅的,只是以在各个学科间游荡的“唐璜”的身份来陈述我的所见所闻所思所感。理解不够准确深入,又或者对重大结果视而不见的情况很可能发生,还希望诸君赐教,博我以“闻”——这是写这篇文章的另一个目的。

非零和博弈中最经典的情景当属“囚徒困境”:为追求个人最优,囚徒的支配性策略是背叛同伴,此时整体最优——即“合作”——是不会出现的。即使允许混合策略,这也是Nash均衡,情况不会有任何改变。

Axelrod的观察在于,若考虑“重复囚徒困境”,即要求博弈的回合数足够长,而参与者可以基于博弈的历史反复重新选择策略(即允许比混合策略更复杂的“智能策略”)1,则合作可能出现。

在允许“智能策略”的情况下,纯理论演绎并不像在经典的Nash均衡中那样有用。Axelrod改而采用“实验-归纳”的方法:他举办了两场世界性的计算机程序竞赛,结果“一报还一报”/“以牙还牙”(tit for tat, TFT)在两次模拟中均脱颖而出:它在第一回合选择合作,之后模仿对手上一回合的策略——即孔夫子所谓的“以德报德,以直报怨”。TFT能诱导其他策略形成合作,而在一个合作的环境里,“善良”策略将有更好的表现,从而巩固TFT的地位——这一正反馈现象的道德推论似乎是特别令人满意的。

Axelrod的结果对于博弈论(以及社会学、政治学和生物进化论)有极大的影响。例如,网站BitTorrent就使用TFT维护社区稳定和优化下载速度。

此后有无数学者(当然包括Axelrod自己)对“一报还一报”进行了更详细的考察:

(1) 称某种策略是进化稳定的,若其他策略的“小规模”迁入仅能造成“小”的影响(即鲁棒性Lyapunov稳定性)。TFT对于其他几种典型的“简单策略”(“永远背叛”,“交替合作与背叛”, “永远合作”,“一经背叛,永不宽恕”)是进化稳定的。事实上Axelrod进行了第3次竞赛以考察各种策略的长期演化效应,模拟显示TFT在相当复杂的环境中也能保持进化稳定。

(2) 噪声:一次简单的误会可能导致2个TFT策略陷入无穷无尽的互相惩罚中。消除噪声有2种常用的方法:一为宽容,即”一报还数报”(gracious tit for tat, GTFT),例如在3次背叛中仅随机给予2次惩罚;一为悔悟:在己方的背叛遭到对方反击后立即改用合作策略。在合作的环境里,前者比TFT表现得更好,而后者则可以有效地防止对方恶意使用噪音。

(3) 遗传和同化:生物学对合作的形成和演化提供了更深的洞见,一个关键性的想法是将策略修正为动态的,即允许一定概率的中性突变。此时少量“永远合作”者的迁入将使TFT不可逆转地漂变为“永远合作”从而失去战斗力(“逸豫亡身”)。反之,更为圆滑的“胜-保持,败-改变”(win-stay, lose-shift, WSLS, Axelrod称其为“Pavlov策略”)则有相当出色的表现:它既能抵抗“永远背叛”的入侵,又能防止向“永远合作”的漂变。

另一个很有趣的方向是将细胞自动机(“生命游戏”)引入模拟:此时不同的竞争者被安放于不同的地域,每个竞争者只和邻居发生竞争,并假定足够强的周边环境能“说服”某个竞争者改变策略。这个模型可以模拟语言和文化的形成。

(4) 族群:为纪念the evolution of cooperation出版20周年,04年又重新进行了一场程序竞赛。此次大出风头的是一种“有预谋的集团入侵者”策略:采取这种策略的程序有5到10个标志性的小动作,一旦认出队友就将永远保持合作,否则将采取严格的背叛策略。个人觉得这个结果非常有趣,它事实上强调了族群(或者亲缘关系)在策略竞争中的意义。按照Nowak的观点,这也是合作形成的机制之一。

(5) Press和Dyson发现了一种称为零行列式的新策略(zero determinant strategy, ZD) 使得在二人重复博弈中参与者A可以完全控制另一个参与者B的收益,或者强迫B按某种比例分配收益。“幸运”的是,这种策略不是进化稳定的,除非A掌握某种信息优势(在多人游戏中能识别其他潜在的“压榨者”)。

最后是一点个人意见:进化博弈论最适用的领域大概是生物学。对于社会学以至于更复杂的政治博弈,像TFT般简单的模型仅有隐喻价值。归根究底,人是无法化归为一系列公设的。但有时我也会想,在政治哲学的经典著作里,常假定自然人有齐一的属性,遵守某些先验的定律,这种简单粗糙的假定与TFT的普适性相比只有更加等而下之。从这个角度看,Axelrod引发的研究或许已动摇了《利维坦》或者《社会契约论》立论的基础。

(一个不太恰当的类比是这样的:在研究一组常微分方程时,经典政治哲学选择了一个最简单的初态来作演绎的基础,而Axelrod则对一类初态找到了一个(至少是潜在的)吸引子。)

Reference

R. Axelrod  the Evolution of Cooperation

R. Axelrod  the Complexity of Cooperation:Agent-Based Models of Competition and Collaboration

M.Nowak  Evolutionary dynamics: Exploring the Equations of Life

Useful Link

The Iterated Prisoner’s Dilemma Competition


  1. 此处隐含的假定是参与者对博弈的历史有足够的监督能力,这要求参与博弈的个体不能太多。在细胞自动机模型里,这个限制以“局部博弈”的形式出现。 

2 thoughts on ““合作的进化”:经典结果的一个简述

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s