登陆注册
2959400000014

第14章 “重复囚徒困境”的游戏

其目的就是要研究在无限次数的“对局游戏”中人为什么要合作,人什么时候是合作的、什么时候又是不合作的,如何使别人与你合作。

一位美国科学院院士、著名的行为分析和国际关系专家罗伯特·艾克斯罗德搞了一场关于“重复囚徒困境”的游戏。

艾克斯罗德的游戏思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。在游戏中,有两个对策者,他们可以有两个选择:合作或背叛,每个人都必须在不知道对方选择的情况下,作出自己的选择。

艾克斯罗德邀请了来自经济界、心理学、社会学、政治学和数学领域的14位专家参与这一游戏。每个参加者每一步都要写出个体选择合作或不合作的程序,这个程序在作选择时可以利用对局的历史情况来分析,从而决定自己的策略。游戏双方的选择,放在一起就产生了四种可能的结果,即:

1.合作,合作;

2.合作,背叛;

3.背叛,合作;

4.背叛,背叛。

在这个游戏中,如果双方选择合作,双方都能得到较好的结果,即“对双方合作的奖励”为3分。如果一方合作而另一方背叛,那么,背叛者因为讨了对方的便宜,所以得到“对背叛的投机”5分。而合作者因为被对方占了便宜,只能得0分。如果双方都背叛,那么双方既没有占到便宜又似乎没有失去什么,所以都得到1分。

我们设想甲、乙两个程序在一起博弈,就出现这样的结果。

甲:合作(3)乙:合作(3)

甲:合作(0)乙:背叛(5)

甲:背叛(5)乙:合作(0)

甲:背叛(1)乙:背叛(1)

就这种情形看来,对双方来说最好的结果是选合作,总体得6分。如果一方选合作,一方选不合作,总体得5分。如果两人都选不合作,总体得2分。

竞赛是循环进行的,即每一个参赛程序都与其他程序相遇。按照事先宣布的竞赛规则,每一个参赛程序还要与自己对局,以及和一个“随机程序”相遇。所谓“随机程序”是指以相等的概率(50%)随机地选择“合作”或“背叛”。

艾克斯罗德要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两对局,以找出什么样的策略得分最高。

14个程序再加上一个“随机程序”彼此开始了第一轮游戏。

让我们来分析一下这个“重复困境游戏”。虽然对个体而言,最大的利益是得5分,但如果对局在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地得3分,这是一个相对理想的结果;但如果持续地不合作的话,每个人就永远得1分。因此,就整个参赛程序而言,不可能得到高分。这样,合作就成为了这个游戏的优势策略。

在这个游戏中,参赛者提出了各种程序,根据程序的本意大致可分为“善良的”、“邪恶的”和“随意的”三类。所谓“善良”策略即是“以合作为主”的策略;而“邪恶”策略则是“以占便宜为主”的策略。

最后胜出的是一个称为“一报还一报”策略,它是所有提交程序中最简单,结果却是最好的。“一报还一报”这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。

假设某人的策略是:第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。对于总是不合作的人,也只能采取不合作的策略。

为什么“一报还一报”这样一个简单的策略会打败其他学者绞尽脑汁写出来的复杂程序呢?

让我们再来反思一下“一报还一报”稳定成功的原因。简单地说,这个“以其人之道还治其人之身”的策略有着下面四个特点:

一、清晰性:以牙还牙,以眼还眼。以合作还合作,以背叛还背叛,使它容易被对方理解,从而引出长期的合作关系。

二、善良性:这种策略一开始便以善意和对方合作,也绝不会先背叛对方,这可防止它陷入不必要的麻烦。

三、报复性:如果对方背叛,下一次一定如法炮制,自动施以报复,决不原谅。报复性使对方试着背叛一次后就不敢再背叛;

四、宽容性:如果对方又主动恢复合作,要立刻与对方握手言欢,既往不咎,有助于重新恢复合作。

“一报还一报”策略是有关“囚徒困境”的最著名的也是被讨论最多的策略。它非常容易理解也非常容易被编成程序,更因为这个策略能引发人们的合作关系而著名。

“一报还一报”的成功可以说明它是一个很具适应性的规则:即它在很大范围内表现极佳。

有趣的是,“一报还一报”这个策略与单独某个策略相遇时,没有一次是赢了对方的,顶多是和对方打成平手。“一报还一报”策略从来没有一次在竞赛中比对方得更多的分!它总是让对方先背叛,而它自己背叛的次数也绝不比对方多。它的得分往往比对方少,至多与对方相等。但是,在与多样化的对手分别比赛之后,最后加起来的,它的总分仍然有可能是最高的。今天如果比赛的规则改变了,在单独比赛赢的人将得到所有的分数,输的为零分。那么“一报还一报”可能就没机会坐上冠军的宝座了。

“一报还一报”的成功部分是由于其他规则预料到它的存在并且被设计得与它很好相处。要和“一报还一报”很好相处就要求和它合作,这反过来就帮助了“一报还一报”规则。即使是那些想伺机占便宜而不被惩罚的规则,也很快向“一报还一报”规则道歉。

任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性中得到好处,这是因为遇到“一报还一报”的可能性是很大的。一旦相遇,“一报还一报”很容易被识别出来。一旦被识别出来,“一报还一报”的不可欺负性就显示出来。因此,“一报还一报”从它自己的清晰性中得到好处。

“一报还一报”放弃了占他人便宜的可能性。尽管这种机会有时是很有利可图的,但是在广泛的环境中,试图占便宜而引来的问题也多种多样。

在与“一报还一报”策略的接触中,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。如果双方的反击一旦开始,就很难使自己解脱。

最后,试图识别那些“随机”规则或者那些过分不合作的规则,并放弃与它们合作的努力,经常错误地导致放弃与其他一些规则的合作,而这些规则是可以被有耐心的规则,比如“一报还一报”这种规则挽救的。

当然,我们知道就有限的次数与对局者而言,“一报还一报”并不是最优策略,但却是整体得分最多的策略,它的成功在于它良好的适应性。

由于一个特定策略的有效性不仅取决于它自己的特性,而且取决于它要相遇的其他策略的特性。因此,单一竞赛的结果是不能最后说明问题的。

当第一轮的比赛结束后,艾克斯罗德把第一次的结果公开发表,并决定邀请更多的人再做一次游戏。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。第二轮比赛比第一轮有了一个更高的起点,因为每个人(程序)都已经从第一次比赛中成功的策略中获取经验,因此人们更期望它的结果对于指导下一轮的成功更有帮助。

令人意外的是第二轮胜出的仍然是“一报还一报”。但与第一轮不同的是,这一轮比赛由于绝大部分人都知道“一报还一报”的胜出事实,最有趣而令人惊奇的是,许多人在“一报还一报”原则的基础上试图改进与优化它,不过,令人惊奇的是这些提交的复杂程序没有一个能够表现得像原本的“一报还一报”那样好。既能占便宜又不会付出太大的代价是第二轮竞赛中任何一个参赛程序都想实现而没能够实现的。

“一报还一报”显然是经济、实用而且非常成功的策略。

第二轮竞赛不仅验证了第一轮比赛分析中得出的结论和发现,还使参赛者从第一轮竞赛的经验中吸取了自己的教训,但不同的人得到的教训不同。

同类推荐
  • 不懂心理学就做不好销售

    不懂心理学就做不好销售

    销售就是一场心理战,销售就是心与心的较量。销售界流传一句名言:“成功的销售员一定是一个伟大的心理学家。”一个成功的销售员往往不是因为有一副三寸不烂之舌,而是因为他精通销售心理学!如果你想钓到鱼,就得像鱼那样思考,而不是像渔夫那样思考。
  • 必要的改革

    必要的改革

    这是一段辉煌而传奇的改革历程,思路和理念在这里相互交织、碰撞。中国的改革涉及领域之广、局面之复杂,堪称波澜壮阔、前所未有。20年的理论与实践锻造了一个颠扑不破的真理,中国的改革一定是一场必要的改革。多位堪称影响了中南海的经济学家们分别从国际经济秩序、老龄化社会、医疗改革、宏观调控、克强经济学、中国式创新、经济增长和城镇化等方面深入探讨了中国改革20年的思想变革、政策制定和社会变化,给我们提供了一个深入观察中国改革发展历程的独特视角。这是一本足以唤起你对中国改革和发展20年五味杂陈的思索和回忆的书。在这本书中,作者以凝练、深邃的笔触描绘了中国20年的改革进程。
  • 零售巨头沃尔玛:零售业连锁经营的成功奥秘

    零售巨头沃尔玛:零售业连锁经营的成功奥秘

    随着中国经济持续稳定而快速地发展,在中国的商业画卷中,零售业毫无疑问是未来中国最具挑战性,也最具发展潜力的行业这一。如何正确地认识零售业,如何全面地理解和掌握零售业的知识,这是盘旋在每一个对零售业怀有浓厚兴趣的人心中的问题。本书选取了零售巨头沃尔玛的个案,一步一步,以一种全景式的、立体的手法向我们讲述了沃尔玛从创建、发展,到最终成为零售业巨鳄的富有传奇色彩的全过程。 崛起的策略、文化的策略、竞争的策略、销售的策略……本书中我们能够学到的不仅仅只是沃尔玛在商业竞争中战胜对手逐步走向卓越的众多策略,更重要的是对中国本土零售业的启示以及对于中国零售企业未来发展方向的一种更深层次的探讨和研究。
  • 中国式带队伍

    中国式带队伍

    《中国式带队伍:带队伍就是带人心》立足于中国人的特性,充分发掘和利用《易经》中的团队管理智慧,畅谈带队伍必须解决的分工协作、合理授权、协调沟通、文化建设、领导激励等问题,化成了可落地、可执行的解决方案。方法持经达变,案例典型接地气,见解深刻独特,可读性极强,是本书最大的特色。
  • 德鲁克管理思想(大全集)

    德鲁克管理思想(大全集)

    人人都需要德鲁克,无论你是老板、管理者,还是普通员工。老板能够从德鲁克深邃的眼睛里读懂什么是规划、目标、决策、人事、利润、创新等关乎企业生命的重大问题;管理者能够从德鲁克浩如瀚海的知识海洋里找到实现卓越管理的方法和工具;普通员工能够跟随德鲁克的教诲轻松应对人际关系、成效、自我成长、沟通、自我控制等关乎职场命运的多个困惑,从而实现职业上的高速成长。
热门推荐
  • 情到浓时,爱不宜迟

    情到浓时,爱不宜迟

    结婚前一天,江篱才惊闻相爱多年的未婚夫有个一岁多的私生子。私生子的母亲,却是她同父异母的亲妹妹。被未婚夫背叛,被亲妹妹陷害,被不知名的男人夺走贞洁……--情节虚构,请勿模仿
  • 彼颜策

    彼颜策

    【甜宠!软萌吃货+腹黑殿下】七万年前,同日而生。七万年后,初次相遇,便一见钟情。女主=吃货+软萌+超皮+可爱兔男主=腹黑+霸气+独宠+大灰狼遇见之后,再难分离。她要的他都给,她喜欢的他都给。教她笔墨纸砚,琴棋书画,人情世故。相守了多少个日夜,甜了多少个季节。春,他陪她踏春寻芳,日里放纸鸢。夏,他陪她池中摘莲,夜里赏繁星。秋,他陪她枫林漫步,晚间看落霞。冬,他陪她雪地徜徉,午间画暖阳。一朝阴谋,害得他被万千魔军围攻,身死神灭。一瞬消逝,怀中的空虚让她痛不欲生,心痛难已。擦掉眼泪,优雅站起,她要让三界为今日之事后悔!一双金眸,是爱人的情意执念。一双血瞳,是爱人的泯灭别离。她一双血瞳,让三界为之动摇!敢动我男人,让你们灰飞烟灭!最后……彼岸花海里,她跪在那里大哭嘶喊:“魄...你到底什么时候回来啊!”
  • 中华典故(语文新课标课外必读第十一辑)

    中华典故(语文新课标课外必读第十一辑)

    国家教育部颁布了最新《语文课程标准》,统称新课标,对中、小学语文教学指定了阅读书目,对阅读的数量、内容、质量以及速度都提出了明确的要求,这对于提高学生的阅读能力,培养语文素养,陶冶情操,促进学生终身学习和终身可持续发展,对于提高广大人民的文学素养具有极大的意义。
  • 树欲静而风不止

    树欲静而风不止

    你有没有想过,或许我们的这个世界并不只是眼前所看到的那样光明,在法律所探照不到的犄角旮旯里,存在着一个常人所看不见的深渊。你所行的一切都将被记录在册,时候到了,审判自然就会降临。--情节虚构,请勿模仿
  • 倒霉的小偷(原创经典作品)

    倒霉的小偷(原创经典作品)

    善读精品美文,拾取久违的感动;体悟百味人生,感受成长的快乐。阅读其间,时而在惊险悬疑的案件中悚然而惊,时而为体察入微的真情潸然泪下,时而又涌动着想针砭时弊的激情……掩卷而思,人性的美丑,世事的善恶,人生际遇的变幻无常不禁让人感慨万千。
  • 豪门第一盛宠:娇妻求撩

    豪门第一盛宠:娇妻求撩

    御白,帝都第一帝少,出身高贵。顾时笙,帝都超人气漫画家“占卜者”,书香门第。永远不可能相互纠缠的人居然睡在一起了,顾时笙表示“我有未婚夫了。”御白,“什么时候结婚?”顾时笙,“下个月五号,你要做什么!”“老子我抢亲。”顾时笙表示她是不是遇到了神经病?
  • 他是枪手

    他是枪手

    遇见一个一千年前就认识她的男人,可是她不认识他。
  • 驳圣伯夫:一天上午的回忆

    驳圣伯夫:一天上午的回忆

    本书作者对法国文学史上著名文学批评家圣伯父作品的批评与评价。既不是论文也不是小说,而是一部艺术作品。一块小玛德莱娜蛋糕,牵引出丝丝缕缕、连绵不绝的无意识回忆,然后笔锋一转,尖锐犀利。作者强烈抨击权威批评家圣伯夫批评方法的机械和错误,及因此造成的对当年法国文坛所有文学天才的轻视与误读。全书既有抒情的叙述,又有理 性的思辨,两者相辅相成,相互映照。书中有近半篇幅笔调与《追忆逝水年华》相似或呼应,是作者思想精华的浓缩,为后来的文本主义和结构主义批评奠定了第一块基石。
  • 菩萨戒本疏

    菩萨戒本疏

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 轻舟已过

    轻舟已过

    人生是一条回不去的河流。泛舟其间,苦乐自知。品兴亡更替,看世态炎凉,悟人情冷暖,写自己独特的感受。