登陆注册
5686900000008

第8章 打破“囚徒困境”(1)

在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。

囚犯的救赎

为了验证面对“囚徒困境”时人们可选择的策略以及这些策略的有效程度,美国的学者组织了一次以此为主题的计算机竞赛。竞赛要求参加者根据这一困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。

竞赛的游戏方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果R,即“对双方合作的奖励”。在这个例子中R为3分,3也可以代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”T=5。而合作者则得到“给笨蛋的报酬”S=0。如果双方都背叛那么双方都得到P=1,即“对双方背叛的惩罚”。

参赛者提出了各种程序,但是大致可分为“善良的”、“邪恶的”和“随意的”三类,竞赛的结果也许有些出人意料:“善良”即“以合作为主”的策略大获全胜,而“邪恶”即“以占便宜为主”的策略成绩不佳。

现在考虑一个双方对局的例子。一个对策者采用的策略是每一步都背叛,即“总是背叛”,另一个对策者采用的策略是“一报还一报”,即在第一步合作,然后就采用对方上一步的选择。“一报还一报”意味着在对方每一次背叛之后就背叛一次。当对方采用“一报还一报”时,采用“总是背叛”的对策者,将在第一局得到收益,在而后的对局中都得到相应的回击。这样,这个背叛者只是在第一局得到5分,而在以后的每局都只能得到1分,最终他可能会“战胜”对手,但由于总分仍然很低,而被淘汰出局。

你可能忍不住要问:“什么是最好的策略?”换句话说,什么策略能使对策者得到可能的最高分?这个问题问得很好。但是就像以后要说明的一样,独立于对方所用策略之外的最好决策规则是不存在的。从这个意义上说,“囚徒困境”完全不同于一般游戏,如国际象棋。一个象棋大师可以有把握地假定对手将走让他最头疼的一步,这种假定是这类游戏的基础。然而在这里,游戏者的利益并不是完全冲突的。双方可以通过合作而得到“对合作的奖励”R,也可以通过背叛而得到“对背叛的惩罚”P。如果你假定对方总是走你最担忧的一步,那么,你就会认为其他人总是不合作,这就会使你也不合作,最后招来无休止的惩罚。所以与下棋不同,在“囚徒困境”中假定对方一心要赢你是不可靠的。

事实上,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,如果你不太关心自己未来的利益,那么,你现在最好是背叛,而不用担心未来的后果。

这样,我们得到了第一个正式的结论,但却是一个令人伤心的结论,即:如果未来是重要的,就不存在最优策略。

“一报还一报”的伟大胜利

区分善良规则好坏的一个特征是,看它们如何迅速地和可靠地对来自对方的挑战作出反应。一个规则可以被称为“报复性的”,如果它在对方的背叛之后立即以背叛报复。除非一个策略能迅速反应来自对方的挑战,否则,对方将简单地从这样一个好说话的策略身上获得越来越多的好处。

在比赛中,有好几个规则故意使用若干次背叛,试试看它们能否讨到便宜。因此,很大程度上决定善良规则的最后名次的是它们能否很好地应付这些挑战。

对付这类挑战性规则的最好办法是时刻准备报复来自对方“无缘无故”的背叛。因此,善良能得到好处,报复也能得到好处。“一报还一报”综合了这些优点,它是善良的、宽容的和具报复性的。它从不首先背叛,但是不管过去相处的关系如何好,它总能被一个背叛所激怒,而迅速作出反应。

生态分析的结果说明了“一报还一报”的又一个胜利。在最初的竞赛中“一报还一报”领先一点点,而且在整个生态模拟过程中一直保持领先。到了第1000代,它是最成功的规则,并且比任何一个其他规则都增长得快。

“一报还一报”的所有记录是令人难忘的。概括地说,“一报还一报”是62个参赛者中平均得分最高的规则。在竞赛的生态模拟中它一直保持领先。加上它在实验室的对策实验中的良好表现,“一报还一报”显然是一个非常成功的策略。

“一报还一报”的成功可以说明的是它是一个很具适应性的规则:即它在很大范围的环境中表现极佳。它的成功部分是由于其他规则预料到它的存在并且被设计得与它很好相处。要和“一报还一报”很好相处就要和它合作,这反过来就帮助了“一报还一报”。即使那些被设计成伺机占便宜而不被惩罚的规则,也很快向“一报还一报”道歉。任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性得到好处,是因为以下三个条件得到了满足:1.遇到“一报还一报”的可能性是显著的;2.一旦相遇,“一报还一报”很容易被识别出来;3.一旦被识别出来,其不可欺负性就显示出来。因此,“一报还一报”从它自己的清晰性中得到好处。

另一方面,“一报还一报”放弃了占他人便宜的可能性。这种机会有时是很有利可图的,但是试图占便宜而引来的问题也多种多样。首先,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。第二,双方的反击一旦开始,就很难自己解脱。

“一报还一报”的稳定成功的原因是它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作。它的清晰性使它容易被对方理解,从而引出长期的合作。

你不必每次都赢

虽然预见对于合作的进化不是必要的,但它却对我们很有帮助。因此在这里将分别对参与者和改革者提供建议。

下面为那些处于“囚徒困境”的人提供建议。从个体的眼光看,目标是在与对手的一系列对局中尽可能地得高分。由于这个游戏是“囚徒困境”,参与者会受到背叛的短期诱惑,但是通过与对方建立双方合作的模式可以得到更多的长期好处。对计算机竞赛的分析和理论研究的结果,为我们提供了一些有用的信息,即在不同的条件下什么样的策略会起作用和为什么这些策略能表现得好。这一章就是把这些发现转化成对参与者的建议。

在持续的“重复囚徒困境”中应如何表现,下面是四个简单的建议:

1.不要嫉妒

人们习惯于考虑零和对局,在这种情况下,一个人赢,另一个就输。一个很好的例子就是下棋比赛。为了能赢,一个参赛者必须在大部分时间里比对手做得更好。白棋赢黑棋就输。

然而生活中的大多数情况都是非零和的。双方可以都做得很好,也可以都做得很差。双方的合作是可能的,但并不是总能实现。这就是为什么“囚徒困境”是各种各样的日常情形的有用模型。

人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功对立起来。这种标准导致了嫉妒,嫉妒导致企图抵消对方已经得到的优势。在“囚徒困境”的形式下,抵消对方优势只能通过背叛来实现。但是背叛导致更多的背叛和对双方的惩罚。因此嫉妒是自我毁灭。

要求自己比对方做得好不是一个很好的标准,除非你的目的是消灭对方。在大多数情况下,这个目的是不可能实现的。

“一报还一报”由于与其他多种多样策略相处得很好而赢得了竞赛。平均来说,它比竞赛中的其他任何策略都做得更好。但是“一报还一报”从来没有一次在游戏中比对方得更多的分!事实上,它不可能比对方多得分。它总是让对方先背叛,并且它的背叛次数决不比对方背叛的多。因此“一报还一报”不是得到和对方一样多的分,就是比对方略少。“一报还一报”赢得竞赛不是靠打击对方,而是靠从对方引出使双方有好处的行为。“一报还一报”如此坚持引出双方有利的结果,从而使它获得比其他任何策略更高的总分。

因此在一个非零和的世界里,你没有必要非得比对方做得更好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得好就没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。

在生意场中也是这样,一个从供应商那儿买来东西的公司期望供方和买方都有好处的成功的关系。妒忌供方的利润是完全没有意义的。任何通过不合作行为(如不按时付账)来减少这种利润的企图,都将激起供方的报复行动,报复行为可以采用多种形式,经常以不明显惩罚形式,诸如拖延发货,较低的质量保证,不愿意打折扣,或者不交换市场条件变化的信息。这种报复使得嫉妒代价很大。买者不要担心卖方的相对的利润,而可以考虑是否有其他更好的购买策略。

2.不要首先背叛

竞赛和理论分析的结果都表明,只要对方合作你也合作就会有好处。竞赛结果是很令人吃惊的。决定一个规则表现如何的惟一最好的特征是这个规则是否善良。也就是说这个规则是否不首先背叛。在第一轮竞赛中,前8名规则中都是善良的,在后7名规则中没有一个是善良的。在第二轮竞赛中,前15名规则中只有一个是非善良的(它名列第8),而后15名规则中只有一个是善良的。

有些不善良的规则,使用相当复杂的方法来试探它是否能逃脱惩罚。例如尝试在第一步背叛,如果对方报复的话,它就马上撤回。在另一个例子中,它在背叛前等待十几步,看看对方是否能被哄骗和被偶尔占便宜。如果是的话,就更频繁地增加背叛,直到对方反击而被迫撤回。但是这些尝试道德背叛的策略都表现得不怎么好。因为存在许多由于愿意报复而不被占便宜的策略,所以导致冲突的代价有时是很高的。

甚至许多专家也没有意识到善良性对避免不必要的冲突的价值。在第一轮竞赛中,由对策论专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果,第二轮比赛中大约有1/3规则用不善良的策略,但是,它们都没有占到便宜。

前面的竞赛结果提供了另一个方式来说明为什么善良的规则能表现得如此好,由于善良的规则相互之间相处得很好,因而善良规则的群体是很难被侵入的。而且能够阻止单个变异个体侵入的善良规则的群体也能阻止这个变异规则的任何小群体的侵入。

当然,你可以尝试更保险的方式,即先背叛直到对方合作,才开始合作。然而,竞赛的结果表明,这实际上是一个很有风险的策略,因为你的最初的背叛就可能引起对方的报复,并使你处于要么被占便宜要么双方背叛的两难境地。如果你惩罚对方的报复,这种反应就会一直延续下去。如果你宽恕了对方,你就得冒被欺负的风险。即使你能避免这些长远问题,对你的最初背叛的当下报复会使你希望自己从一开始就应该是善良的。

对竞赛的生态分析揭示了另一个为什么首先背叛是很冒险的道理。第二轮竞赛中前15名规则中惟一的非善良策略是名列第8的“哈林顿”。因为它与竞赛中的名次较低的规则相遇的得分都很高。在假想的未来生态竞赛中,名次较低的规则在群体中的比例越来越小,最终能被这个最初挺成功的非善良策略占便宜的策略就越来越少,接着它自己也消亡了。因此,只会占“傻瓜”的便宜是没有用的,它只不过是一个自我毁灭的过程。这个教训说明,虽然不善良在最初看来似乎是很有希望的,但长期下去它将毁坏使自己成功所必需的环境。

3.对合作与背叛都要给以回报

“一报还一报”超常的成功给出了一个简单的但又是很有力量的建议:要回报。在第一步合作之后,“一报还一报”只是简单地回报对方在上一步的所为。这个简单的规则惊人地有效。它赢得了第一轮“囚徒困境”计算机竞赛,并取得比任何其他由对策论专家们送来的规则更高的平均得分。每一个第二轮竞赛的参加者知道这个结果,但“一报还一报”又赢了第二轮竞赛。这个胜利显然是令人惊讶的。因为每一个参赛者都是在考虑了“一报还一报”在第一轮竞赛中的胜利结果之后,才提交参赛规则的。显然人们都希望能干得更好,但是他们错了。

“一报还一报”不仅赢得竞赛本身,而且在假设的继续比赛中比其他任何规则表现得都好。这表明“一报还一报”不仅与最初的各种规则相处得很好,而且能与那些可能在未来群体中占较大份额的成功的规则相处得很好,它不毁坏自己成功的基础,相反它在与其他成功的规则相互交往中繁荣起来。

同类推荐
  • 经济法理论与实训教程

    经济法理论与实训教程

    经济法是我国社会主义法律体系中的重要组成部分,是一门独立的部门法。经济法是国家对社会的经济活动实行宏观调控与管理的重要工具,是国家机关、企事业单位、各种社会经济组织以及公民个人在社会经济活动中的行为准则。
  • 创新创业5W:以色列奇迹对中国经济转型的启示(犹太智慧典藏书系 第三辑08)

    创新创业5W:以色列奇迹对中国经济转型的启示(犹太智慧典藏书系 第三辑08)

    犹太人被全球公认为“世界第1商人”,以色列被誉为“中东硅谷”和“创业的国度”,拥有3000多家高科技企业,堪称创造世界经济奇迹的“最小的超级大国”。其创新创业的奥秘何在?作者研究犹太文化20多年,先后6次探访以色列,写过20多本专著,并于2015年开始在内蒙古创办中以创新创业示范园,通过理论和实践给出了自己独特的答案,有助于中国的企业家和大学生打开“大众创业,万众创新”成功的大门。
  • 可持续发展目标使用手册(谷臻小简·AI导读版)

    可持续发展目标使用手册(谷臻小简·AI导读版)

    本书是联合国经济和社会事务部可持续发展司为帮助各级政府(国家、地区政府和基层政府)更好地理解可持续发展目标的进程而编写的手册,参考了联合国千年发展目标的相关经验,为各国更好地落实可持续发展目标提供了指导性原则。
  • 后谷歌时代:大数据的没落与区块链经济的崛起

    后谷歌时代:大数据的没落与区块链经济的崛起

    《后谷歌时代》一书的作者乔治·吉尔德是一位颇具远见卓识的智者。他在技术和文化领域具有无与伦比的视野和见地。他向读者描述了谷歌所面临信任与安全危机,并勇敢地预测了即将到来的后谷歌时代。谷歌的“搜索和排序”能力吸引了世界。看似免费小应用,诸如视频、地图、电子邮箱等让用户欲罢不能。但一个没有价格竞争的体系必将扼杀创业精神,并最终将互联网变成广告的荒原。缺乏信任与安全是谷歌致命的弱点,且当前的计算机和网络体系无法解决这一危机。如果价值和安全不是信息技术体系结构的组成部分,那么这个体系结构必将被替换。作者认为长期由少数巨头把持的互联网将面临着一场“大拆解”。
  • 哈佛教授讲授的300个经济学故事

    哈佛教授讲授的300个经济学故事

    基尼系数、恩格尔系数、拉弗曲线、破窗理论、银根紧缩 、市场泡沫、金融危机……这一系列陌生又严肃的经济学术语让我们面对经济学总是提不起劲。不过经故事包装,他们又变得亲和、好沟通。如果你是经济学的初级入门者,用故事来解释经济学再适合你不过了。
热门推荐
  • 鸦雀无声

    鸦雀无声

    偏远小镇,声名显赫的周氏族人相继离奇遇害,灾难却指向周家古老的“双胞胎诅咒”,看似繁华的周家,似乎隐藏着不为人知的故事。案件扑朔迷离,侦探段一受邀前来调查,抽丝剥茧的过程中,当人们以为真凶已被找到时,却又发现一个隐藏多年的偷天换日的秘密……--情节虚构,请勿模仿
  • 漠乌河传奇

    漠乌河传奇

    乌河大地,天降七石。灼灼异彩,分而不合,是为:赤霞、橙雪、黄风、绿雨、青云、蓝雾、紫烟。得七石而凝其魂,采天地之灵气,聚日月之精华;备尧舜之大德者,始昭昭然天下……上至帝王将相之尊,下至引车卖浆之流,无不粉墨登场。嬉笑怒骂,凭一时之意气;爱恨纠葛,随百世之情缘。权欲纷争,欲罢不能;刀光剑影,谁留芳名?宇宙何浩瀚,光明传永恒……
  • 海关密档:民国海关事件掠影

    海关密档:民国海关事件掠影

    民国以降,外籍税务司海关制度依然尾大不掉。中国的国门不是中国人看守,而是外国人把持!从晚清政府削弱海关权力,到孙中山南方革命政权与洋人叫板;从地方军阀动摇海关根基,到北洋政府与南京国民政府对海关权益逐步回收,外籍税务司制度日趋式微,直至在天安门广场开国大典的礼炮声中随风而逝。但是,那曾经激荡在历史天空中的一幕幕海关风云,却永远不会湮没……本书以六位民国风云人物参与的重大海关事件为切入口,在全景展现收回海关主权艰难历程的同时,折射出海关视野里斑斓多彩的民国历史镜像。
  • 棋道军神

    棋道军神

    他是一个百年不遇的棋坛鬼手,却因国破家亡走了抗日的道路。从此后,哈尔滨又多了一个让鬼子闻风丧胆的名字——陈抗日!他神奇地将棋道与兵法融合在一起,以棋为战,以战为棋,摆出了一盘盘惊世骇俗的绝世棋局,更导演了一场场惊心动魄的战争奇迹。“绝唱双台子”、“智取老爷岭”、“扬威太阳岛”、“运筹松峰山”、“勇夺平山镇”、“火烧黄天荡”、“棋炸观音堂”……战争在他的棋盘上已经演绎成为一门艺术。日本人惊呼,国民党瞠目,土匪咋舌,但殊不知,这一切的精妙决杀都不过是他提子落子之间的谈笑之举。 战争在他的棋盘上没有固定的法则,正如他的人生总是让人出乎意料一样。
  • 格列佛游记

    格列佛游记

    这是一部充满童话色彩的讽刺小说。但小说的童话色彩只是表面的局部的特征,尖锐深邃的讽刺才是其灵魂。小说的主人公格列佛是一个天生喜欢冒险,不甘寂寞与无聊的人。他记忆力很强,善于学习和观察,善于思考,有独特的思维,性情朴实温和,对人态度友好,举止善良,容易与人交往,知恩图报,有君子之风,愿意帮助朋友,为了朋友他甘愿冒生命危险,也会随时准备抗击一切对朋友不利的人。同时他聪明机智,有胆识,处事圆滑合理,说话巧妙伶俐,做事坚决果断,有着极强的自信心,相信自己能够成功。总的来说他是一个具有质疑精神,酷爱真理,有忍耐力的游者。他在游历之中,洞察到社会现实的日趋堕落,得出英国社会并不文明的结论。
  • 追妻无门:女boss不好惹

    追妻无门:女boss不好惹

    青涩蜕变,如今她是能独当一面的女boss,爱了冷泽聿七年,也同样花了七年时间去忘记他。以为是陌路,他突然向他表白,扬言要娶她,她只当他是脑子抽风,他的殷勤她也全都无视。他帮她查她父母的死因,赶走身边情敌,解释当初拒绝她的告别,和故意对她冷漠都是无奈之举。突然爆出她父母的死居然和冷家有丝毫联系,还莫名跳出个公爵未婚夫,扬言要与她履行婚约。峰回路转,破镜还能重圆吗? PS:我又开新文了,每逢假期必书荒,新文《有你的世界遇到爱》,喜欢我的文的朋友可以来看看,这是重生类现言,对这个题材感兴趣的一定要收藏起来。
  • 齐天野史

    齐天野史

    所有人对修炼这件事在微观上的原理都含糊其辞,为什么?修炼究竟真的只是一种幻想还是人类未来进化最正确的方向?所有人都认为修炼资源是修士争夺的核心,貌似只要有了资源就有人一定能修炼到功参造化,真的么?这个宇宙中所有生命体的存在终归只是利益论吗?那谁是最终受益者?所有人都说地球上元气枯竭,所以没有厉害的修炼者,可所有人又都说一切都是天地元气构成的,这不矛盾吗?天地元气构成了万物以后都死哪去了?要么是猜测,要么是谎言。可猜测并不可怕,没有猜测就没有进步,人类的成就都起源于幻想。但是谎言,一定要拆穿它。我们来拆拆看,看看古往今来的经典论调有多少能经得起拆解。我可能疯了,作为一个从未来异空间回来度假的人,居然在这些事情上和你们认真了。闲得蛋疼准备把这一切解释解释,还选了一个谁也惹不起的人来做主角。
  • 替婚新娘:总裁好好爱

    替婚新娘:总裁好好爱

    婚前,他是她的准姐夫,婚后,他是她那索欢无度的丈夫!结婚一年不到,她负气离开!再归来,她已是当红女主播!“老公,那个人说我潜规则!”“我不叫规则!”他笑得妖孽,“但规则是我定的!”某天。“老公,她说你不行诶。”夜景恒立马给她买了一块昂贵的表:“今晚看好时间。”孟愉喷血。又某天。“老公,今天我要和当红某男巨星做节目,你听听我的台词。”……良久。孟愉:“你脱衣服干嘛?”夜景恒:“这个桥段,你该摸男明星的肌肉。”他一脸阴沉,将她吃干抹净,“还有力气摸吗?”孟愉半死不活。第二天,她的节目变成了文化类节目。【推荐我的新书《傲娇男神住我家:合租99天》】
  • 新闻精品是这样采写成的

    新闻精品是这样采写成的

    本书向读者一一介绍什么是新闻精品,新闻精品是如何抓问题的,是怎样进行访问、观察和调查研究的,是怎样求新的;新闻精品的标题、导语、背景、结尾是怎样写就的;新闻精品的语言、美感和角度是如何选择和运用的;新闻精品是怎样采写典型报道、人物通讯、经济新闻、会议新闻、批评报道的;新闻精品是怎样进行长期积累和精心修改出来的,等等。《新闻精品是这样采写成的》第一版2009年出版以后,受到了读者的欢迎与厚爱。近十年间,作者在继续探索新闻精品形成的规律、特点过程中写就了26篇文章,共计约10万字,经整理补充进书中,并删去原书中不够精练的部分文章。
  • 日本推理小说界人气作家作品精选(套装10册)

    日本推理小说界人气作家作品精选(套装10册)

    日本推理小说界人气作家作品精选,套装10册:《白金数据》、《沉睡的人鱼之家》、《拉普拉斯的魔女》、《睡在豌豆上》、《远野物语拾遗》、《寻找回忆的人》、《超能者》、《强蚁》、《D坂杀人案》、《两钱铜币》。10册小说内容取材广泛,构思独特,情节扑朔迷离,悬念迭起。推理逻辑严谨,结局出人意料,不读到最后一刻,永远不会知道谁才是真正的凶手!