登陆注册
2686300000002

第2章 认识博弈论(1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门科学。用我们日常的语言来说,博弈论就是研究在不同情境下的策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并加以实施各自所倾向的行为或是策略,并从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例。《孙子兵法》、《三十六计》、《三国演义》等等,就不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究象棋、围棋以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论化发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家约翰·冯·诺伊曼证明了博弈论的基本原理,并与经济学家奥斯卡·摩根斯坦合作于1944年发表了《博弈论与经济行为》一书,提出合作博弈的基本模型,并将二人博弈结构推广到n人博弈结构。至此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生的标志。

目前,博弈论作为分析和解决冲突和合作的理论工具,已经在管理科学、国际政治、经济、外交和社会学等领域得到广泛的应用,为解决不同实体的冲突和合作提供了宝贵的方法,并日渐发展成为一热门学科。

博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者构成一个决策主体。

决策主体的目的是通过选择行动或者战略以使自己的效用水平最大化。只有两个决策主体的博弈现象称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业,国家等。

——策略策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终地对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用效用,又叫做支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈的付出或者收益。效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所取定的一组策略有关。一局博弈结束时每个决策主体的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所做的是努力使自己的期望支付或期望效用最大化。

——按照参与者能否形成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行的博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成合作时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行约束,以达到获取更多垄断利润的行为。

反之,不能强迫其他参与者遵守某一协议,各参与者只能选择自己的最优战略的,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动的顺序,可以分为四种不同的类型,即:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,规定每个决策主体的行为规则。如果在没有外在强制性约束时,各参与者自觉遵守该协议,没有人偏离协议规则,就构成一个纳什均衡(概念见第2章)。只要有一个参与者违背协议规定,则此协议就不构成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预期到这一点,所以也会考虑到自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。每个参与者的最优策略只能是在给定自己的类型和他人类型依从策略的情况下,最大化自己的期望效用。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择并获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行为的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣,理论上又颇有深度的学问。可以毫不夸张地说,了解博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择行为,而策略选择问题实际上就是博弈论的本质所在。

多种立场,一个思想

囚徒困境最早是由美国普林斯顿大学数学家塔克于1950年提出来的。他当时编纂了一个故事,意在向斯坦福大学的心理学家们解释什么是博弈论。后来经过发展,囚徒困境成为了博弈论中最著名的案例之一。

所谓囚徒困境,大意是这个样子的。有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。

针对两人的狡辩,警方对他们采取了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:

本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,根据将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期。如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放。当然,如果你们两人都坦白,那么你们都将只被判15年刑期。在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年徒刑)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。

心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。

汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢15年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。

同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人”。基于此基础之上的合作才能形成一个和谐的、良好的社会环境。

在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。

实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是典型的囚徒困境现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。

如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些联盟往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。

合作,有时是利益需要

农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,交通不便,使得两户人家与外界的交流十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户人家从修好的这条路上获得的好处为3个单位。如果没有中间人协调,上官、欧阳两家就各自打着自己是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户人家获得的好处为1(3-2=1)个单位;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为-1(3-4=-1)个单位,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路(修路人并没有拥有道路的占有权,总不能因为修了路就不让邻居走),白白获得3(3-0=3)个单位的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。

对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势策略;若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势策略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:

大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有自私本性但并不刻意损害他人的人类一员。

公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此作出丝毫贡献。那么,这长椅由谁来设置呢?恩惠于大家的公共事情又由谁来管呢?

同类推荐
  • 苦难给我的21个人生哲理 

    苦难给我的21个人生哲理 

    人的一生中,总有一些事使我们的人生不是那么顺利,有的人便在逆境中自甘沉沦或者自怨自艾;有的人却能够发奋图强,走向成功。梅花香自苦寒来。苦难并不可怕,可怕的是人们面对苦难时的心态,越脆弱的心越容易堕入深渊不可自拔,而坚强乐观的心永远不会被打垮。正确面对苦难,它能激发愤懑、提供慰藉;它使人生之路满布荆棘,也使我们学会独立。本书以最励志、最精彩的故事来讲述苦难中蕴含的人生哲理,苦也好,难也罢,美好的生活来自逆境中的抗争。接受苦难、利用苦难才是大智大勇的强者。
  • 给女白领看的职场减压书

    给女白领看的职场减压书

    现代女性,感情、婚姻、职场这三大方面成了压力的“制造源”。心理专家认为,女白领婚姻比较脆弱,第三者的介入,婚育期的限制等等,无论女性有多能干,多有才华,其职业上升的过程也会比男性更曲折。希望这本专为女白领们量身定做的减压书,能给在职场承受着压力、辛勤打拼的女士们的心灵带来春天般的慰藉。
  • 穿着拖鞋出走

    穿着拖鞋出走

    在乍暖还寒的初春,请翻开这本能带给你信心与力量的书,它将指导你如何坚持自己的梦想;如何减少拖延和推迟;如何选择与放弃;如何增强信心和勇气;如何开始行动;最终享受精彩的未来。待你阅后,也许,你生命的火花就此迸发了。
  • 菜根谭的智慧(全集)

    菜根谭的智慧(全集)

    本书在原文的基础上,对原文进行了归类,参考前人注解,对原文中难解的字词作了注释,为原句配上了相应的译文,尤其是加上了精彩的点评,穿插古今中外的经典故事,力求通过通俗的语言、生动的故事阐释精辟的道理,使生活在现代的我们更容易理解距今几百年前的古人的思想精髓。
  • 成功有捷径

    成功有捷径

    每个人都渴望成功,但是大多数人却不知该如何实现自己的理想。启示成功是一种习惯,经过严格的训练任何人都可以掌握它。本书列出了57种简单易的方法,令你在最短的时间内自动转型为“成功模式”。你会发现,成功原来如此简单!只要留意,你就会发现:成功的潜力其实一直就在你身上。其目的是帮助你认清理想,坚定你的信念,锤炼你的意志,平衡你的心态。只要你读完这本书并完成了书上的要求,你必将从人群里脱颖而出!
热门推荐
  • FBI微动作心理学

    FBI微动作心理学

    任何一种动作都可以是人们了解他人内心世界的途径。语言可以伪装,但人类的行为和眼睛动作却很容易在不经意间泄露一个人的内心秘密。无论他隐藏得多深,都能透过肢体语言发现其中的端倪。因此,想要更多更快地了解他人,拥有更顺利的人际交往,就要在生活中做一个有心人,只要善于观察、勤于思考,就能够掌握识人的本领。我们编写本书的目的也在于此,希望读者通过阅读本书能从中学习到一些识人的技能,从而在人际交往过程中更加游刃有余。
  • 准提三昧行法

    准提三昧行法

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 007典藏系列(第二辑):霹雳弹

    007典藏系列(第二辑):霹雳弹

    本书为007典藏系列(第二辑)的一种,曾改编为电影《霹雳弹》。某日,魔鬼党——一个专门从事毒品、抢劫、勒索等国际性案件的世界性的恐怖组织——拦截了美国运往英国的两枚原子弹,并向英国首相勒索1亿英镑,否则将于七天内炸毁世界各大城市。英方情急之下,派遣邦德前往魔鬼党总部,寻找原子弹的下落。邦德再次临危受命,踏上了拯救世界的冒险之旅。
  • 我的爱情谁做主

    我的爱情谁做主

    缘来缘去,纠缠不清?原名《极品女模戏首席》
  • 时间料理师

    时间料理师

    面对末世的僵尸危机,博士冷莫将希望放在多年研究的时间理论上,最终他找到一本奇异古书,吞时经!掌握时间之力的冷莫创造出时间料理法,使人类的战力大增,三百年来的僵尸危机,首次有了挽救的契机、、、
  • 无限防御

    无限防御

    追求突破极限的防御,各种抗性全部拉满,做最嚣张的人!防御的真谛,就是守护一切。天灾?神兵?神术?邪魔?恶鬼?在我面前,没有丝毫力量可言!放眼望尽,皆是弱者!无限防御书友群:711769249
  • 媒介安全论:大众传媒与非传统安全

    媒介安全论:大众传媒与非传统安全

    《媒介安全论:大众传媒与非传统安全研究》从哲学、政治学、社会学、国际关系学对安全和非传统安全的跨学科研究着手,论述传播学从拉斯韦尔、李普曼、施拉姆等早期学者到最近的阿什德对非传统安全问题的研究.运用议程设定、沉默的螺旋、涵化理论、框架理论等多种传播理论,梳理传播学特别是大众传播研究对非传统安全的重视与学科脉络。通过默顿大众传播“显性功能”与“隐性功能”理论,论证大众传播传统四大功能(监测、协调、教育、娱乐)中的“隐性”功能-安全,并使之显性化,同时论证安全作为现代功能,独立于传统四大功能的特征。沿着哥本哈根学派提出的“安全是一种言语行为”的非传统安全研究方向,论证媒介安全的基础是媒介安全话语。
  • 追妻无门:女boss不好惹

    追妻无门:女boss不好惹

    青涩蜕变,如今她是能独当一面的女boss,爱了冷泽聿七年,也同样花了七年时间去忘记他。以为是陌路,他突然向他表白,扬言要娶她,她只当他是脑子抽风,他的殷勤她也全都无视。他帮她查她父母的死因,赶走身边情敌,解释当初拒绝她的告别,和故意对她冷漠都是无奈之举。突然爆出她父母的死居然和冷家有丝毫联系,还莫名跳出个公爵未婚夫,扬言要与她履行婚约。峰回路转,破镜还能重圆吗? PS:我又开新文了,每逢假期必书荒,新文《有你的世界遇到爱》,喜欢我的文的朋友可以来看看,这是重生类现言,对这个题材感兴趣的一定要收藏起来。
  • 苍穹飞舞者

    苍穹飞舞者

    十分老套的套路,又是异世界。故事从两个国家之间的战争开始,只因可能威胁到王位而被王兄追杀的奈杰尔,何去何从……
  • 系统要我世无敌

    系统要我世无敌

    莫名其妙来到个莫名其妙的世界。末世?玄幻?还是游戏?傻傻的分不清。还得了个莫名其妙的系统,不伦不类的。居然还给每日福利?兜兜转转总算是踏上修行之路。尼玛,修神修魔炼体还修妖??大佬们放过我吧!我只想当个普通人啊!!