登陆注册
2686300000002

第2章 认识博弈论(1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门科学。用我们日常的语言来说,博弈论就是研究在不同情境下的策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并加以实施各自所倾向的行为或是策略,并从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例。《孙子兵法》、《三十六计》、《三国演义》等等,就不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究象棋、围棋以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论化发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家约翰·冯·诺伊曼证明了博弈论的基本原理,并与经济学家奥斯卡·摩根斯坦合作于1944年发表了《博弈论与经济行为》一书,提出合作博弈的基本模型,并将二人博弈结构推广到n人博弈结构。至此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生的标志。

目前,博弈论作为分析和解决冲突和合作的理论工具,已经在管理科学、国际政治、经济、外交和社会学等领域得到广泛的应用,为解决不同实体的冲突和合作提供了宝贵的方法,并日渐发展成为一热门学科。

博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者构成一个决策主体。

决策主体的目的是通过选择行动或者战略以使自己的效用水平最大化。只有两个决策主体的博弈现象称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业,国家等。

——策略策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终地对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用效用,又叫做支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈的付出或者收益。效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所取定的一组策略有关。一局博弈结束时每个决策主体的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所做的是努力使自己的期望支付或期望效用最大化。

——按照参与者能否形成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行的博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成合作时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行约束,以达到获取更多垄断利润的行为。

反之,不能强迫其他参与者遵守某一协议,各参与者只能选择自己的最优战略的,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动的顺序,可以分为四种不同的类型,即:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,规定每个决策主体的行为规则。如果在没有外在强制性约束时,各参与者自觉遵守该协议,没有人偏离协议规则,就构成一个纳什均衡(概念见第2章)。只要有一个参与者违背协议规定,则此协议就不构成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预期到这一点,所以也会考虑到自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。每个参与者的最优策略只能是在给定自己的类型和他人类型依从策略的情况下,最大化自己的期望效用。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择并获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行为的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣,理论上又颇有深度的学问。可以毫不夸张地说,了解博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择行为,而策略选择问题实际上就是博弈论的本质所在。

多种立场,一个思想

囚徒困境最早是由美国普林斯顿大学数学家塔克于1950年提出来的。他当时编纂了一个故事,意在向斯坦福大学的心理学家们解释什么是博弈论。后来经过发展,囚徒困境成为了博弈论中最著名的案例之一。

所谓囚徒困境,大意是这个样子的。有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。

针对两人的狡辩,警方对他们采取了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:

本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,根据将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期。如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放。当然,如果你们两人都坦白,那么你们都将只被判15年刑期。在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年徒刑)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。

心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。

汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢15年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。

同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人”。基于此基础之上的合作才能形成一个和谐的、良好的社会环境。

在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。

实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是典型的囚徒困境现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。

如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些联盟往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。

合作,有时是利益需要

农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,交通不便,使得两户人家与外界的交流十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户人家从修好的这条路上获得的好处为3个单位。如果没有中间人协调,上官、欧阳两家就各自打着自己是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户人家获得的好处为1(3-2=1)个单位;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为-1(3-4=-1)个单位,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路(修路人并没有拥有道路的占有权,总不能因为修了路就不让邻居走),白白获得3(3-0=3)个单位的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。

对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势策略;若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势策略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:

大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有自私本性但并不刻意损害他人的人类一员。

公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此作出丝毫贡献。那么,这长椅由谁来设置呢?恩惠于大家的公共事情又由谁来管呢?

同类推荐
  • 马云的故事力

    马云的故事力

    马云的人生故事,充满了催人上进的力量。挖掘出马云的“故事力”,去感受一个真实的马云,挖掘他给我们的诸多启迪,并将这些运用到我们自己身上。马云的创业成功原因很多,我们从马云对梦想、坚持、激情、选择、机会、管理、诚信和人生等九个方面入手,深入剖析马云成功的原因。
  • 巧写在线交友信息

    巧写在线交友信息

    如果你还单身,在线交友绝对是必修课。当然啦,在线交友不可能是、也不应该变成你“脱光”的唯一手段,但要是你没有好好利用在线平台,肯定是一大损失,因 为单身人士都在线上!2013年的一份调查显示,2005到2012年间结婚的夫妇中,有1/3都是网上认识的,美国的成年男女中,1/10会每天在交友 网站上流连一个多小时。茫茫人海中,怎样让别人注意到你?这正是本书要解答的问题。30个实用小技巧教你博关注,内容包括:如何写出最佳交友信息?怎样与 陌生人建立联系?怎样仅仅更换一个词,就把回复率提高31%?
  • 青少年礼仪指导:馈赠礼仪一点通

    青少年礼仪指导:馈赠礼仪一点通

    《馈赠礼仪一点通:青少年礼仪指导》,就是为了帮助青少年朋友学会馈赠礼仪,送好礼,送对礼,送出自己的特色,以培养良好的人缘,创造美好的人生。
  • 谈判要读心理学

    谈判要读心理学

    本书是心理学与你的生活系列第二辑,是为从事营销、管理及谈判工作的读者准备的心理学普及性读物,运用通俗、简练的语言,结合大量的实例,从心理学角度出发,深入浅出地讲解了市场营销与商务谈判的相关知识,为读者提供心理学视野中的营销策略方法及谈判谋略技巧。
  • 受益一生的气场修炼课

    受益一生的气场修炼课

    《受益一生的气场修炼课》对气场进行了全方位的解读,包括对气场的认识,强弱气场的分析,职场气场,生活气场,气场的挖掘与提升……不但帮助读者深刻地了解气场,而且可以使读者轻松快速地掌握如何打造强大气场的方法。通过对《受益一生的气场修炼课》的学习,10天你就会打造出强大的气场,你的人生将因气场的改变而改变。
热门推荐
  • 重生成第一毒妃

    重生成第一毒妃

    【女强】一纸诏书,一杯毒酒,宣告了她这个废后的悲惨结局。一朝重生,她成为将门虎女,嫁给当今圣上宠臣为妻。身为正妻不受宠,小妾作乱,怕什么,且看她如何清理门户,重掌大权!休掉夫婿,嫁入王府,她成为史上第一传奇女子!美人如玉,江山如画,曾经欠她的,她会一一讨还!
  • 言难

    言难

    难言难测难判可悲可忧可叹人心可畏真言可贵
  • Mary Barton(V) 玛丽·巴顿(英文版)

    Mary Barton(V) 玛丽·巴顿(英文版)

    Mary Barton is the first novel published in 1848 by English author Elizabeth Gaskell. The story is set in Manchester, and deals with the difficulties faced by the Victorian lower class. It is a subject of some debate whether the first person narrator in Mary Barton is synonymous with Gaskell. The story begins in Manchester, where we are introduced to the Bartons and the Wilsons, two working-class families. John Barton is a questioner of the distribution of wealth and the relations between rich and poor. Soon his wife dies—he blames it on her grief over the disappearance of her sister Esther. Having already lost his son Tom at a young age, Barton is left to raise his daughter, Mary, alone and now falls into depression and begins to involve himself in the Chartist, trade-union movement.
  • 最废柴的穿越

    最废柴的穿越

    人家的穿越都是自带天赋,强者随身,机缘不断,坐拥天地气运。然而,前世作为孤儿的秦羿,穿越仙侠世界又再次成了孤儿。十七年来作为穿越慈善家,在古代收留帮助孤儿、流落他乡的人的秦羿,在某一天为了救一个小女孩,迷糊的踏上了修真之路。开局就是玩命任务,一路跌跌撞撞,两世为人的秦羿究竟要如何面对仙缘之争、帝国动乱?什么?带着女娃娃修真求仙?最废柴的穿越,怕说的就是秦羿吧。
  • 别说爱情有多美

    别说爱情有多美

    我最近很苦恼,可是却又无力改变生活。那一天是二十二号,是我到这座城市的第二十二天。天空湛蓝,风和日丽,我一进地铁站就看到了地上的一块钱。当我伸手去捡的时候,另一只手也伸了过来。我们俩人同时都抠住了它,互不相让。因为我觉得它是个好运气的开始,我现在太需要运气了。后来,那枚硬币让我有幸在还没有穷困潦倒前,找到了可以糊口的工作,而且很体面——电台栏目主播。值得说明的是,我广播的时间你可能听不到,它在夜里十一点到次日凌晨四点之间,这下你知道我为什么能够得到这份工作了吧,因为没有人应聘它。
  • 七里樱

    七里樱

    年少时,我们,似乎成为了世界的主角,遗憾过,苦恼过,伤心心过,但庆幸的是在那个即将逝去的青春里,你世界的男主随着四季辗转在你身旁,陪你笑,陪你哭……终有一天,你发现他只是喜欢你身边的那个人而已…“你知道的,我喜欢她哎。”“没事…”至少我的青春,你来过就好。
  • 异界国之守护

    异界国之守护

    空瞳立世,天之将变;梦幻花开,乾坤倒转;灭世一出,武战长空;苍穹再现,尽皆虚无。
  • 妈妈也有想妈妈的时候

    妈妈也有想妈妈的时候

    我以为妈妈是港湾、是依靠、是最后的壁垒;却发现,她也曾是别人的孩子,也渴求关爱和宠溺。我以为爸爸是头顶的天,是身后的树,能永远用最有力的手臂给我支撑;却发现他也会变老,老得需要我去呵护和照顾……妈妈也会想妈妈,爸爸也会变老,再坚强的人也会脆弱无助,我们要抓紧时间爱他们。
  • 基督教的柏拉图主义:亚历山大里亚学派的逻各斯基督论(第二版)

    基督教的柏拉图主义:亚历山大里亚学派的逻各斯基督论(第二版)

    此著为作者的博士论文,以前在上海出版,现在重新修订后再出版。此书主要探讨基督教思想史上最伟大的学派之一——亚历山大里亚学派的哲学和神学思想。亚历山大里亚学派是公元二至四世纪基督教哲学和神学的轴心,通过公元325年的尼西亚会议,它深深地影响了整个西方的思想传统。对于欧洲文明来说,亚历山大里亚学派的出现的意义还不止于此。亚历山大里亚学派的哲学和神学理论是希伯来文化和希腊文化融合的产物,是希腊化时期两希文化结合的典范。在这一著作中,作者力图以亚历山大里亚学派神哲学为基本视域,勾略出这一时期的思想发展概貌和基督教哲学和神学的特点,从中,我们依稀可以看到欧洲文明即将迎来一个新的发展时期。
  • 崩坏前传

    崩坏前传

    这是个不一样的崩坏世界,在这个世界里很多都变了。 什么奥特死了?在第二次崩坏中战死了!和卡莲一起死的?卡莲不是早死了吗?齐格飞是天命主教!看来天命迟早要完。塞西莉亚没事!哦,那天命没事了。 舰长运气很差,又很好。因为他玩抽卡类游戏从来没有抽到过ssr、6星、史诗或者起始及s级人物和装备,但是别人让舰长帮忙抽人物装备时总是出货率爆棚。这一天舰长的好朋友海豹有事,和女朋友约会,让他帮忙肝一下崩坏3的每日任务时,舰长莫名其妙的抽到了异世界传送门。于是就开始了他“愉快“的名为舰长实则时会空中劈叉的甲板清洁工的愉快生活。这个崩坏世界可能和原来的崩坏三世界有点不大一样! (本故事完全架空游戏和漫画剧情,为同一世界观下的不同世界线!)