第一部分 博弈学
第1课 初识博弈:一个人生中处处都在玩的游戏
在人世间,少不了对抗与较量,只有直面这些,你才有获得成功的机会。决定胜负的因素通常有三个,即机会、体能和头脑智能。通常头脑智能对胜负起决定性作用。而博弈论研究的正是这种智能因素。
博弈就是策略制胜的游戏
迪克西特和奈尔伯夫在《策略思维》一书中,讲述了这样一个有趣的故事:
有两个大学生选修了一位博弈论教授的课程。这两个学生平时的成绩很好,总是得“A”。转眼到了期末,考试前一个周末正是紧张复习的时候,这两个学生却到外地去参加另一所大学举行的舞会。本打算周日早晨一早就赶回学校,这样就可以利用周日下午的时间来准备第二天的考试。但是,由于玩得太尽兴,结果周日那天他们睡过了头。当他们匆匆返回学校的时候,已经到了晚上,所以肯定来不及准备第二天的考试了。于是他们就打电话给教授撒谎说他们赶回学校时乘坐的汽车的轮胎爆了,因此一直被耽误在路上没有时间复习功课,希望可以获准缓一天参加考试。
对教授而言,如果这两个学生说的是事实,他的确想体谅他们并允许他们缓考。但如果这两个学生仅仅是在撒谎,那么他显然应该拒绝他们不合理的要求,并让他们为自己的行为付出代价。但问题是,教授并不知道这两个学生的缓考理由是真是假,那他该怎么办呢?教授仔细思考后答应了这两个学生的缓考请求。
这两个学生很高兴,他们抓紧当天晚上和第二天上午的时间认真习,作好了应对考试的一切准备。考试开始以后,他们被分别安排在两个不同的考场里,并很快拿到了试卷。试卷一共有两页,第一页上是一个非常简单的题目,他们轻松地做完了,并暗自庆幸教授还真是照顾自己。等翻到第二页的时候,他们傻眼了——上面只有一道考题,题目是:爆胎的是哪个车轮?
在故事中,这位教授就面临一个难题,即要不要相信学生的话。如果只是出于直觉而不相信学生的话,那么就是对学生的不尊重,但如果相信了学生说的话,但他们其实是在撒谎,那对其他学生来说就是不公平的。而问题的关键在于,教授无法去实地验证学生的话。那教授该怎么办呢?这时,聪明的教授就运用了博弈思维去解决这个问题。他把两个学生分开放在两个不同的考场里,这样他们就无法串供。在这样的情况下,如果两个学生的答案是一致的,就说明他们说的多半是真话,如果他们的答案是不一致的,就说明他们说的多半是谎话。一在这个故事中,博弈思维得到了淋漓尽致的运用。
其实,所谓“博弈”就是指可以分出胜负的游戏,也就是双方或多方在竞局中为争夺利益所采取的策略。只要参赛者讲究博弈策略,排阵有方,本来较弱或比较被动的一方就有可能打败较强或比较主动的一方,取得最后的胜利。就像上述故事中处境被动的教授就是通过一个巧妙的计策来验证了学生的话。
博弈可以说是无处不在的,我们的工作和生活就是永不停息的博弈决策过程,小至决定早餐要吃什么,晚上要不要到超市疯狂采购一番,要不要看场电影、散散步、把菜吃完,或是读哪一本书,大至报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位,甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,不管有意无意,一时冲动还是深思熟虑,你都在进行着做还是不做、怎样去做的选择,而这个过程里就充满着博弈思维。
在这些各不相同的决策中,存在一个共同的因素,那就是你并不一个人在战斗,更不是在一个毫无干扰的真空世界里战斗。相反,你的身边有很多同样的决策者,他们的选择既被你的选择所影响,也响着你均选择。就像《鲁滨逊漂流记中》鲁滨逊一个人沦落荒岛的时候,做与不做、做什么都是他自己说了算;可是“星期五”(鲁滨逊的仆人)出现了以后,他就要面对博弈问题了。
博弈论是由20世纪中期的两位杰出的学者——冯·诺伊曼和摩根斯坦创立的。从专业的角度来说,博弈论就是“研究决策主体的行为接相互作用时,人们如何进行决策以及这种决策如何达到均衡的问题”。
为了解释和理解不同主体之间博弈决策的相互影响,我们不妨设想一下石匠作决策和拳击手作决共策时所参考因素的差异是什么。石匠在开凿石头的时候,他的“对象”常常是被动的,没有什么思维能力,不会对他采取合作或对抗策略。然而,拳击手在攻击对方要害的时候,他的每一步计划都会招致对方的抵抗,而且他还会被对方主动地攻击,他必须设法消除或战胜这些抵抗和攻击。
所以,在人与人的博弈中,你必须意识到,你的博弈对象都是聪明而有主见的人,他们关心自己的利益,而不会被动挨打。他们既会有与你的目标发生冲突的可能,也会有与你合作的可能。在你作决定的时候,你应该首先设法消除他们的对抗意识,然后积极与对方进行不同程度的合作,以使双方都能从这种合作中得到最大的利益。
为了能够作出更有利于自身的选择,也为了更好地与人合作,你需要学习一点博弈论的策略思维。正是因为如此,著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”
博弈的竞争本质
无论怎样分类,无论是什么博弈,其直接目的都是为了竞争,是在竞争的基础上寻求共同点,以获得最大的利益。
博弈在不同的状态下有不同的表现形式,我们可以简单地看一下博弈的不同分类法。
一般来说,博弈可以分为合作博弈与非合作博弈。它们之间的区别主要在于相互发生作用的当事人之间有没有一个具有约束力的协议。如果博弈参与者在行动时从自身的利益出发能与其他参与者达成某种有约束力的契约或默契,以选择共同的策略,那么这种博弈就是作博弈。如果参与者彼此之间无法达成有约束力的协议,那么这种博弈就是非合作博弈。比如,企业之间联合定价的行为就属于合作博,而挑起价格战的行为便是非合作博弈。
合作博弈与非合作博弈之间并不是完全不相容的,合作博弈中往往包含着非合作博弈的因素,如石油输出国组织(OPEC)的建立就是合作博弈的产物,但各参与者之间为了保护各自利益而做出的超产和争吵行为又属于非合作博弈。
合作博弈研究人们在利益相互影响的局势中如何选择策略以使自己的利益达到最大化。比如,甲、乙两家企业合作建设一条汽车的生产线,协议由甲方提供生产汽车的技术,乙方提供厂房和设备。在对技术和设备进行资产评估时就会形成非合作博弈,因为每一方都试图最大化己方的评估值。这时乙方如果能够获得甲方关于技术的真实估价或参考报价这类竞争情报,就可以使自己在评估中获得优势;同样,甲方也是一样。至于自己的资产评估是否会影响到合作企业的总体运行效益这样的“集体利益”,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。
目前经济学家所说的博弈论一般是非合作博弈,由于相对比较简单,它的成熟度要比合作博弈高。
按照双方在博弈中的收益,博弈可以分为零和博弈与非零和博弈。所谓零和博弈就是指所有博弈方的得益总和为零的博弈,赌博就属于零和博弈。例如三个人参加一场赌博,其中两个人总共输了500元,那么另外一个人必然赢了500元。期货交易市场上的参与者之间的关系也是零和博弈。人们平常所说的“损人利己”实际上也包含零和博弈的意思。
非零和博弈是指博弈双方得益总和不为零的博弈,这种博弈方式又可分为正和博弈和负和博弈。
所谓正和博弈是指所有博弈方的得益总和等于大于零的博弈。例如三个人分蛋糕,不管每个人分到的蛋糕的数量怎样变化,每个人都会有大于零的收益,这种博弈就是正和博弈。而在负和博弈中,不管参与者选择什么策略,所有的参与者的得益总和都是负数。
根据博弈进行的次数或持续时间的长短可以将博弈分为有限次重本擇弈被无限重复多次。在这种博弈中,每个参与者都不知道博弈会在什么时候终止,
所以大家都会考虑为自己留后路,这就使得此种博弈中会有比较多的妥协和相对较好的信誉。参与者彼此之间可以达到合作,也能够采用有效的报复机制来威慑背叛者。博弈一旦进入这种状态,就很容易形成良性循环。
有限次重复博弈是指博弈次数有限的博弈,这种博弈因为存在最后一次,因此参与者的利益和行为的相互制约关系很容易被破坏,因而无法实现更高效率的利益均衡。
按照博弈参与者参加博弈时间的先后可以将博弈分为静态博弈与动态博弈。如果所有博弈方同时或可看做同时选择策略并采取行动,这种博弈就是静态博弈。LC如,在投标活动中投标人投出标书的时间投标人在开标前一般都不知道其他投标人的标价,这种策略就可以看做同时选择策略和采取行动的静态博弈。如果博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略,这种博弈就是动态博弈。如在价格战中,一个企业降价后,另一个企业也选择跟着降价等。
按照参与者对其他参与者的了解程度可以将博弈分为完全信息博弈与不完全信息博弈。在完全信息博弈中,每一个参与者都拥有全部的相关信息,而在不完全信息博弈中,参与者只拥有部分相关信息。严格地讲,完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的特征、策略空间及策略组合下的收益函数有准确的信息,是博弈中所有参与者的“公共知识”的博弈。对于不完全信息博弈而言,参与者所做的是努力使自己的期望支付或期望效用最大化。
博弈论把“完全信息”这种情况,概括为“各种对局情况下每个局中人的得益多少”是所有局中人的共同知识。
现实中的博弈多是不完全信息博弈,以军事斗争为例,敌对双方都尽量隐蔽自己的意图,秘密地调动部队,以期给对手以突如其来的致命打击。而指挥人员必须在敌方情况不明了的情况下制订作战计划,这样的决策过程就是一种不完全信息博弈。所以,在军事斗争中,侦察员的作用是至关重要的。
具体来说,所谓不完全信息博弈,就是至少有一个参与人不清楚某种对局情况下某个参与人得益的博弈。在不完全信息博弈中,如果各方在信息占有上是不对称的,则占有较多信息的一方在竞局中占优,因为他在分析计算时可以更明确。这就好比有人用魔术扑克和别人打牌,他可以有办法看出对方手中有什么牌,自然是稳操胜券了。
在不完全信息博弈中最重要的是掌握信息,如果在掌握信息方面处于不利的地位,那么从总体上是不占优势的。在分析水平相同的条件下,必输无疑;即便是分析水平较高,也不一定能赢。因此,占有信息是不完全信息博弈第一大事,谁在信息方面落后了,谁就先输了一招。
把静态和动态、,完全信息与不完全信息组合起来,一共可将博弈分为四大类,即完全信息的静态博弈(又称纳什均衡)、完全信息的动态博弈(又称子博弈精练纳什均衡)、不完全信息的静态博弈(又称贝叶斯纳什均衡)、不完全信息的动态博弈(又称精练贝叶斯均衡)。
就如同猫有黑白之分,但不论黑猫还是白猫,对于它们来说外在的差异并不重要,在这差异之下隐藏着它们共同的本质,即要去捕捉鼠。同样的,无论怎样分类,无论是什么博弈,其直接目的都是为了竞争,其次才是在竞争的基础上寻求共同点,以获得最大的利益。我们甚至可以说,博弈的本质就是竞争。认识这一点,有助于我们正确认识博弈论。
概率及信息判断
一、什么是概率
概率就是随机事件出现的可能性的量度,概率论是最基本的概念之一。人们常说某人有百分之多少的把握能通过这次考试,某件事发生的可能性是多少,这都是概率的实例。
概率可以看做在一独立随机试验中,某事件出现的频率。比如,抛1万次硬币,正面向上的次数约5000次,则抛硬币试验中正面向上的概率就是0.5。掷骰子18万次,出现每一个点数的频率大致是3万次,则掷骰子试验中每个点数出现的概率为1/6。
任何一件随机事件,都有可能发生或不发生。一定要发生的事件称为必然事件,一定不会发生的事件称为不可能事件。必然事件和不可能事件,都不是随机事件。随机事件最终的结果,也只能是处于发生或不发生之间,不允许出现既发生又不发生的情况。而且,我们也不允许因为随机事件后来并没有发生,而否认它在先前所具有的发生的可能性。譬如,天气预报说明天有0.3的概率会下雨,真实的情况是到了明天没有下雨,但我们不能因为明天没有下雨就否认其原本具有下雨的可能性。随机事件的不确定,存在于结果被确定的过程之中;一旦结果实现了,随机事件的随机性就消失了,但这并不能否认在结果实现之前的随机性。
为了想通这个道理,不妨考虑在一个毒杀暗器飞来飞去的小屋里关进一只小狗。当这只小狗在屋子里时,我问你它的生死状态如何?你会回答不知道,因为这只小狗可能还活着,也可能死去了。它的状态就是在生死之间徘徊,可能生也可能死。但是,若打开屋子发现小狗还活着,小狗的身体状况向你表明它一直是活着的,从未经历死的状态。但是,它仍活着这个事实,并不能否认它曾经面临死亡的可能性。
我们遭遇的许多概率事件是客观的。投掷硬币,若硬币是均匀材质的话,那么当试验次数趋于无穷的时候,出现正面或反面的概率一定都是0.5。这是客观的概率。但是,生活中有很多时候,我们难以对一个随机事件进行大量的重复试验。甚至有些不确定的事件,我们一生只遭遇一次,此时我们如何评估事件实现的概率?通常我们会对其实现的可能性进行一个主观评估。这就是主观概率。我们很难说明主观概率是否合理,或者一个人的主观概率判断是否正确,但是在决策的时候我们自觉不自觉地都使用到了主观概率。而且,确实存在这样的事实:有经验的人比没有经验的人更能准确地判断形势。或者说,经验有助于提高主观概率的合理性或准确性。经验更丰富的人所作出的决定在事后被验证为恰当的频率要比缺乏经验的人高得多。这可能是经验在决策中占据重要地位的原因。
也许有读者还会问,为什么有经验的人比缺乏经验的人能做出更恰当的决定?对此的一个解释是,错误的决定对个人的成功多多少少会有所妨碍,恰当的决定对个人的成功多多少少会有所促进;从而,在优胜劣汰的竞争过程中,经常做出错误决定的人可能会被进化的筛子过滤掉,而那些仍能留存在筛子上的人,他们往往是能够“经常”做出恰当决定的人——他们就是经验丰富者,他们对于形势的判断本身就更可能是恰当的。这里也顺便提醒读者,博弈论是理论的科学,与他人博弈则还需要现实的经验。所以,读者不应寄希望于几本讲述策略行为的著作就能使你成为博弈高手。理论可以帮我们洞察某些局势,但是它永远都不能取代经验。
二、逆概率推断
与上帝博弈时,人们会形成对上帝之选择的主观信念(上帝选择各状态的概率分布),但是某些时候一些相关的事件发生了,导致人们需要修正对于上帝之选择的信念。或者说,人们有时会面临这样的问题:需要从观察到的结果去推断潜在信息的可能性——估计潜在状态的概率。
理解上述问题的最佳方式是举例。例如,上帝可以选择一个人是否患上某种遗传缺陷,并且一个人患上遗传缺陷的概率是1%。某项健康检查技术有99%的精确性可以发现这种遗传缺陷,即如果一个人真有遗传缺陷,那么他只有1%的机会未发现该缺陷;如果他没有遗传缺陷,但该项检查也有1%的机会误报其有遗传缺陷。我们感兴趣的是,当检查报告一个人有遗传缺陷的时候,他真的有遗传缺陷的概率是多少?也就是说,给定我们的观察,我们在多大程度上能确定潜在条件是现实存在的?
不妨用简单的数字运算来回答这个问题。设人口总数为10000人,其中100人(1%)有缺陷,而9900人没有。全部人口都做了该项检查,结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人;而9900个无缺陷的人中也有99人被(错误地)报告为有缺陷。即检查报告为有缺陷的人数是198人,而这当中实际上只有一半(99)的人是真的有缺陷,另外一半实际上是没有缺陷的。所以,有缺陷报告只意味着被报告人有50%的概率存在遗传缺陷。
上述推理过程,是根据结果来推断概率,因此也被称为逆概率推断。逆概率推断主要用到贝叶斯公式。贝叶斯公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因为非对称信息博弈中,人们常常会通过观察对手的言行来判断对手的类型,或者说对手的言行往往传递着对手类型的信息,每当观察到对手的言行之后,博弈参与人就可以并且应当就这些观察到的言行对对手的类型进行重新判断以更新其信念,这种信念更新的逻辑过程正是按照贝叶斯公式来的。
完全信息下的博弈与不完全信息下的博弈
完全信息下的博弈是指信息对于双方来说是完全公开的,双方在博弈中的决策是同时的,这个同时不是指时间上的一致性,而是在对方作决策前不为对方所知的。不完全信息下的博弈是指,在信息不对称的情况下,博弈双方不但不知道彼此的策略选择,而且所掌握的对于博弈的结局的公共信息都是不对称的,有的掌握得多一些,有的掌握得少一些,显然掌握得多一些的局中人更容易作出正确的策略选择。
完全信息下的博弈在棋类游戏中表现得尤为明显,如在象棋中,双方对盘面的局势一目了然,博弈过程的信息是完全透明的。完全信息下的博弈中现实生活中较少见,它往往出现在博弈的分析模型中,如囚徒困境就是一种完全信息下的博弈。
不完全信息下的博弈在现实生活中较为普遍,最典型的如军事对抗,敌对双方都尽量隐蔽自己的意图,秘密地调动部队,以期给对手以突如其来的一击。指挥员必须在对手情况不明了的情况下制定作战计划,这一决策过程是一种典型的不完全信息下的博弈。
最能体现不完全信息下的博弈特点的是博弈中的试探和发信号现象。这在完全信息下的博弈中是不存在的。在信息不完全的情况下,博弈方常常处于一种无从决策的状态,因为对方可能处于任何状态,使得自己无法计算出哪一招是最好的。所以,发信号和试探就成为博弈获胜的关键。
例如,在军事上,有时在正式进攻之前,常常要做试探性的进攻,借以侦察敌方阵地的对手情况,为正式进攻做准备。在牌类游戏中,有时也有为了试探别家牌力而打牌的情况。
更高级的是博弈中的发信号现象。在多方博弈中,为了沟通信息,博弈方之间可能形成一些信号,这类操作从直接的得益计算角度是不能理解的,只有了解了信号的规则才能看懂。比如,在桥牌中的叫牌,本来这是决定打牌的目标位和由谁来打的一步,但实际上叫牌更重要的作用在于沟通信息,桥牌中的叫牌体系就是利用叫牌交流信息的方法。
在分析博弈状态时,由于没有直接清晰的信息源,所以,常常要根据很多蛛丝马迹的线索一点一点地缩小可能的范围,而且常常是无法完全明确的。
例如,在打牌的过程中,可以根据对手的出牌分析他们各自手中可能有的牌,比如有人打出一张7,则可以判断他有另一张7的可能不大,因为人一般不会拆开双张。这种分析只能得到一些线索,知道对手可能有什么牌的可能性大,而一般不能明确地侦知对手整把牌的情况。能够根据信息明确地判断当前对手所处的状态当然最好,但更一般的情况是,侦察到的信息不够明确,只能帮我们确定几种可能出现的概率不同,某些情况的可能性大而另一些情况的可能性小。这种情况又该如何处理呢?
当不能确定对方到底处于什么状态时,则在确定自己的每一种策略的得分时,只有做最坏的考虑,设想对手可能处于对自己最不利的位置。如果知道对手处于某一种状态的可能性大,处于另一种状态的可能性小,则可以根据概率计算出每一招的综合成绩,据此决定选择哪一招。
所以,不完全信息下的博弈的第一个问题是怎样对博弈的态势进行正确判断,这包括两个方面:第一,怎样获取更多的信息;第二,怎样利用这些信息判断博弈态势这里再以打牌为例,如果记得过去都出过什么牌,就可以知道现在每门花色每个牌点还各有哪几张牌,由此可以知道自己手中的牌力,决定该如何做;再如知道某人已经上一轮已经没有某一门牌了,则也可帮助决定现在该打哪张牌。这种计算是在利用游戏规则所提供的计算依据,结论是必然性的。根据某人的操作可以从另两个角度推断他的状态。比如在打麻将时,某人打出一张六万,则可以据此推断,他手中没有另一张六万,也不会有四万和五万,或五万和七万,或七万和八万,因为那样他就得破牌了。麻将高手都是很善于从牌面上推断这类信息的,麻将牌艺的高低也主要体现在这种分析水平上。
无处不在的博弈
一、博弈学就在你身边
说起博弈的渊源,不得不追溯到中国的围棋,其实在古代,博弈就是指下棋,下棋的目标就要战胜对方,我们每走的一脚棋,都是为使自己更有利,或以退为进,在这一退一进的对局中,其实也隐含着人生中的大博弈。
博弈,在人生中无处不在,我时时在用博弈,或与别人进行着博弈。只是不知道这个概念罢了。在这个世界上,大约只有两种人不需要用博弈,一是生活在孤岛如“鲁滨孙”这样的人,二是在生活中只有他一个人说了算,什么人都听他的。除此之外的普通人,了解一些博弈论知识,肯定会利大于弊的。因为人不仅是个体的人,还是社会的人,总要相互交往,总要影响别人或受别人影响。了解一些博弈论知识,人气会更旺、天地会更开阔、事业会更发达,每个人都会更加和谐愉快的生活。
在有限信息世界里,就投资收效来说,理性=白痴;就生活意义而言,专家=残缺;就长远发展来看,自利=自毁……,我们生活的真实世界无疑是有限信息世界,要想更有效地工作,要想生活得更有意义,要想长期发展得更好,还是应该具备一些博弈论知识,需要有针对性地了解一些不完全信息博弈方面的知识。在人们的现实生活中,交互行为使有限信息的作用显得更加重要,完全信息不仅不可能,而且不见得会比不完全信息好。由此不得不佩服“难得糊涂”的郑板桥,的确是一位当之无愧的博弈高手。
对于一些上班族来说挤公交,他们应该是很熟悉的。大家都知道,公交的上车门人往往是最多的,为什么呢,因为,人都从上车门上,一些人在车厢中部占了一个好位置后,就不愿意往前走了,这样,人流就在上车门这一块区域大量堆积,刚上车的人挤得够呛,而在车厢两头的下车门的人并不多,怎么办,为了获得更舒服一点的空间,也只有往车厢两头挤了,这就体现了人们权衡与博弈过程,上车门人多,站着不舒服,只有往车厢两头走,反正下车也得在下车门下,现在不往前挤,迟早还得挨挤,但选择什么时机往前挤,并且在挤的时候又不得罪人。据笔者观察,往往是车进站,车厢内人流移动,有人下车的时候往两头挤最适合,这时候,有些人已开始移动,你只需让他们为你开道,你跟着他们向前走就行了。这个跟随战术也体现了一种“智猪博弈”,“大猪”向前开道,“小智猪”跟前向前走,“大猪”大声喊道“借过,借过。”并往前挤,这时人们也自觉地让出了一块空间,“小智猪”可以什么也不说,跟前往前走就行了。
生活中离不开博弈,在学术中,特别是经济学中更离不开博弈。有人说,没有博弈论的经济学是一座半边楼。
经典博弈论主要包括合作博弈与非合作博弈两部分。20世纪90年代以来,又新兴起演化博弈(学习博弈)、实验博弈(行为博弈)、计算博弈和协调博弈等分支,博弈论家族可谓人丁兴旺、热闹非凡。但曾几何时,在现代主流经济学看来,博弈论只是对研究不完全竞争市场的一种补充。
其实不然,博弈论从相互影响的策略行为角度,不仅研究个体理性,也研究集体和社会理性,以及个体理性与集体理性在什么情况下能同时实现。类似的基本问题还有,是以物为本主要研究资源配置,还是以人为本从微观源泉层面研究主体行为;是将主体理性化主要研究行为结果,还是从现实人出发也注重考察行为过程及其与结果的关系等。博弈论从一种全新的视角,得到了一系列新的理论见解,正在为经济学大厦修建另外的半边楼。
所谓现代主流经济学,主要研究竞争效率,而博弈论不仅研究竞争,也重视合作,因为博弈论着重研究人们相互影响中的策略行为或交互行为。竞争出效率,合作出价值,前者侧重个体理性上的效率,后者侧重集体理性上的价值增值。因为人的主动性,合作就会有1+12的功能;当然,还会有另一面,即1+12的合作增值。
于是,有了博弈论工具和知识,我们可以看到完整的人、完整的社会、完整的经济学。
二、博弈与数学的关系
无论你是研究生或专业研究人员,还是企业老总或仅仅是有点兴趣的一般读者,只要想接触博弈论,一个总也回避不了的问题是数学:没有或数学功底不深的人能不能学博弈论?博弈论有用数学的,也有不怎么用数学的,如2005年诺贝尔奖得主谢林,他就没怎么用数学,照样写出不朽的博弈论传世之作。我更加看重思想与技术的统一,我们知道,博弈论在美国很发达,但美国人总体的数学水平确实不敢恭维(我的一位同学在美国教统计学,他几乎每一年都会碰到不知道是1/3还是1/2大、1/3+1/2=2/5的学生),关键是美国的教育和科研形成了一种机制,能够让人们知道:什么时候、什么样的人能用数学;而在什么时候、什么样的人不适宜用数学,这就是博弈论中的分离均衡。而在中国则不然,好像什么人都得用数学,用了数学才正统,才是现代经济学。这是在不完全信息条件下的博弈,要设计出一种机制,让更多的人通过自我选择,能知道自己是否适合用数学来研究博弈论,或者只是非技术性地了解一些博弈论的原理性内容和知识。
当然,事情都有它的另一面。借用卡尔?弗里德希?商斯的一句话:缺乏数学修养不仅仅表现为对数学的一无所知,而且也表现为对数学的滥用。所以,在学博弈论乃至经济学时,有数学工具当然要好一些,但最根本的问题不在数学,而在于立场和思想。有了正确的立场和出发点,选择适合自己的读本,都会有所思、有所获、有所用、有所成。
从博弈论中的常见关键词来认识博弈
博弈论的关键词很多,有囚徒困境、重复博弈、智猪博弈、猎鹿博弈、枪手博弈、酒吧博弈、人质困境、以牙还牙、信息均衡、脏脸博弈、鹰鸽博弈、分蛋糕博弈、蜈蚣博弈、协和谬误、斗鸡博弈、警察与小偷等等。下面做一些简明的解释。
囚徒困境
这个简单的例子,几乎是博弈论的代名词。两个基于“坦白从宽,抗拒从严”审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果若是从个人理性并追求个人利益最大化,那么二人皆坦白也就是背叛。这在四种策略中并不占优,那为什么不采用体最优策略而合作呢。很简单,集体的优化,必然侵害个人利益的最大化。当然这一切前提是理性假设,也就是著名的经济人假设:经济学中的人都是“小人”(管理学则认为人是“君子”,有意思而有道理的比喻)。破解这一困境的途径则是打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作,谁在这里面坚持到最后,谁将取胜。
重复博弈
囚徒困境,砸了传统经济学的场子。因为个人的自利行为,并不一定导致集体益的最大化,“看不见的手”拉不住人类向堕落之城下滑的趋势,难道这真是一个悲哀?所幸并非如此,撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作将到来。因为,未来的收益将左右目前的决策。
以牙还牙
重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益而当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优?若干睿智而复杂的策略在经过计算机中PK之后,极其原始的“以牙换牙”策略脱颖而出。固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那此原则行事的博弈将永无止境地背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必以牙还牙,第方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。
人质困境
一场憋屈的博弈。枪打出头鸟,人质联合固然可以制服歹徒,但是谁都不愿出头。这一点给了无数处于劫持者地位的一方以机会,类似于秦的远交近攻、各个击破的策略,将最终全盘赢下。人质可有反制的策略?当然有,不过艰难至极。人质可以选择沉默,这样他有一定时间苟延残喘;或者联合劫持者对付人质,结局还是取决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将获得左右策略,但是这需要壮士断腕的勇气,部分人可能因此受伤。这里是实力与勇气的较量,而且实力暂居上风。
酒吧博弈
如果人人理性,那么每一天到酒吧的人数将差不多是正好的,但是人非圣贤,理性往往是有限的。第一次到酒吧的人多,那么大多人认为酒吧人太多、太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人……¨循环就此开始。酒吧博弈一方面显示,现实的博弈参与者,理性是极其有限的,其理性只前延后伸一小段。历史数据只对计算机有用,对人,则不一定。
另一个方面,酒吧博弈指出,胜利者永远只是少数。尽管酒吧存在协调的可能,譬如发短信时时提醒,但成本恐怕太高。而在其他场合,少数派更加可能会设置种种障碍阻止后进者的上升。也就是说,我们的世界仍然是操弄在少数派的手中。不过,总算这个世界不是模型,少数派的道路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中找到惟一的生门。若你想要,必须做一个更加老练的将军。
枪手博弈
王者的悲哀。三人对枪自决,甲乙丙枪法优劣递减。最后无奈而神奇的结局,将不取决于同时开枪还是先后开枪,最优良的枪手,倒下的概率将最高;而最蹩脚的枪手,存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清除目标。在这里,后发制人的弱势者将胜出。以弱胜强,绝不是神话。
难道王者的命运就真如此不堪?但别忘了每个理论模型都是有其前提的,击破之中任何一个,王者仍将归来。这就是先发优势。假设这是一场类似CS的竞技,优秀的枪手击倒二号枪手,立刻获得奖励:盾牌,那么三号枪手将陷入绝境。不过,不管怎样,这个博弈模型,到底给了弱势者一份希望。机会永远存在。
猎鹿博弈
两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益,战略联盟将开始。这或许是件好事,不过要取决于最后猎获的鹿——这一公共资源的分配,如果分配得当,整体的效率将增加。如果一方主导,另一方受损,那么帕累托改善无法进行,合作可能终将破裂。
另外一个问题是更加大局的问题。合作的示范性将使得更多的猎人加入,猎获的鹿将大大增加,人类的利益短期内将呈几何级数增长。但是最后,却是生态失衡,鹿群灭绝。短暂的繁华之后,猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧,人类还有最后的希望:制度经济学的法宝——科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性,人类社会的公共悲剧仍将不断上演。
智猪博弈
混沌之前最后的博弈。小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。结果怎样?是小猪选择“搭便车”,大猪勤跑。因为小猪无论跑还是停,大猪的最优策略都是去踩机关。不过在实际生活中,这里依旧存在两种策略。
小猪的“搭便车”。大猪有的时候,自觉或不自觉地自封“侠之大者,为国为民”,并因此承受一些不能承受之重。美国战后的行为极似大猪,战后的美国竭力宣传自己的普世价值观,并深入到海外事务,甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。
大猪在击破模型的一个假设之后,仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样,大猪完全有能力撑得更久,小猪如果不想饿死,那只有一条豪赌的路子:龟兔赛跑式的豪赌,但愿大猪打了个盹儿,他回来的时候,还能吃上一两口,要不然真是赔了夫人又折兵了。据此,再也不难解释为什么很多人切齿的腾讯,毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。
大猪在这里的后发制人和枪手博弈的后发并不一致,枪手后发是建立在与他恶斗的基础上,大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激措施,只要跟随就好。因为小猪获胜的条件不是接近,而是距离。
警察与小偷
令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地,那么警察应该为了保护价值大而一直保护A地吗?博弈论认为当然不是,警察的合理策略应当是要倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但很不幸的是,此时的小偷谋求的是最小得手几率的最大化。也就是说,警察的最优策略将把小偷的最差策略改良!这个便是冯·诺伊曼提出的“最小最大定律”。
我们必须再一次感谢这个不完美的世界,因为现实之中,类似的现象,对于一力仍然可以设法找到对手致命的规律性行动(当然必须考虑到对方是不是一个更加老练的猎手,故意放出的诱饵)。而保持自己的行动的无序性,则有可能成为欺骗策略的武器,这倒似张三丰所言的:无招胜有招。
斗鸡博弈
两只斗鸡在决斗的时候,无论选择进或退都是一个难题,因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下,死拼将是得不偿失的,因为很可能给第三机会。因此,两个已经在战场的强势力很可能自觉地遵循纳什均衡,当一方攻击时另一方暂退。虽然可能某方暂时受损,但较之于两败俱伤是好得多的。不过,要维持这一状况,必须保证下一次先期受损的一方发动攻势的时候,另一方同样的后退。于是是这样的攻击性行为开始变得“仪式化”,没有人真正流血。这只不过是两个巨头玩弄的游戏,目的是警告后来者,想进来,那么也得陪我们一起玩,可是你玩的起吗?这正是百事的广告,即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。
协和谬误
欧洲政府在大量投资协和飞机后,终于不能自拔。即使前景黯淡,也撑着面子投下去,非要走投无路才放弃。而这时投入的成本已经全打水漂了。如果发现不能继续的时候,就果敢放手,损失会小得多。可是他们会这么做吗?壮士断腕,是何等的壮烈,却也是何等的艰难!
沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃,可惜大部分人都有赌徒式的心理。相信阿基米德的杠杆终将启动,可惜他们在爬到足够撬动杠杆的支点之前,已经窒息了。
协和谬误倒是给了人们半途而废的理由,会不会有人担心它的存在而本该坚持的目标?的确有这个可能,但是应该相信人们足够理智,完全可以比较沉没成本、机会成本与未来收益的关系。看清了的,必定会坦然地走出协和谬误。
蜈蚣博弈
一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果。它的另一个好处,就是使得未来的计划明晰化,使你不再徘徊。只可惜,很多时候,碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。
蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。可悲的是,这一次背叛将由于人性的理智,穿越时光隧道,回到原始的地点:人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧,事实上人们很少这样做。当然合作到最后的也很少,这意味着,倒推法只在中间阶段突然发生了作用,只不过谁也不能预测,中间一步在哪里。在那里,我们只有冀望信任、道德、良知等等。
分蛋糕博弈
两个小孩怎么分蛋糕?经典的故事,经典的解答:一个分,一个选。现实多如此,权利的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加有活力。不过分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是一次性的,而是多回合的,而且出现成本:蛋糕在融化。
时间成本的加入,将使得分配变得复杂化。双方如果不能及时达成交易,不仅集体的收益将减量,而且个体的收益也将减少。在此情况下,利用时间成本以及威胁、承诺将对其中一方极其有利。顾客可能迫于情势,必须尽快结束谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上作出妥协。
顾客一方当然也有策略,它的策略就是货比三家,要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力,这就是顾客有权投诉商家。
鹰鸽博弈
这个博弈很多人把它等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体,鹰鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子的一个苞谷场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是按一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。
由此产生了进化上的稳定策略,也就是说一旦均衡形成,偏离的运动会受到然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。
进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,集体的止步不前。
脏脸博弈
恍然大悟的博弈。三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步……循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。
这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。在台面上的博弈之前,私下的算计已经置对手于死地。不过,很可能对方也预料到这一点,也早想到这一点,同时杀来。终于,形成双死局面。
当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则尽人皆知,双方只要各自依之行事就可以了。
信息均衡
很显然,信息的作用在博弈之中非常重要。将博弈论还原到现实,人们不再完全理性,信息存在不对称,博弈就需要在抢占信息高地上作出努力。
信息不对称,是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”,前者事前,后者事后。信息不对称短期内对某一方会有利,但最终会破坏整个市场。于是有两个解决策略。
信息传递:传达你正面的信息的策略,也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。
信息甄别:诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜,保证顾客不会走到其他柜台去。这种策略显然更加有效,不过风险也更大:万一顾客用放大镜看出了自己的瑕疵怎么办?