博弈论的经典案例
“皮奥莱维奇”通过精心收集,向本站投稿了8篇博弈论的经典案例,以下是小编整理后的博弈论的经典案例,欢迎阅读分享,希望对大家有帮助。
篇1:博弈论的经典案例
哈佛大学一位教授提出了这样一个博弈模型:
有三个枪手,第一个枪手A的命中率是80%, B是60%,C是40%。他们同时举枪瞄准、同时射击另两个人中的一个,要尽可能消灭对手,每个人一次机会,一颗子弹,目标是努力使自己活下来。谁活下来的可能性最大?如果你认为枪法最准的A胜出,那么你就错了。
我们来看,如果你是A,你毫无疑问的会瞄准对你威胁最大的B,而B也会瞄准对他威胁最大的A,而C则也可能瞄准A,那么三个人存活的概率都是多少呢?
A = 100% - 60% - (1-60%)* 40% = 24%
B = 100% - 80% = 20% (因为命中率为80%的A在瞄准他)
C = 100% (因为没有人瞄准他)
原来,枪法最不准的C竟然活了下来。
那么,换一种玩法呢?
如果三个人轮流开枪,谁会生存下来?
如果A先开枪的话,A还是会先打B,如果B被打死了,则下一个开枪的就是C,那么此时A生存的概率为60%,而C依然是100%(他开过枪后A没有子弹了,游戏结束);如果打不死B,则下一轮在B开枪的时候一定会全力回击,A的生存率为40%,不管是否打死A,第三轮AB的命运都掌握在C的手里了。
那么,如果游戏规则规定必须由C先开枪,如果你是C怎么才能让自己活下来呢?
答案是胡乱开一枪,只要不针对AB任何一人即可。
当C开枪完毕,AB还是会陷入互相攻击的困境。
篇2:博弈论的经典案例
在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!
高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。
篇3:博弈论的经典案例
“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
在与其他企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况。
选团队成员时,就像激流中要找同一条船上的人,一定要确定每一个人和自己往同方向走。也就是说,外面已经这么险恶了,一定不能找会背后捅自己一刀的人。
篇4:博弈论的经典案例
在美国西部的小镇上,三个枪手准备进行一场生死较量。枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。假如三人同时开枪,谁活下来的概率大一些?经详细分析,枪法最劣的枪手丙活下来的概率最大。
假如这三个枪手相互之间充满仇恨,意见不可能达成一致,作为枪手甲,他的最佳策略是对枪手乙开枪,因为这个人对他的威胁最大。这样他的第一枪不可能瞄准丙。同样,对于枪手乙来说,他也会把甲作为第一目标,一旦把他干掉,下一轮(如果还有下一轮的话)和丙对决,他的胜算较大;相反,如果他先打丙,即使活了下来,到了下一轮与甲对决时也是凶多吉少。而丙呢?自然他所选的目标人物也是甲,因为不管怎么说,枪手乙还是比甲差一些(尽管比自己强),如果一定要和某个人对决下一场的话,选择枪手乙,自己获胜的概率要比对决甲多少大一点。于是,第一阵乱枪过后,甲还能活下来的概率非常小(将近10%),乙是20%,丙是100%。通过概率分析,不难看出丙很可能在这一轮就成为胜利者,即使某个对手幸运地活下来,在下一轮的对决中也并非十拿九稳,毕竟丙还有胜出的机会。而三人中作为强者的甲,却面临着最大的生存风险。
从这个博弈案例中可以总结出一个道理:强者并非一定能赢,正所谓“木秀于林,风必摧之”。
篇5:博弈论的经典案例
在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,一份也得不到;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
篇6:博弈论的经典案例
假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。
囚徒困境现象在现实生活中比比皆是。记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利益。
前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。
下一页更多博弈论的经典案例!
篇7:博弈论读后感
博弈论读后感
.优势策略与严格愚蠢策略首先考虑最简单的一种情况,那就是不管别人怎么做,你都应该采取同一种策略。无论在哪种情况下采取这种策略给你带来的效用都超过采用其他策略给你带来的效用。这种策略就叫做优势策略(dominant strategy)。
以下图所示一个汽车价格博弈的可能模型为例。
打折
不打折
打折
低利润,中利润
高利润,低利润
不打折
零利润,高利润
零利润,低利润
打折对两家公司来说都是优势策略,因为打折总会带来较高的利润。
那么开车靠路的右边是不是优势策略呢?不是,只有当别人都靠右行的时候你才该这样做,如果别人开车都走左边,你最好也走左边。避免触电是不是一种优势策略呢?是的,因为不管别人怎么做,你都该坚持这一条,哪怕在某个奇怪的地方所有的人都爱用电来电自己。
与优势策略相对应的是严格愚蠢策略(strictly stupid strategy)。无论你的对手怎么做,这个策略给你带来的效用总是比你的其他策略少。显然,如果在一个博弈中,你只有两种策略,而且其中一种是优势策略,那么另一种一定是严格愚蠢策略。
在同时行动博弈中,存在优势策略或严格愚蠢策略的一方可以利用这两者策略来进行决策,而另一方则可以据此对预测对手将采取的决策,或者排除对手可能采取的某种决策。
2.协调博弈(coordination game)
具有优势策略或者严格愚蠢策略的博弈通常都很容易解决,但是除此之外的其他博弈就不是那么简单了。在这里我们首先来看协调博弈。在这种博弈中,参与双方的效用会同时达到最大,因此,如果双方同时采取对应的策略,那么双方都会得益,如果不是,那么双方都不能得到最大的收益。
显然,约会的双方都希望在同一个时间出现在同一个地点,而两家电影院也不希望在同一天推出强档影片。在这种博弈中,参与者需要彼此协调双方的行动,并且完全信任对方所说的话,因为对任何一方而言,隐瞒或者欺骗都是不明智的。因此,在协调博弈中,成功的关键在于公开、诚实与信任。
在博弈论中,判断一个人是否诚实,是否值得信任,要看诚实是否对他有利。但是现实中的人总不会是这么理性的,其中常常会掺入情感的因素。这也就是说,即使是双方共同采取行动对某一方能够带来更大的效用,他可有可能并不这么去做。这个时候就面临着信任博弈(trust game)的问题。
例如你的老板不能同时失去你和你的同事。这个时候如果你们同时要求加薪,老板就会答应你们。但是如果你们两人只有一个人试图争取加薪,那么老板就会炒掉他。如果你和你的同事都是理性的,那么你可以信任你的同事做出的和你同时要求加薪的承诺。但是,如果他和你有过什么矛盾,你就不一定能够那么信任他:说不定他在撒谎,好让老板把你赶走。在这里面让人犯愁的是你的同事可能是个笑面虎,你从你们之间的表面关系并不能有把握的推断他会怎么做,因而在这种情况下你可能会采取稳妥一点的办法,不要求加薪。相应的,即使你们之前没有明显的矛盾,你的同事可能也会对你有所怀疑,使得本来对你们两人都有利的事情泡汤。
在信任博弈中,怀疑是致命的,即使是怀疑别人心存疑虑也会造成麻烦。
3.猜硬币博弈(outguessing game)
协调博弈的反面是猜硬币博弈。在这个博弈中,甲乙两人要同时选择硬币的正面还是反面,并分别写下自己的`选择。如果两人的选择一样,那么甲获胜,如果不一样,那么乙获胜。这种博弈和协调博弈的区别是协调博弈的双方的效用同时达到最大值,而在猜硬币博弈中则是一方达到最大值另一方必然达到最小值。
如果在写下自己的选择之前,双方可以交流彼此的决策。如果你是乙,想选正面,你肯定会告诉甲你要选的是反面,这样他就会也选反面,这样你就赢了。问题是甲也不笨,他也知道你不会轻易的说出自己真正的选择的。于是两人就会开始欺骗和反欺骗的游戏。
在战争中经常会出现这种博弈。二战中盟军想从诺曼底登陆,但是要千方百计的隐瞒真正的登陆地点,而德军却要千方百计的找出盟军的登陆地点,好提前部署兵力,做出准备。盟军放出各种假消息,并在其他地方营造出一种大兵团登陆的假象,最后成功的迷惑了德军。
在漆黑的夜晚开车走在十字路口,把灯关掉使别的驾驶员猜不到你的想法是一件很危险的事情,但是在猜硬币博弈中,你一定想把灯关掉。这是因为在协调博弈中,让对手知道你的做法对你有利,而在猜硬币博弈中,隐瞒行动对自己更为有利。在猜硬币博弈中,取胜的关键就在于欺骗和隐瞒。
4.斗鸡博弈(game of chichen)
在另外的一种博弈中,如果双方同时采取对应的策略,那么双方的效用会同时达到最小值。
在这方面最明显的一个例子就是过独木桥。《天龙八部》里面的**恶和一个跳着大粪的农人在独木桥上相遇。如果两人都不想让,那就只能相持不下,或者掉到河里。一方退缩是另一方最好的结果,但是谁让谁就输了,这两人脾气都很倔,都不愿意相让,最后在桥上相持了几个时辰,最后以农人支撑不下去了而告终。
在斗鸡博弈中,只要让对手相信你绝不会退让,你就可以获胜。这种博弈比的不仅仅是谁更像男子汉,还包括谁更能表现出男子汉气概,而且神经不正常的人占有很大的优势,因为正常人不会愿意和疯子一般见识。在上面的例子里,如果农人事先知道自己面对的是**恶这样的BT,估计一开始就会打退堂鼓,这样**恶也不用花那几个时辰证明自己,就能兵不血刃的取得胜利。
在生活中,搭便车的问题很可能会形成斗鸡博弈。 如果老板让两个人一起去完成某项任务。如果两人都卖力干活,任务就能完成,他们都可以得到10个单位的效用。如果两个人都不干活,任务完不成,那他们都会被开掉。但是如果他们其中的一个拼死拼活的干活,而另一个偷懒,那么偷懒的雇员可以得到15个单位的效用,而卖力干活的得到的效用为0,但是不会被开除。于是两人都会希望对方认真做,而自己偷懒,但是,如果一方认为另一方不会认真做,为了避免被开除,他就只能卖力干活。记得上大学的时候做物理实验,两人一组,交1份实验报告。又一次我想偷懒了,就说不管怎样我都管实验报告了,和我一组的同学虽然郁闷,但也只能自己写了交上去。
古巴导弹危机就是斗鸡博弈的一个例子。如果美国和前苏联打起来,那估计就是核大战了,这对双方都是毁灭性的。因此谁要是能让对方相信自己会不惜一切代价强硬到底,对方就会退缩。终于到最后前苏联打了退堂鼓。
5.固定和博弈(fixed-sum game)
博弈还可以按照效用的总和来划分,如果把参与者所有的效用加起来,总和是固定的,那么就叫做固定和博弈,反之则成为变和博弈(variable-sum game)。很显然,在固定和博弈中,参与者不能进行合作。因为他们的利益是完全对立的,一方多得一点,另一方必然就会少一点。在变和博弈中,效用的总和可以变化,双方通过合作都能够获得比不合作带来更多的收益,从而有了合作的空间,但这也并不能消除双方之间的竞争。从长远来讲,博弈是变和的,但是在某一瞬时来讲,博弈又是固定和的,因而双方常常是合作中有竞争,竞争中又有合作。
篇8:博弈论读后感
我阅读的书是《博弈论教程》,王则柯、李杰编著,中国人民大学出版社。此书一共分为九章,我自学了前七章,总结了一下学习心得。
博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。
同时决策博弈
纳什均衡:局中人单独改变策略不会得到好处的对局即策略组合,就是纳什均衡。设 是 人博弈 的一个策略组合。如果对于每个局中人 , ,对于所有的 都成立,则我们称策略组合 是该博弈的一个纳什均衡。
优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。
混合策略纳什均衡
对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。
混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。
混合策略:有一个有N个局中人参与的策略式博弈 中,假定局中人 有 个纯策略,即 则概率分布 ,其中 , ,称为局中人 的一个混合策略,这里 表示局中人 选择纯策略 的概率。
混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:
1 ,对于任意的
2 ,对于任意的
利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。
帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。
序贯决策博弈
序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了“先动优势”和“后动优势”的概念,摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。
利用倒推法寻找序贯决策博弈的纳什均衡。
同时博弈与序贯博弈
子博弈:在一个 人展开型博弈 中,满足如下3个条件的一个博弈 ,称为 的一个子博弈:(1) 的博弈树是 的博弈树的一支;(2)博弈 不能分割博弈 的信息集,具体来说,只要博弈 的某个信息集的任何一个决策节点是博弈 的一个决策节点,那么博弈 的这个信息集的每一个决策节点都必须是博弈 的决策节点;(3)博弈 的末端节点处的支付向量,与博弈 在这些末端节点上的支付向量的有关部分重合。
重复博弈和策略性行动
子博弈精练纳什均衡:令 表示阶段博弈, 是 重复 次的重复博弈, ,如果 有唯一的纳什均衡,那么重复博弈 的唯一的子博弈精练纳什均衡结果,是阶段博弈 的纳什均衡重复 次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。
对于无限次重复的囚徒困境博弈,存在触发策略,两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。
对手是否采取背叛策略,取决于有效收益率 。
零和博弈
零和博弈又称“零和游戏”,与非零和博弈相对,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。
寻求二人零和博弈的纯策略纳什均衡,可以采用相对优势策略划线法,也可以采用最小最大法,最小最大法依托的思想是:局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度,行局中人采用maximin的决策原则,列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。
【博弈论的经典案例】相关文章:
4.个人简历案例
5.德育工作案例
6.教学案例
7.软文案例
8.案例范文
9.营销策划案例
10.案例反思






文档为doc格式