如何利用囚徒困境,让选择的利益最大化?

2 评论 3971 浏览 4 收藏 15 分钟

人在江湖走,于利益众多的权衡与博弈中,什么样的选择是相对好、相对优质的呢?本文或许对你有所启发。

1. 精英律师

又是岁末年初。

南方的城市里,虽未至严冬,已颇有寒意,正是三两知己一边火锅一边畅谈的相聚好时机。

青子看着电视里正在放着的《精英律师》,说道:

“这集看过了,说的是富豪百亿遗产争夺案,富豪弟弟和富豪老婆,争来争去,到最后选了个和解方案,谁也没有成功独吞全部财产。”

【精英律师-剧照】

未待众人接话,青子像是突然想起了什么,对着唐寂大声说道:“有利有弊,互相猜忌,最后两边折衷和解,这是不是你以前跟我讲的那个什么…..什么罪犯案例?”

唐寂看了一眼电视,答道:“是囚徒困境。”

2. 囚徒困境

2.1“囚徒困境”理论简介

囚徒困境(Prisoner’s Dilemma),是博弈论的非零和博弈中极具代表性的例子。

非零和博弈是指博弈中各方的收益或者损失的总和不是零,区别于零和博弈(例如“你”赢就一定“我”输的对赌),是一种合作下的博弈。

囚徒困境指出,个人的最佳选择可能并非团体最佳选择,或者说,在一个群体中,个人做出理性选择(个人利益最大化)时,却可能导致集体的非理性(集体利益非最大化,甚至集体利益最小化)。

囚徒困境的故事,可简述为:

警方逮捕了甲、乙两名嫌犯,但并没有足够证据指控二人入罪。于是,警方分开囚禁甲、乙,并分别和二人见面,且向双方提供以下相同选择:

  • 若一人认罪并作证检举对方,而对方保持沉默,则此人即时无罪获释,沉默者判刑10年;
  • 若二人皆沉默不检举,则二人同时判刑1年;
  • 若二人相互检举,则二人同时判刑7年。

最终,甲乙二人在以下合理前提条件下:

  • 被隔断无交流
  • 均获知惩罚的确实有效性
  • 确认抉择后对方无报复手段
  • 双方皆为理性人,会最大限度为自己争取利益

最终选择“相互检举”,导致”二人同时判刑7年”。

2.2《精英律师》案例分析

在《精英律师》案例中,富豪孙浩瀚留下了百亿遗产,孙超越(孙浩瀚亲弟)与蓝红(孙浩瀚妻子)针对继承权问题对簿公堂。

围绕是否存在合法有效的遗嘱,双方面临的情况是:

  • 若存在合法有效的遗嘱,孙超越为合法继承人;
  • 若不存在合法有效的遗嘱,蓝红作为配偶,是法定继承人。

因此,在诉讼与和解的抉择面前,二人的博弈是:

但最终,二人没有走到“让对方零继承”的最坏局面。

通过双方律师和当事人的正确判断与有效博弈,在基于“孙浩瀚既不希望亲弟零继承,也不希望妻子零继承”的情理之上,二人最终达成“相互体谅”的和解。

【精英律师-剧照,来源:爱奇艺】

“百亿家产啊,如果是我,我就赌一局!”

“那我可提醒你,相比于翻倍叫地主,这刺激程度可能更接近于俄罗斯轮盘赌。”

“按50-50的概率算,理论上的数学期望,应该跟和解方案相近。”

“哈哈,那还是不要赌这一局了。”

“还有类似的案例吗?”

“再给你说个候选人投票的故事吧。”

3. 三中选一

候选人投票故事:

现有甲乙丙评委三人,需对ABC候选三人进行投票,投票规则如下:

  • 评委每人对ABC三人进行排序,排序一二三分别对应计分3、2、1;
  • 三位评委的排序投票求和,总计分最高者,胜出;
  • 如三位评委的投票排序皆为ABC,则A计9分,B计6分,C计3分,A胜出。

已知以下情况:甲欣赏A,乙欣赏B,丙态度不明。

请问:甲是否存在一种策略,最大概率使A胜出?

……

“既然甲想选A,A得3分,乙想选B,B也得3分,那关键就是丙想选谁,因为丙的第一顺位也是3分。”

“那也不一定,排第二也有2分,两个2分,跟一个3分一个1分,都是4分。”

“对啊,你也说了,问题就在于只有三个人进行321排序,只要拿到一个3分,另一个至少有一个1分,那也是立于不败之地了。”

“问题是没说丙一定会给A投3分啊?”

“那这个问题,是不是可以先讨论到底需要多少分才能保证不被淘汰!”

“在数学上,这确实是排列组合的概率和期望问题。”

3.1 囚徒困境下的概率问题

先回到上面《精英律师》里的案例,若假设有:

  • 遗嘱有效的的概率为50%;
  • 诉讼胜利获得全部遗产,100亿;
  • 诉讼失败则零继承,0收益。

那么,蓝红和孙超越在博弈中的数学期望,应该是:

E=100*0.5+0*(1-0.5)=50(亿)

因此,折衷和解,于情于理,符合双方预期利益。

再看“三选一”案例,其数学本质更接近于如下条件中的排列组合问题。

假设有:甲已将3分赋予A,乙已将3分赋予B

则请问:甲将2分赋予给B和C中的哪位,可使得A得到最多分的概率最大?

本文不展开探讨具体的概率计算问题,感兴趣的读者,可以留言探讨——A需要至少得多少分,才能保证胜出?

3.2 囚徒困境下的博弈问题

“我倒觉得可以简单一些,既然甲选A乙选B丙态度不明,那就可以认为是甲乙在博弈,也就是说,甲的排序必须是ACB。另外,故事里的甲,跟我想的是一样吗?”

“不,他输了。”

囚徒困境中,核心的博弈条件之一,就是理性人。

理性人的两大特点是:

  • 趋利避害,利己;
  • 完全理性,能够根据趋利避害原则针对成本-收益采取一切机会和手段进行优化选择。

因此,如果博弈双方中,存在非理性的一方,比如认为对方与自己利益一致,或认为对方将为集体利益牺牲个人利益,则很可能导致决策失误,使得自己陷入困境,而对方打破困境。

反之,对局中人的启示是,重要的不是在困境中抉择,而是要尝试引导对方,使之为本方利益或集体最大利益服务,才能打破困境。

4. 六中选二

“故事里的甲,不是你吧?。”

“是与不是,又有何妨?”

“那还有甲最终获胜的故事吗?”

“有。如下所示:

现有甲乙丙评委三人,需对甲团队ABC、乙团队DEF候选六人进行投票,投票规则如下:

  • 评委每人投票选择三人,被选者每人计得1票,不计分;
  • 甲、乙可在本方团队选两人且在对方团队选一人;
  • 丙可在候选六人中任选三人;
  • 三位评委的投票求和,得票最高的前两位,胜出;
  • 如三位评委的投票皆为ABD,则ABD各计3票,需进行二次投票。

已知有以下情况:

  • 甲倾向ABC,乙倾向DEF,丙态度不明;
  • A为甲团队实力干将,业绩优异;
  • B为甲团队多年骨干,兢兢业业;
  • C为甲团队新鲜血液,成长迅速;
  • D为乙团队实力干将,业绩良好;
  • E为乙团队多年元老,稳定输出;
  • F为乙团队拼命三郎,低调老实。

请问:甲是否存在一种策略,最大概率使AB胜出?”

……

“六选二,这个我更加不想算了。”

“不见得更难算啊,毕竟只计票不计分。”

“那也是三个3票在六个人身上的排列组合问题……”

“正向推算若太麻烦,为何不试试逆向?”

“何为逆向?”

“算自己多,不如算对方少。”

事实上,如若甲乙丙为同一团队,ABCDEF为同一团队下的六位伙伴,所有人互信互利,将有如下隐性条件:

  • 甲乙丙的抉择以团队利益最大化为目的
  • 从ABCDEF六名候选人中任意选择两名的利益差异过小

则此情形下不存在囚徒困境的博弈。

继续遵循“囚徒困境”的条件作进一步假设:

  • 甲乙为完全理性人,趋利避害;
  • C、F存在一定短板,例如群众基础相对薄弱,不能服众,我们称之为“劣势候选人”。

此情形下,甲乙面临的情况有:

  • 对方都会力求保住自己的优势候选人
  • 尽量控制对方优势候选人的总票数

那么,二人的博弈将转变为:

到此,可以非常清晰地看到,在“六选二”案例中:

  • 为求己方团队利益最大,甲乙可能会高概率投对方劣势候选人;
  • 最严重的后果是“劣币驱逐良币”,双方团队的优势候选人皆无法胜出;
  • 丙的态度不明确,将进一步加剧此态势。

这便是真正的囚徒困境。

5. 天下无囚

“所以故事里的甲,赢了?”

“不是你自己要听胜利的案例么?”

“是你的风格?”

“充分利用规则获得胜利,有什么不好?掌握主动后说不定还可以卖个人情。”

“不是你的风格。”

“乙之砒霜,甲之蜜糖。”

“那也不是你的风格。”

“In me the tiger sniffs the rose.“

“Whaaaaat?”

“心有猛虎,细嗅蔷薇。”

“说人话!”

“菩萨心肠,雷霆手段。”

囚徒困境,作为经典的博弈论案例,对所有面临抉择的商业谈判、沟通策略、人生选择,都有着值得深思借鉴的价值,无论是作为对自己的警醒,还是作为对他方的预防。

但是,在囚徒困境中抉择得再好,也是囚徒的抉择。打破囚徒困境的唯一出路,就是不要成为囚徒。毕竟,高手人抬人,低手人踩人。毕竟,最重要的不是技巧,而是人心。

愿天下无囚!

唐寂看了一眼手表,站起身,举起杯子,说道:

“来来来,再过几天就新年了,大家一起~”

“新年快乐!”

“大吉大利!”

“长命百岁!”

“精神!”

“富强!”

“哈哈哈哈!”

“天下无囚!”

END

欢迎查阅更多精彩文章

产品经理方法论系列文章:

车联网生态应用建设战略系列文章:

 

作者:唐寂;微信公众号:刀法入兵(ID:daofajia)。品牌车企车联网生态产品负责人,智慧出行行业十年产品人,“影子评审团”评委,曾主导车企多款重量级产品的定义重构和互联网超级应用融合上车。

本文由 @唐寂 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 这样的表达不能算称职的产品经理吧?80%的篇幅在举例子,结论归纳篇幅不到20%,这样恐怕很难与人沟通吧?

    来自辽宁 回复
  2. ???黑人问号脸?

    来自浙江 回复