综合欧美日韩国产成人,婷婷亚洲久悠悠色悠在线播放

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

如何利用囚徒困境，讓選擇的利益最大化？

唐寂

2020-01-19

2 評論 4216 瀏覽 4 收藏

15 分鐘

人在江湖走，于利益眾多的權衡與博弈中，什么樣的選擇是相對好、相對優質的呢？本文或許對你有所啟發。

1. 精英律師

又是歲末年初。

南方的城市里，雖未至嚴冬，已頗有寒意，正是三兩知己一邊火鍋一邊暢談的相聚好時機。

青子看著電視里正在放著的《精英律師》，說道：

“這集看過了，說的是富豪百億遺產爭奪案，富豪弟弟和富豪老婆，爭來爭去，到最后選了個和解方案，誰也沒有成功獨吞全部財產?！?/p>

【精英律師-劇照】

未待眾人接話，青子像是突然想起了什么，對著唐寂大聲說道：“有利有弊，互相猜忌，最后兩邊折衷和解，這是不是你以前跟我講的那個什么…..什么罪犯案例？”

唐寂看了一眼電視，答道：“是囚徒困境?！?/p>

2. 囚徒困境

2.1“囚徒困境”理論簡介

囚徒困境（Prisoner’s Dilemma），是博弈論的非零和博弈中極具代表性的例子。

非零和博弈是指博弈中各方的收益或者損失的總和不是零，區別于零和博弈（例如“你”贏就一定“我”輸的對賭），是一種合作下的博弈。

囚徒困境指出，個人的最佳選擇可能并非團體最佳選擇，或者說，在一個群體中，個人做出理性選擇（個人利益最大化）時，卻可能導致集體的非理性（集體利益非最大化，甚至集體利益最小化）。

囚徒困境的故事，可簡述為：

警方逮捕了甲、乙兩名嫌犯，但并沒有足夠證據指控二人入罪。于是，警方分開囚禁甲、乙，并分別和二人見面，且向雙方提供以下相同選擇：

若一人認罪并作證檢舉對方，而對方保持沉默，則此人即時無罪獲釋，沉默者判刑10年；
若二人皆沉默不檢舉，則二人同時判刑1年；
若二人相互檢舉，則二人同時判刑7年。

最終，甲乙二人在以下合理前提條件下：

被隔斷無交流
均獲知懲罰的確實有效性
確認抉擇后對方無報復手段
雙方皆為理性人，會最大限度為自己爭取利益

最終選擇“相互檢舉”，導致”二人同時判刑7年”。

2.2《精英律師》案例分析

在《精英律師》案例中，富豪孫浩瀚留下了百億遺產，孫超越（孫浩瀚親弟）與藍紅（孫浩瀚妻子）針對繼承權問題對簿公堂。

圍繞是否存在合法有效的遺囑，雙方面臨的情況是：

若存在合法有效的遺囑，孫超越為合法繼承人；
若不存在合法有效的遺囑，藍紅作為配偶，是法定繼承人。

因此，在訴訟與和解的抉擇面前，二人的博弈是：

但最終，二人沒有走到“讓對方零繼承”的最壞局面。

通過雙方律師和當事人的正確判斷與有效博弈，在基于“孫浩瀚既不希望親弟零繼承，也不希望妻子零繼承”的情理之上，二人最終達成“相互體諒”的和解。

【精英律師-劇照，來源：愛奇藝】

“百億家產啊，如果是我，我就賭一局！”

“那我可提醒你，相比于翻倍叫地主，這刺激程度可能更接近于俄羅斯輪盤賭。”

“按50-50的概率算，理論上的數學期望，應該跟和解方案相近。”

“哈哈，那還是不要賭這一局了?！?/p>
“還有類似的案例嗎？”

“再給你說個候選人投票的故事吧?！?/p>

3. 三中選一

候選人投票故事：

現有甲乙丙評委三人，需對ABC候選三人進行投票，投票規則如下：

評委每人對ABC三人進行排序，排序一二三分別對應計分3、2、1；

三位評委的排序投票求和，總計分最高者，勝出；

如三位評委的投票排序皆為ABC，則A計9分，B計6分，C計3分，A勝出。

已知以下情況：甲欣賞A，乙欣賞B，丙態度不明。

請問：甲是否存在一種策略，最大概率使A勝出？

……

“既然甲想選A，A得3分，乙想選B，B也得3分，那關鍵就是丙想選誰，因為丙的第一順位也是3分?！?/p>
“那也不一定，排第二也有2分，兩個2分，跟一個3分一個1分，都是4分。”

“對啊，你也說了，問題就在于只有三個人進行321排序，只要拿到一個3分，另一個至少有一個1分，那也是立于不敗之地了?！?/p>
“問題是沒說丙一定會給A投3分?。俊?/p>
“那這個問題，是不是可以先討論到底需要多少分才能保證不被淘汰！”

“在數學上，這確實是排列組合的概率和期望問題?！?/p>

3.1 囚徒困境下的概率問題

先回到上面《精英律師》里的案例，若假設有：

遺囑有效的的概率為50%；
訴訟勝利獲得全部遺產，100億；
訴訟失敗則零繼承，0收益。

那么，藍紅和孫超越在博弈中的數學期望，應該是：

E=100*0.5+0*（1-0.5）=50（億）

因此，折衷和解，于情于理，符合雙方預期利益。

再看“三選一”案例，其數學本質更接近于如下條件中的排列組合問題。

假設有：甲已將3分賦予A，乙已將3分賦予B

則請問：甲將2分賦予給B和C中的哪位，可使得A得到最多分的概率最大？

本文不展開探討具體的概率計算問題，感興趣的讀者，可以留言探討——A需要至少得多少分，才能保證勝出？

3.2 囚徒困境下的博弈問題

“我倒覺得可以簡單一些，既然甲選A乙選B丙態度不明，那就可以認為是甲乙在博弈，也就是說，甲的排序必須是ACB。另外，故事里的甲，跟我想的是一樣嗎？”

“不，他輸了。”

囚徒困境中，核心的博弈條件之一，就是理性人。

理性人的兩大特點是：

趨利避害，利己；
完全理性，能夠根據趨利避害原則針對成本-收益采取一切機會和手段進行優化選擇。

因此，如果博弈雙方中，存在非理性的一方，比如認為對方與自己利益一致，或認為對方將為集體利益犧牲個人利益，則很可能導致決策失誤，使得自己陷入困境，而對方打破困境。

反之，對局中人的啟示是，重要的不是在困境中抉擇，而是要嘗試引導對方，使之為本方利益或集體最大利益服務，才能打破困境。

4. 六中選二

“故事里的甲，不是你吧？?！?/p>
“是與不是，又有何妨？”

“那還有甲最終獲勝的故事嗎？”

“有。如下所示：

現有甲乙丙評委三人，需對甲團隊ABC、乙團隊DEF候選六人進行投票，投票規則如下：

評委每人投票選擇三人，被選者每人計得1票，不計分；

甲、乙可在本方團隊選兩人且在對方團隊選一人；

丙可在候選六人中任選三人；

三位評委的投票求和，得票最高的前兩位，勝出；

如三位評委的投票皆為ABD，則ABD各計3票，需進行二次投票。

已知有以下情況：

甲傾向ABC，乙傾向DEF，丙態度不明；

A為甲團隊實力干將，業績優異；

B為甲團隊多年骨干，兢兢業業；

C為甲團隊新鮮血液，成長迅速；

D為乙團隊實力干將，業績良好；

E為乙團隊多年元老，穩定輸出；

F為乙團隊拼命三郎，低調老實。

請問：甲是否存在一種策略，最大概率使AB勝出？”

……

“六選二，這個我更加不想算了。”

“不見得更難算啊，畢竟只計票不計分?！?/p>
“那也是三個3票在六個人身上的排列組合問題……”

“正向推算若太麻煩，為何不試試逆向？”

“何為逆向？”

“算自己多，不如算對方少。”

事實上，如若甲乙丙為同一團隊，ABCDEF為同一團隊下的六位伙伴，所有人互信互利，將有如下隱性條件：

甲乙丙的抉擇以團隊利益最大化為目的
從ABCDEF六名候選人中任意選擇兩名的利益差異過小

則此情形下不存在囚徒困境的博弈。

繼續遵循“囚徒困境”的條件作進一步假設：

甲乙為完全理性人，趨利避害；
C、F存在一定短板，例如群眾基礎相對薄弱，不能服眾，我們稱之為“劣勢候選人”。

此情形下，甲乙面臨的情況有：

對方都會力求保住自己的優勢候選人
盡量控制對方優勢候選人的總票數

那么，二人的博弈將轉變為：

到此，可以非常清晰地看到，在“六選二”案例中：

為求己方團隊利益最大，甲乙可能會高概率投對方劣勢候選人；
最嚴重的后果是“劣幣驅逐良幣”，雙方團隊的優勢候選人皆無法勝出；
丙的態度不明確，將進一步加劇此態勢。

這便是真正的囚徒困境。

5. 天下無囚

“所以故事里的甲，贏了？”

“不是你自己要聽勝利的案例么？”

“是你的風格？”

“充分利用規則獲得勝利，有什么不好？掌握主動后說不定還可以賣個人情?！?/p>
“不是你的風格?！?/p>
“乙之砒霜，甲之蜜糖。”

“那也不是你的風格?！?/p>
“In me?the tiger sniffs the rose.“

“Whaaaaat？”

“心有猛虎，細嗅薔薇?！?/p>
“說人話！”

“菩薩心腸，雷霆手段。”

囚徒困境，作為經典的博弈論案例，對所有面臨抉擇的商業談判、溝通策略、人生選擇，都有著值得深思借鑒的價值，無論是作為對自己的警醒，還是作為對他方的預防。

但是，在囚徒困境中抉擇得再好，也是囚徒的抉擇。打破囚徒困境的唯一出路，就是不要成為囚徒。畢竟，高手人抬人，低手人踩人。畢竟，最重要的不是技巧，而是人心。

愿天下無囚！