如何利用囚徒困境,讓選擇的利益最大化?
人在江湖走,于利益眾多的權衡與博弈中,什么樣的選擇是相對好、相對優質的呢?本文或許對你有所啟發。
1. 精英律師
又是歲末年初。
南方的城市里,雖未至嚴冬,已頗有寒意,正是三兩知己一邊火鍋一邊暢談的相聚好時機。
青子看著電視里正在放著的《精英律師》,說道:
“這集看過了,說的是富豪百億遺產爭奪案,富豪弟弟和富豪老婆,爭來爭去,到最后選了個和解方案,誰也沒有成功獨吞全部財產?!?/p>
【精英律師-劇照】
未待眾人接話,青子像是突然想起了什么,對著唐寂大聲說道:“有利有弊,互相猜忌,最后兩邊折衷和解,這是不是你以前跟我講的那個什么…..什么罪犯案例?”
唐寂看了一眼電視,答道:“是囚徒困境?!?/p>
2. 囚徒困境
2.1“囚徒困境”理論簡介
囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。
非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別于零和博弈(例如“你”贏就一定“我”輸的對賭),是一種合作下的博弈。
囚徒困境指出,個人的最佳選擇可能并非團體最佳選擇,或者說,在一個群體中,個人做出理性選擇(個人利益最大化)時,卻可能導致集體的非理性(集體利益非最大化,甚至集體利益最小化)。
囚徒困境的故事,可簡述為:
警方逮捕了甲、乙兩名嫌犯,但并沒有足夠證據指控二人入罪。于是,警方分開囚禁甲、乙,并分別和二人見面,且向雙方提供以下相同選擇:
- 若一人認罪并作證檢舉對方,而對方保持沉默,則此人即時無罪獲釋,沉默者判刑10年;
- 若二人皆沉默不檢舉,則二人同時判刑1年;
- 若二人相互檢舉,則二人同時判刑7年。
最終,甲乙二人在以下合理前提條件下:
- 被隔斷無交流
- 均獲知懲罰的確實有效性
- 確認抉擇后對方無報復手段
- 雙方皆為理性人,會最大限度為自己爭取利益
最終選擇“相互檢舉”,導致”二人同時判刑7年”。
2.2《精英律師》案例分析
在《精英律師》案例中,富豪孫浩瀚留下了百億遺產,孫超越(孫浩瀚親弟)與藍紅(孫浩瀚妻子)針對繼承權問題對簿公堂。
圍繞是否存在合法有效的遺囑,雙方面臨的情況是:
- 若存在合法有效的遺囑,孫超越為合法繼承人;
- 若不存在合法有效的遺囑,藍紅作為配偶,是法定繼承人。
因此,在訴訟與和解的抉擇面前,二人的博弈是:
但最終,二人沒有走到“讓對方零繼承”的最壞局面。
通過雙方律師和當事人的正確判斷與有效博弈,在基于“孫浩瀚既不希望親弟零繼承,也不希望妻子零繼承”的情理之上,二人最終達成“相互體諒”的和解。
【精英律師-劇照,來源:愛奇藝】
“百億家產啊,如果是我,我就賭一局!”
“那我可提醒你,相比于翻倍叫地主,這刺激程度可能更接近于俄羅斯輪盤賭。”
“按50-50的概率算,理論上的數學期望,應該跟和解方案相近。”
“哈哈,那還是不要賭這一局了?!?/p>
“還有類似的案例嗎?”
“再給你說個候選人投票的故事吧?!?/p>
3. 三中選一
候選人投票故事:
現有甲乙丙評委三人,需對ABC候選三人進行投票,投票規則如下:
- 評委每人對ABC三人進行排序,排序一二三分別對應計分3、2、1;
- 三位評委的排序投票求和,總計分最高者,勝出;
- 如三位評委的投票排序皆為ABC,則A計9分,B計6分,C計3分,A勝出。
已知以下情況:甲欣賞A,乙欣賞B,丙態度不明。
請問:甲是否存在一種策略,最大概率使A勝出?
……
“既然甲想選A,A得3分,乙想選B,B也得3分,那關鍵就是丙想選誰,因為丙的第一順位也是3分?!?/p>
“那也不一定,排第二也有2分,兩個2分,跟一個3分一個1分,都是4分。”
“對啊,你也說了,問題就在于只有三個人進行321排序,只要拿到一個3分,另一個至少有一個1分,那也是立于不敗之地了?!?/p>
“問題是沒說丙一定會給A投3分?。俊?/p>
“那這個問題,是不是可以先討論到底需要多少分才能保證不被淘汰!”
“在數學上,這確實是排列組合的概率和期望問題?!?/p>
3.1 囚徒困境下的概率問題
先回到上面《精英律師》里的案例,若假設有:
- 遺囑有效的的概率為50%;
- 訴訟勝利獲得全部遺產,100億;
- 訴訟失敗則零繼承,0收益。
那么,藍紅和孫超越在博弈中的數學期望,應該是:
E=100*0.5+0*(1-0.5)=50(億)
因此,折衷和解,于情于理,符合雙方預期利益。
再看“三選一”案例,其數學本質更接近于如下條件中的排列組合問題。
假設有:甲已將3分賦予A,乙已將3分賦予B
則請問:甲將2分賦予給B和C中的哪位,可使得A得到最多分的概率最大?
本文不展開探討具體的概率計算問題,感興趣的讀者,可以留言探討——A需要至少得多少分,才能保證勝出?
3.2 囚徒困境下的博弈問題
“我倒覺得可以簡單一些,既然甲選A乙選B丙態度不明,那就可以認為是甲乙在博弈,也就是說,甲的排序必須是ACB。另外,故事里的甲,跟我想的是一樣嗎?”
“不,他輸了。”
囚徒困境中,核心的博弈條件之一,就是理性人。
理性人的兩大特點是:
- 趨利避害,利己;
- 完全理性,能夠根據趨利避害原則針對成本-收益采取一切機會和手段進行優化選擇。
因此,如果博弈雙方中,存在非理性的一方,比如認為對方與自己利益一致,或認為對方將為集體利益犧牲個人利益,則很可能導致決策失誤,使得自己陷入困境,而對方打破困境。
反之,對局中人的啟示是,重要的不是在困境中抉擇,而是要嘗試引導對方,使之為本方利益或集體最大利益服務,才能打破困境。
4. 六中選二
“故事里的甲,不是你吧??!?/p>
“是與不是,又有何妨?”
“那還有甲最終獲勝的故事嗎?”
“有。如下所示:
現有甲乙丙評委三人,需對甲團隊ABC、乙團隊DEF候選六人進行投票,投票規則如下:
- 評委每人投票選擇三人,被選者每人計得1票,不計分;
- 甲、乙可在本方團隊選兩人且在對方團隊選一人;
- 丙可在候選六人中任選三人;
- 三位評委的投票求和,得票最高的前兩位,勝出;
- 如三位評委的投票皆為ABD,則ABD各計3票,需進行二次投票。
已知有以下情況:
- 甲傾向ABC,乙傾向DEF,丙態度不明;
- A為甲團隊實力干將,業績優異;
- B為甲團隊多年骨干,兢兢業業;
- C為甲團隊新鮮血液,成長迅速;
- D為乙團隊實力干將,業績良好;
- E為乙團隊多年元老,穩定輸出;
- F為乙團隊拼命三郎,低調老實。
請問:甲是否存在一種策略,最大概率使AB勝出?”
……
“六選二,這個我更加不想算了。”
“不見得更難算啊,畢竟只計票不計分?!?/p>
“那也是三個3票在六個人身上的排列組合問題……”
“正向推算若太麻煩,為何不試試逆向?”
“何為逆向?”
“算自己多,不如算對方少。”
事實上,如若甲乙丙為同一團隊,ABCDEF為同一團隊下的六位伙伴,所有人互信互利,將有如下隱性條件:
- 甲乙丙的抉擇以團隊利益最大化為目的
- 從ABCDEF六名候選人中任意選擇兩名的利益差異過小
則此情形下不存在囚徒困境的博弈。
繼續遵循“囚徒困境”的條件作進一步假設:
- 甲乙為完全理性人,趨利避害;
- C、F存在一定短板,例如群眾基礎相對薄弱,不能服眾,我們稱之為“劣勢候選人”。
此情形下,甲乙面臨的情況有:
- 對方都會力求保住自己的優勢候選人
- 盡量控制對方優勢候選人的總票數
那么,二人的博弈將轉變為:
到此,可以非常清晰地看到,在“六選二”案例中:
- 為求己方團隊利益最大,甲乙可能會高概率投對方劣勢候選人;
- 最嚴重的后果是“劣幣驅逐良幣”,雙方團隊的優勢候選人皆無法勝出;
- 丙的態度不明確,將進一步加劇此態勢。
這便是真正的囚徒困境。
5. 天下無囚
“所以故事里的甲,贏了?”
“不是你自己要聽勝利的案例么?”
“是你的風格?”
“充分利用規則獲得勝利,有什么不好?掌握主動后說不定還可以賣個人情?!?/p>
“不是你的風格?!?/p>
“乙之砒霜,甲之蜜糖。”
“那也不是你的風格?!?/p>
“In me?the tiger sniffs the rose.“
“Whaaaaat?”
“心有猛虎,細嗅薔薇?!?/p>
“說人話!”
“菩薩心腸,雷霆手段。”
囚徒困境,作為經典的博弈論案例,對所有面臨抉擇的商業談判、溝通策略、人生選擇,都有著值得深思借鑒的價值,無論是作為對自己的警醒,還是作為對他方的預防。
但是,在囚徒困境中抉擇得再好,也是囚徒的抉擇。打破囚徒困境的唯一出路,就是不要成為囚徒。畢竟,高手人抬人,低手人踩人。畢竟,最重要的不是技巧,而是人心。
愿天下無囚!
唐寂看了一眼手表,站起身,舉起杯子,說道:
“來來來,再過幾天就新年了,大家一起~”
“新年快樂!”
“大吉大利!”
“長命百歲!”
“精神!”
“富強!”
“哈哈哈哈!”
“天下無囚!”
END
歡迎查閱更多精彩文章
產品經理方法論系列文章:
- 常識/邏輯/業務能力——《從“汽水兌換”案例,看你能不能當產品經理?》
- 期望管理“七步法則”——《七步法則,從容應對老板期望“出爾反爾”》
車聯網生態應用建設戰略系列文章:
- 第一篇,聚焦收入模式分析——《車載應用付費下載,你動了誰的奶酪?》
- 第二篇,聚焦產業格局分析——《車載應用產業格局,誰是你的同路人?》
作者:唐寂;微信公眾號:刀法入兵(ID:daofajia)。品牌車企車聯網生態產品負責人,智慧出行行業十年產品人,“影子評審團”評委,曾主導車企多款重量級產品的定義重構和互聯網超級應用融合上車。
本文由 @唐寂 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
這樣的表達不能算稱職的產品經理吧?80%的篇幅在舉例子,結論歸納篇幅不到20%,這樣恐怕很難與人溝通吧?
???黑人問號臉?