如何利用囚徒困境,讓選擇的利益最大化?

2 評論 4216 瀏覽 4 收藏 15 分鐘

人在江湖走,于利益眾多的權衡與博弈中,什么樣的選擇是相對好、相對優質的呢?本文或許對你有所啟發。

1. 精英律師

又是歲末年初。

南方的城市里,雖未至嚴冬,已頗有寒意,正是三兩知己一邊火鍋一邊暢談的相聚好時機。

青子看著電視里正在放著的《精英律師》,說道:

“這集看過了,說的是富豪百億遺產爭奪案,富豪弟弟和富豪老婆,爭來爭去,到最后選了個和解方案,誰也沒有成功獨吞全部財產?!?/p>

【精英律師-劇照】

未待眾人接話,青子像是突然想起了什么,對著唐寂大聲說道:“有利有弊,互相猜忌,最后兩邊折衷和解,這是不是你以前跟我講的那個什么…..什么罪犯案例?”

唐寂看了一眼電視,答道:“是囚徒困境?!?/p>

2. 囚徒困境

2.1“囚徒困境”理論簡介

囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。

非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別于零和博弈(例如“你”贏就一定“我”輸的對賭),是一種合作下的博弈。

囚徒困境指出,個人的最佳選擇可能并非團體最佳選擇,或者說,在一個群體中,個人做出理性選擇(個人利益最大化)時,卻可能導致集體的非理性(集體利益非最大化,甚至集體利益最小化)。

囚徒困境的故事,可簡述為:

警方逮捕了甲、乙兩名嫌犯,但并沒有足夠證據指控二人入罪。于是,警方分開囚禁甲、乙,并分別和二人見面,且向雙方提供以下相同選擇:

  • 若一人認罪并作證檢舉對方,而對方保持沉默,則此人即時無罪獲釋,沉默者判刑10年;
  • 若二人皆沉默不檢舉,則二人同時判刑1年;
  • 若二人相互檢舉,則二人同時判刑7年。

最終,甲乙二人在以下合理前提條件下:

  • 被隔斷無交流
  • 均獲知懲罰的確實有效性
  • 確認抉擇后對方無報復手段
  • 雙方皆為理性人,會最大限度為自己爭取利益

最終選擇“相互檢舉”,導致”二人同時判刑7年”。

2.2《精英律師》案例分析

在《精英律師》案例中,富豪孫浩瀚留下了百億遺產,孫超越(孫浩瀚親弟)與藍紅(孫浩瀚妻子)針對繼承權問題對簿公堂。

圍繞是否存在合法有效的遺囑,雙方面臨的情況是:

  • 若存在合法有效的遺囑,孫超越為合法繼承人;
  • 若不存在合法有效的遺囑,藍紅作為配偶,是法定繼承人。

因此,在訴訟與和解的抉擇面前,二人的博弈是:

但最終,二人沒有走到“讓對方零繼承”的最壞局面。

通過雙方律師和當事人的正確判斷與有效博弈,在基于“孫浩瀚既不希望親弟零繼承,也不希望妻子零繼承”的情理之上,二人最終達成“相互體諒”的和解。

【精英律師-劇照,來源:愛奇藝】

“百億家產啊,如果是我,我就賭一局!”

“那我可提醒你,相比于翻倍叫地主,這刺激程度可能更接近于俄羅斯輪盤賭。”

“按50-50的概率算,理論上的數學期望,應該跟和解方案相近。”

“哈哈,那還是不要賭這一局了?!?/p>

“還有類似的案例嗎?”

“再給你說個候選人投票的故事吧?!?/p>

3. 三中選一

候選人投票故事:

現有甲乙丙評委三人,需對ABC候選三人進行投票,投票規則如下:

  • 評委每人對ABC三人進行排序,排序一二三分別對應計分3、2、1;
  • 三位評委的排序投票求和,總計分最高者,勝出;
  • 如三位評委的投票排序皆為ABC,則A計9分,B計6分,C計3分,A勝出。

已知以下情況:甲欣賞A,乙欣賞B,丙態度不明。

請問:甲是否存在一種策略,最大概率使A勝出?

……

“既然甲想選A,A得3分,乙想選B,B也得3分,那關鍵就是丙想選誰,因為丙的第一順位也是3分?!?/p>

“那也不一定,排第二也有2分,兩個2分,跟一個3分一個1分,都是4分。”

“對啊,你也說了,問題就在于只有三個人進行321排序,只要拿到一個3分,另一個至少有一個1分,那也是立于不敗之地了?!?/p>

“問題是沒說丙一定會給A投3分?。俊?/p>

“那這個問題,是不是可以先討論到底需要多少分才能保證不被淘汰!”

“在數學上,這確實是排列組合的概率和期望問題?!?/p>

3.1 囚徒困境下的概率問題

先回到上面《精英律師》里的案例,若假設有:

  • 遺囑有效的的概率為50%;
  • 訴訟勝利獲得全部遺產,100億;
  • 訴訟失敗則零繼承,0收益。

那么,藍紅和孫超越在博弈中的數學期望,應該是:

E=100*0.5+0*(1-0.5)=50(億)

因此,折衷和解,于情于理,符合雙方預期利益。

再看“三選一”案例,其數學本質更接近于如下條件中的排列組合問題。

假設有:甲已將3分賦予A,乙已將3分賦予B

則請問:甲將2分賦予給B和C中的哪位,可使得A得到最多分的概率最大?

本文不展開探討具體的概率計算問題,感興趣的讀者,可以留言探討——A需要至少得多少分,才能保證勝出?

3.2 囚徒困境下的博弈問題

“我倒覺得可以簡單一些,既然甲選A乙選B丙態度不明,那就可以認為是甲乙在博弈,也就是說,甲的排序必須是ACB。另外,故事里的甲,跟我想的是一樣嗎?”

“不,他輸了。”

囚徒困境中,核心的博弈條件之一,就是理性人。

理性人的兩大特點是:

  • 趨利避害,利己;
  • 完全理性,能夠根據趨利避害原則針對成本-收益采取一切機會和手段進行優化選擇。

因此,如果博弈雙方中,存在非理性的一方,比如認為對方與自己利益一致,或認為對方將為集體利益犧牲個人利益,則很可能導致決策失誤,使得自己陷入困境,而對方打破困境。

反之,對局中人的啟示是,重要的不是在困境中抉擇,而是要嘗試引導對方,使之為本方利益或集體最大利益服務,才能打破困境。

4. 六中選二

“故事里的甲,不是你吧??!?/p>

“是與不是,又有何妨?”

“那還有甲最終獲勝的故事嗎?”

“有。如下所示:

現有甲乙丙評委三人,需對甲團隊ABC、乙團隊DEF候選六人進行投票,投票規則如下:

  • 評委每人投票選擇三人,被選者每人計得1票,不計分;
  • 甲、乙可在本方團隊選兩人且在對方團隊選一人;
  • 丙可在候選六人中任選三人;
  • 三位評委的投票求和,得票最高的前兩位,勝出;
  • 如三位評委的投票皆為ABD,則ABD各計3票,需進行二次投票。

已知有以下情況:

  • 甲傾向ABC,乙傾向DEF,丙態度不明;
  • A為甲團隊實力干將,業績優異;
  • B為甲團隊多年骨干,兢兢業業;
  • C為甲團隊新鮮血液,成長迅速;
  • D為乙團隊實力干將,業績良好;
  • E為乙團隊多年元老,穩定輸出;
  • F為乙團隊拼命三郎,低調老實。

請問:甲是否存在一種策略,最大概率使AB勝出?”

……

“六選二,這個我更加不想算了。”

“不見得更難算啊,畢竟只計票不計分?!?/p>

“那也是三個3票在六個人身上的排列組合問題……”

“正向推算若太麻煩,為何不試試逆向?”

“何為逆向?”

“算自己多,不如算對方少。”

事實上,如若甲乙丙為同一團隊,ABCDEF為同一團隊下的六位伙伴,所有人互信互利,將有如下隱性條件:

  • 甲乙丙的抉擇以團隊利益最大化為目的
  • 從ABCDEF六名候選人中任意選擇兩名的利益差異過小

則此情形下不存在囚徒困境的博弈。

繼續遵循“囚徒困境”的條件作進一步假設:

  • 甲乙為完全理性人,趨利避害;
  • C、F存在一定短板,例如群眾基礎相對薄弱,不能服眾,我們稱之為“劣勢候選人”。

此情形下,甲乙面臨的情況有:

  • 對方都會力求保住自己的優勢候選人
  • 盡量控制對方優勢候選人的總票數

那么,二人的博弈將轉變為:

到此,可以非常清晰地看到,在“六選二”案例中:

  • 為求己方團隊利益最大,甲乙可能會高概率投對方劣勢候選人;
  • 最嚴重的后果是“劣幣驅逐良幣”,雙方團隊的優勢候選人皆無法勝出;
  • 丙的態度不明確,將進一步加劇此態勢。

這便是真正的囚徒困境。

5. 天下無囚

“所以故事里的甲,贏了?”

“不是你自己要聽勝利的案例么?”

“是你的風格?”

“充分利用規則獲得勝利,有什么不好?掌握主動后說不定還可以賣個人情?!?/p>

“不是你的風格?!?/p>

“乙之砒霜,甲之蜜糖。”

“那也不是你的風格?!?/p>

“In me?the tiger sniffs the rose.“

“Whaaaaat?”

“心有猛虎,細嗅薔薇?!?/p>

“說人話!”

“菩薩心腸,雷霆手段。”

囚徒困境,作為經典的博弈論案例,對所有面臨抉擇的商業談判、溝通策略、人生選擇,都有著值得深思借鑒的價值,無論是作為對自己的警醒,還是作為對他方的預防。

但是,在囚徒困境中抉擇得再好,也是囚徒的抉擇。打破囚徒困境的唯一出路,就是不要成為囚徒。畢竟,高手人抬人,低手人踩人。畢竟,最重要的不是技巧,而是人心。

愿天下無囚!

唐寂看了一眼手表,站起身,舉起杯子,說道:

“來來來,再過幾天就新年了,大家一起~”

“新年快樂!”

“大吉大利!”

“長命百歲!”

“精神!”

“富強!”

“哈哈哈哈!”

“天下無囚!”

END

歡迎查閱更多精彩文章

產品經理方法論系列文章:

車聯網生態應用建設戰略系列文章:

 

作者:唐寂;微信公眾號:刀法入兵(ID:daofajia)。品牌車企車聯網生態產品負責人,智慧出行行業十年產品人,“影子評審團”評委,曾主導車企多款重量級產品的定義重構和互聯網超級應用融合上車。

本文由 @唐寂 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 這樣的表達不能算稱職的產品經理吧?80%的篇幅在舉例子,結論歸納篇幅不到20%,這樣恐怕很難與人溝通吧?

    來自遼寧 回復
  2. ???黑人問號臉?

    來自浙江 回復