張學友是“逃犯克星”?貝葉斯公式告訴你真相
每個演唱會抓到逃犯的比例是比較接近的,張學友的演唱會有何不同呢?為何張學友成為了“逃犯克星”呢?一起來了解一下貝葉斯公式,讓它來告訴你真相。
01
為什么張學友的每場演唱會都有逃犯落網?
先看看“學友·經典世界巡回演唱會”的“顯赫戰功”:
- 4月7日南昌站首個逃犯在現場落網。
- 5月5日贛州演唱會開場安檢的過程中,警方通過人臉識別技術,成功抓獲一名網上逃犯。
- 5月20日嘉興演唱會安檢時,發現逃犯一名,隨后被警方逮捕。
- 6月9日金華演唱會,兩名逃犯落網。
- 7月6日呼和浩特,警方抓獲冒雨前來觀看演唱會的全國在逃人員王某某。
- 7月8日洛陽演唱會,早在5月份就期待滿滿的洛陽警方成功拿下“七殺”。
- 9月21日遂寧演唱會,第一場就抓到了10余名違法犯罪人員。
- 9月28日石家莊演唱會,現場三名逃犯落網。
- 9月30日咸陽警方成功抓獲5名逃犯。
幾乎每場演唱會都會有逃犯落網,“歌神”張學友怎樣看待自己“逃犯克星”的稱號呢?
連續九場,場場有逃犯被抓,真實的原因到底是什么呢?
02
先讓我們跳開,來看一個影院中的貝葉斯推理。
(下面案例的英文出處:Brandon Rohrer)
你前往影院排隊觀影,前面有個小伙伴,長發披肩,衣著中性,如:上圖,請問Ta是女士的概率有多大?
情況A:
我在《生命、宇宙以及任何事情的終極答案》中介紹過類似的計算方法。
如上圖,是一種視覺化的貝葉斯計算法,在《統計學關我什么事》一書中有詳細解釋。
請注意上面綠色和黃色兩個長方形:
- “面積”的概念在貝葉斯概率的計算中,起著重要的作用。
- 事件的可能性,由綠色和黃色兩種構成。二者各自的概率,體現為長方形的寬度。例如上圖中,是假設男女比例是1:1。
- 長方形的高度,是指“可能世界”的可能構成。例如上圖,綠色長方形指女性的可能世界,進而該可能世界,是由“一半長發+一半短發”的假設比例構成。
了解了面積法,開始計算,步驟如下:
- 第一步:首先假定影院中男女各占一半,100個人中,50個男人,50個女人。貝葉斯計算的特點,就是可以主觀預測,毛估估一下。
- 第二步:假設女人中,一半為長發,余下的25人為短發。而男人中,48位為短發,兩位為長發。這同樣是基于常識和主觀預測的毛估估。
- 第三步:由此可以計算,有25個長發女人和2位長發男人。
- 第四步:所以,Ta是女士的可能性為“25/(25+2)=92.6%”。
情況B:
現在讓我們增加一個新的信息,你現在排隊是在準備進入男士休息室。依靠這個額外的信息,僅采用常識和背景知識即可完成判斷Ta更可能是男性,無需思考。但是,貝葉斯推理則能以數學實現形式,做出更加精確的預測。
其意義在于,在某些你無法很簡單靠常識和直覺來做出量化判斷的時候,你就需要精確的算法了。
所以讓我們繼續用貝葉斯來計算如下:
如上圖,還是采用面積計算法我們開始推理:
- 第一步:100個人在男士休息室外排隊,我們主觀猜測毛估估一下,其中98名為男士,有2位陪同的女士。如上圖中的綠色長方形,因為女性極少,所以該長方形很“瘦”。
- 第二步:假設女人中,一半為長發,一半為短發。而男人中每50人里有兩位為長發。和上面的情形一樣,這同樣是基于常識和主觀預測的毛估估。我們注意到,盡管男性長發的比例很低,但是由于人群基數較大,所以下面計算男性長發人數的(深黃色那個)長方形很“胖”,有4個之多。
- 第三步:按照以上的假設,短發男士有94人,長發為4人。而兩位女士則一個長發一個短發。即,長發人士里有4男1女。
- 第四步:Ta是女士的可能性為20%。
這里涉及了兩個個關于概率的概念:
- 先驗概率:是指根據以往經驗和分析得到的概率,它往往作為”由因求果”問題中的”因”出現的概率。例如:上面長頭發是男是女的案例里,開始根據常識,假設人群整體性別比例為1:1。
- 后驗概率:是指在得到“結果”的信息后重新修正的概率,是“執果尋因”問題中的”果”。
由于知道了是在男士休息室前的排隊,根據此信息,將人群男女比例調整為98:2。
該過程稱為“貝葉斯推理”,貝葉斯推理可以總結為:通過觀察行動(信息),將先驗概率通過貝葉斯更新,轉換為后驗概率。
貝葉斯算法之所以在人工智能時代大放異彩,是因為其具有學習功能。貝葉斯推理中,修改過的“各個類別的后驗概率”,已經使用了所有的信息。也就是說我們可以將其看作“從信息中學習到的結果”。貝葉斯推理正是具備了“收集信息并自動變聰明”的功能。
03
張學友演唱會抓逃犯,和貝葉斯計算有什么關系呢?
最近幾年,攝像頭、人臉識別、聯網技術大規模使用,是導致逃犯被抓的首因。簡單來說,每個演唱會抓到逃犯的比例應該是比較接近的。
張學友的演唱會有何不同呢?
不全面分析如下:
- 原因1:張學友的男性歌迷較多,從抓捕照片看,基本為男性逃犯,好像只有一位女性。因為男性人群的基數更大,所以張學友演唱會上出現逃犯的概率更大。
- 原因2:演唱會規模較大。因為整體人數基數越大,男性歌迷人數更多,有逃犯的可能性越大。
- 原因3:年齡段分布較廣。
- 原因4:階層分布較廣。
- 原因5:演唱會基本都在二三四線城市。
以上原因3、4、5,可能令歌迷與逃犯的人群重合度更高。也就是說,因為年齡分布、階層分布、城市分布的原因,即使是在同樣數量的男性歌迷中,出現逃犯的概率更大。
概括而言,因為:
- 更大的人群基數;
- 更高的男性比例;
- 更高的逃犯比例。
導致了張學友演唱會上出現逃犯的數量較多。
根據以上5點信息,我們通過貝葉斯推理,會有類似上面“男士休息室”的信息更新。有興趣的話,可以通過“面積法”計算一下。
所以,在張學友的演唱會上,出現疑犯的“后驗概率”更高。
04
懸念在于,為什么逃犯愿意鋌而走險去看張學友的演唱會?
上面分析后驗概率,計算的其實是張學友歌迷中包括逃犯的比例。但是這個比例再高,如果逃犯不來現場,也沒用。
下面我們用決策樹分析法,計算逃犯愿意冒險主動來到現場的可能性。我沒有更多別的演唱會是否有逃犯被抓的數據,簡單用決策樹分析如下。
在尋常情況下,逃犯決定是否去看演唱會,會進行下圖思考:
所以一般演唱會,逃犯冒險去看的概率為10%。但是,張學友不是一般人啊,他人品正,沒緋聞,歌唱得蕩氣回腸,容易令英雄豪杰們產生共鳴。作為靈魂型歌手,張學友令逃犯歌迷更愿意冒險。
逃犯們每天東躲西藏,日子壓抑。又如《肖申克的救贖》里所言,每個罪犯都覺得自己無罪。腦海里浮現出張學友的歌曲,“有故事的人”不禁感慨萬千,非理性指數大幅上升。
于是,逃犯冒險去看張學友演唱會的概率為30%。這樣,逃犯出現在張學友演唱會上的主動可能性,對比一般演唱會,一下變成了三倍。
加之前面提及的較高的逃犯比例之“后驗概率”,二者相乘,令逃犯出現在張學友演唱會上的數量較多。
在技術手段的幫助下(該類逃犯對科技進步估計不足,也拉低了理性的比例),張學友的演唱會變成了逃犯放飛自我的舞臺。
“你陪了我多少年,花開花落,一路上起起跌跌?!?/p>
那天晚上,亡命天涯的大哥,在最后的四大天王的歌聲中,勾起了年少往事,飛蛾撲火般慷慨赴約,哪怕最終身陷牢籠。
作者:老喻在加,公眾號:孤獨大腦(ID:lonelybrain)
本文由 @老喻在加 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖作者提供
看到評論發現大家前面都看不懂我就放心了
收集信息變聰明的算法,想當年在課堂上被貝葉斯折磨的死去活來,現在給你一句話讓我重新認識了貝葉斯
1
草,看不懂
看不下去分析,跳過看后面了