產品經理如何應用貝葉斯定理?

14 評論 16432 瀏覽 72 收藏 10 分鐘

貝葉斯定理提供的是一種逆條件概率的方法,本文簡單總結了貝葉斯定理是什么,貝葉斯定理應用的理解,以及貝葉斯定理在AI場景下的應用,目的是希望產品經理了解到這個定理的能力后,在設計相關推薦或是具有推理功能的應用場景,能通過貝葉斯定理來解決。

一、貝葉斯定理介紹

其中:

  • P(B|A)表示:在事件A發生的前提下,發生事件B的概率;
  • P(A|B)表示:在事件B發生的前提下,發生事件A的概率;
  • P(A)表示:發生事件A的概率;
  • P(B)表示:發生事件B的概率。

以上公式就是貝葉斯定理,它提供的是一種逆條件概率的方法。

舉一個經常用的例子:

比如陰天的概率是40%,下雨的概率是10%,下雨天是陰天的概率是50%,那么今天是陰天下雨的概率就是P(雨|陰)=10%*50%/40%= 12.5%。

通過概率計算發現今天陰天下雨的概率比較低,可以安心出行了。

因此,貝葉斯定理是條件概率的推斷問題,這對于人們進行有效的學習和判斷決策具有十分重要的理論和實踐意義。

二、貝葉斯定理舉例說明

對于貝葉斯定理的應用,難點在于兩個事件A和B的界定與應用:為什么是B條件下的A的概率,而不是A條件下B的概率,P(A|B)和P(B|A) 之類的經常讓人混淆。也就是在我們的場景中哪些定義為事件A,哪些定義為事件B。

我在學習這里的時候也有一些困惑,看了一些文章,有了一定的理解:比如兩個事件A和B,這兩個事件是相關的,在A事件下有發生B概率的可能性,在B事件下有發生A事件的可能性。

但是統計發現:在A條件下事件B的現象更容易觀測與統計,但是A的發生或是不發生也是有一定的規律,但是這種規律更容易觀測,因此我們可以定義A是可觀測的規律,B是此規律下某一個現象,那么貝葉斯公式就可以理解為觀察到的現象去推斷現象后的規律所發生的概率問題。

那么貝葉斯定理可以理解為如下公式:

比如以下案例:

比如我們有兩個箱子,箱子中分別有黑球和白球,其中箱子1有10個黑球、10個白球,箱子2中有5個黑球,15個白球。那我們隨機選擇一個箱子,從箱子中摸出一個球,發現是黑球,那么問這個黑球來自于一號箱子的概率是多大?

那么在上問題上不難理解:摸出來黑球和白球是兩個現象,但是我們又發現黑球和白球在不同箱子里面概率是不一樣的,因此箱子就是兩個規律,這兩個規則控制著現象的發生的概率,并且是容易觀測得出概率的。

再比如,第一節說的下雨和陰天的事件,這里面也有兩個規律和兩個現象:天氣下雨和不下雨是兩個規律,陰天和不是陰天是兩個現象。我們從下雨中發現是陰天的便于觀測和統計的,我們通過觀察天氣是陰天,推斷下雨不下雨就是一個推論。

所以,再利用貝葉斯公式的時候,注意區分哪個事件是現象,哪個事件是規律,通過規律下的現象是容易觀測統計的,在某一現象下推斷規律就是個推斷的概率。

三、貝葉斯定理AI應用說明

通過以上我們發現:貝葉斯定理提供了一種發現邏輯,它與大腦的推理機制有很大的相似性,因此貝葉斯理論是人工智能中學習和推斷的重要分支。

美國心理學家MARR認為人腦有三個層次:計算層、算法層、實現層,

  • 計算層更多的是對獲取的信息的處理,比如學習知識,記憶知識
  • 算法層是更加抽象的認知活動,比如歸納、推理等
  • 實現層更多是對抽象出來的算法進行相應生物機制的實現

根據上面我們不難理解:貝葉斯理論是類腦計算的一個算法框架,因此,了解貝葉斯理論對理解人工智能的實現有著很重要的作用。

要具體了解貝葉斯定理在人工智能中的應用,我們需要在對這個公式進行一下轉換。

我們把P(A)稱為”先驗概率”,即在B事件發生之前,我們對A事件概率的一個判斷;P(A|B)稱為”后驗概率”(Posterior probability),即在B事件發生之后,我們對A事件概率的重新評估;P(B|A)/P(B)稱為”可能性函數”,這是一個調整因子,使得預估概率更接近真實概率。

所以,條件概率可以理解成下面的式子:

后驗概率=先驗概率*調整因子

這就是貝葉斯推論。

我們先預估一個”先驗概率”,然后加入在這個先驗概率規律下發生某現象的概率,看這個現象到底是增強還是削弱了”先驗概率”,由此推論出更接近事實的”后驗概率”,也由此得出對于一個后驗概率P(A|B)的增強或是削弱由兩個因素來決定的。

舉一個例子:拼寫錯誤的糾正

當用戶輸入一個詞匯,可能正確,可能錯誤,我們可以設定P(正確)是此正確詞的概率,P(錯誤)是此錯誤詞的概率,當用戶輸入一個詞是錯誤的,我們系統要推斷出正確的詞給用戶,這就是拼寫錯誤的糾正,也就是P(正確|錯誤)概率越大,我們糾正的正確率也就越高。

也就是說我們知道這個詞是錯誤的,然后去推斷一個匹配度很高的正確的詞匯給用戶,定理中我們已知這個詞的錯誤概率P(錯誤),那么我們只要最大化P(錯誤|正確)* P(正確)的詞就可以,因此找到一個正確的詞匯出現這個錯誤的詞匯概率最高的一個正確的詞就可以。

我們再舉一個互聯網的推薦的例子,比如我們某一用戶畫像下(例如80后女性)購買某一商品可能性,可能性最高的推薦給這些用戶畫像下的用戶,根據互聯網平臺掌握的此商品瀏覽后購買概率,某一用戶畫像下用戶瀏覽此商品的概率,某一用戶畫像下用戶瀏覽此商品后夠買的概率。這三個概率指標,可以找到某一用戶畫像下購買某商品概率最高的推薦出來。

除此之外,經常應用到的案例就是垃圾郵件的分類,小伙伴可以自行思考或尋找相關文獻。

以上是簡單總結了貝葉斯定理是什么,貝葉斯定理應用的理解,以及貝葉斯定理在AI場景下的應用,目的是希望我們做產品經理的了解到這個定理的能力后,在我們設計相關推薦或是具有推理功能的應用場景,我們是否能通過貝葉斯定理來解決!

其實,貝葉斯理論除了貝葉斯定理之外,還有貝葉斯分析、貝葉斯邏輯、貝葉斯網絡、貝葉斯分類器、貝葉斯決策、貝葉斯學習等相關理論與實踐,并在以上知識在人工智能領域都有應用,如果感興趣的小伙伴可以參考相關文獻進行深度研究。

關于貝葉斯定理就說到這里,個人最近也是在做AI產品相關設計,也是在學習和實踐中,本章就是閱讀相關文獻后的總結與分享,歡迎小伙伴給出建議和意見!

 

本文由 @羅飛 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 好頂贊!

    來自四川 回復
  2. 學習了

    回復
    1. 謝謝

      來自北京 回復
  3. 分析的不錯

    回復
    1. 謝謝!

      來自北京 回復
  4. 感覺有點繞暈了,不過有個地方不確定是不是有問題。就是最后一個例子,說消費者的3個概率的時候,第一個概率和第三個是一樣的說法,都是在瀏覽的情況下購買的概率。有可能是我理解錯了。

    回復
    1. 這三個概率是這樣的(可以根據歷史經驗統計出來):①某商品瀏覽后被購買的概率②某一用戶畫像瀏覽此商品的概率③某一用戶畫像瀏覽后購買的概率。通過這三個概率,找出來在某一商品下某一用戶畫像購買率高的。

      來自北京 回復
    2. 下邊說的有點問題,也可以這么理解,A事件就是瀏覽某商品購買的概率;B事件就是某一用戶畫像下瀏覽某商品的概率,P(A/B)就是某一用戶畫像下瀏覽商品后購買的概率,然后P(B/A)就是瀏覽某商品后某一用戶畫像購買的概率,這樣應該能好理解!

      來自北京 回復
  5. 下雨天不應該100%陰天嗎哈哈

    來自廣東 回復
    1. 哈哈哈,這位朋友,那你一定是沒見過太陽雨! ??

      來自廣東 回復
    2. ?? ?? ??

      來自北京 回復
    3. 哈哈哈哈哈哈,今年過年,還遇到大太陽突然下雪,大概下了幾分鐘就停了。

      來自浙江 回復
    4. 機智了

      來自上海 回復
  6. 深入淺出,分析的不錯 ??

    來自北京 回復