模型思維和策略思維:為什么你做的模型總是沒用?
你有沒有遇到這樣的情況:自己做的模型總是沒用,也估計不出什么結果來?本文以給小學生學習能力打分為例,分析如何使用模型思維和策略思維,希望對你有所幫助。
想象你是一個小學校長,要給全體小學生的學習能力打分,或者說給所有人打上好學生、差學生的標簽。你會怎么打?
拿出六年級的學生,因為他們考試考得多可靠度高,所有考試或者近期考試里面好成績占比特別高的,定義為好學生,特別低的定義為差學生。然后用所有你能撈到的信息如家庭背景、興趣愛好等,去訓練一個分類模型,最后對所有一到六年級的學生進行預測。
你確定一定以及肯定不會這么做,這是舍本逐末,很荒唐。如果你把這個任務留給各班班主任,你會發現他們一定是采用了另一種做法。
六年級的人考過很多試,當然很好定義,根據歷史成績尤其是近期成績直接打就行。一年級的人只考了幾次試,那也要根據語文數學美術音樂體育品德等學科成績去判斷啊,這就是說服力最強的。低年級的置信度肯定沒有那么高,但也比用喜歡吃什么東西、打不打球、回家看不看電視這些場外因素預測強。所有學生的打標就依靠學科成績和體現出來的一些特性判斷就是最有效的。
第一種做法,是模型思維。在這個場景里,你根本不會去倚重模型思維,你甚至覺得模型的思路很可笑。但是,換個場景,你沒有在做這種可笑的事情嗎?
第二種做法,是策略思維。你根據最重要的信息,把這個打分策略做出來了。
當你用模型思維去解決問題的時候,你有沒有發現,你可以解決任何問題。你可以用你撈到的那些東西,去預測一個人是不是有錢、是不是gay、是不是有出軌潛力、是不是有暴力傾向、是不是很卷、是不是想跳槽、是不是黃賭毒、是不是喜歡說栓Q、會不會扶老奶奶過馬路、擠牙膏是從中間擠還是兩頭擠、刷碗是順時針還是逆時針……
我們是來解決問題的,解決問題沒那么容易,一板斧走到黑怎么能行呢?你還得會二板斧三板斧……
當你用策略思維的時候,你會想各種辦法去解決問題。例如,用一個問題替代原來的問題是一個解決難題的好策略。也就是說,如果你無法解決某個問題,就去解決另外一個簡單點的問題好了,去找這個簡單的問題吧。
還是用風控舉例,信用風險當然可以直接預測,也可以拆解問題,低收入的人風險高,高負債的人風險高等等,于是解決這兩個子問題可以對終極問題有所裨益。
上面給小學生學習能力打分的問題,你覺得模型思維很可笑。但實際上,收入、負債也是一樣,去預測是很奇怪的,當然不是說一定不可以。
至于說為什么風險可以預測,收入和負債不能呢?我認為在一個以風險為評價目標的預測中,因為預測和真值永遠是有誤差的,收入負債預測存在一次誤差,而收入負債和風險的關系并不是絕對的,也就是說傳導到風險識別上這個誤差是要疊乘的。預測結果必然可用性不高。
收入和負債模塊更合適的做法是,去定義不要去預測。用你所有能獲取到的相關數據,按可靠程度高低,想盡辦法對齊,直接寫case when。
一句話總結,上面說到的模型思維和策略思維的區別就在于如何定義這個y。模型思維是隨便定義了一小部分樣本的y,然后找X來預測;策略思維是想盡辦法好不容易定義了這個盡可能覆蓋全的y,然后沒有然后。
前者容易還是后者容易,朋友們?不要自欺欺人,前者容易得多,多一個模型預測的環節根本不構成辦法的難度。問問自己,是不是只會做前者,不會做后者?
做模型,我們都喜歡端到端的解決方案,因為端到端的解決方案是最簡單的。但有時候它不起作用。
你根本就不知道你做出來的是什么東西。你說要測試,反正可以測嘛?你覺得總是有用的,但事實是隨便做的都是無用的。好的策略應該是簡單且合乎邏輯的,模型思維做出來的模型做不到這一點,你只能相信數據,只能去測試。然后測試回來沒有用。
另一個問題是,端到端的解決辦法總是要基于歷史數據,如果你的歷史做得很好還行,如果本來就不行,學習歷史來發展未來有什么意義呢?
況且,歷史數據往往是有條件的,去掉這個條件,你的模型很可能會出大問題。舉個財富管理的例子,歷史用戶都是有100w+持倉的平臺高粘性用戶,現在想找更多高凈值高潛客戶,于是你完成了建模,去掉了歷史持倉100w+的條件,找出來一批高評分的所謂“高潛”用戶。這個評分在歷史數據上表現好就一定是有效的嗎?
如果你看見一個人在地鐵里閱讀《參考消息》,下面哪種情形與讀報者更吻合?他有博士學位,他沒有大學文憑。你可能會選有博士學位那個,但這樣做不一定是明智的。你應該充分考慮第二種選項,因為地鐵里沒有大學文憑的人更多。
如果一個人被打標成詩歌愛好者,猜測她學的是中國古代文學還是工商管理,你也應該選擇第二個答案。因為雖然學習中國古代文學的女學生更容易是詩歌愛好者,但幾乎可以肯定有更多的工商管理專業且愛好詩歌的女學生。
“張三是位30歲的男性,碩士學歷,已婚,但無子女。他在大廠工作,能力強、干勁足,很受同事歡迎。”這樣的人在歷史數據里表現出來轉化率高,但拋開100w+的持倉,這樣的人高凈值的比例能低到嚇人。
遇到問題不管三七二十一就做個模型的人,我認為是用戰術上的勤奮來掩蓋戰略上的懶惰,這樣做模型不僅沒效果而且沒價值。我有一個判斷工作價值的辦法,如果經驗不重要,那工作就是沒有價值的。
最后提醒一下。不要以為在土里插個溫度計,就可以測量整個地球的溫度了。
專欄作家
雷帥,微信公眾號:雷帥快與慢,人人都是產品經理專欄作家。風控算法工程師,懂點風控、懂點業務、懂點人生。始終相信經驗讓工作更簡單,繼而發現風控讓人生更自由。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
還是沒太懂思維模型和策略模型的區別,可以再解釋一下嗎?
一句話概括為:模型思維是預測,策略思維是定義
很可,作者本人來表示贊成