100種分析思維模型之:統(tǒng)計(jì)思維
本文將帶你了解統(tǒng)計(jì)思維的重要性和應(yīng)用,通過深入淺出的案例分析,幫助你在數(shù)據(jù)分析的海洋中找到指路明燈,希望對你有所幫助。
你好,我是林驥。在信息爆炸的時代,不同的信息獲取方式,可能讓我們會產(chǎn)生不同的判斷和決策。
究竟什么是真?什么是假?什么是有益的?什么是有害的?
下面介紹 100 種分析思維模型的第 71 種:統(tǒng)計(jì)思維,它能幫助我們揭示數(shù)據(jù)背后隱藏的規(guī)律和趨勢,進(jìn)而做出更加科學(xué)的判斷和決策。
一、為什么學(xué)習(xí)統(tǒng)計(jì)思維?
我們大多數(shù)人都是感性動物,常常會因?yàn)榍楦卸淖冏约旱南敕?,而難以時刻保持理智的判斷。
比如,在選購一款商品的時候,假設(shè)有高檔、中檔、低檔 3 種不同的型號,對應(yīng)高、中、低 3 種不同的價格,大多數(shù)人都會選擇中檔,因?yàn)槿藗兺ǔ小富乇軜O端」的心理。
通過學(xué)習(xí)統(tǒng)計(jì)思維,將數(shù)據(jù)與實(shí)際相結(jié)合,就可以在面對不確定性時,更加客觀地分析信息的真?zhèn)危@得更有價值的信息,進(jìn)而做出更加合理的判斷和理性的決策。
假設(shè)你擁有統(tǒng)計(jì)思維,想要知道某款產(chǎn)品的市場表現(xiàn),就可以分析相關(guān)數(shù)據(jù),了解產(chǎn)品的銷售情況、受眾特征和銷售趨勢等,進(jìn)而調(diào)整相應(yīng)的銷售策略,以便提升銷售的業(yè)績。
但是,假如你缺乏統(tǒng)計(jì)思維,就有可能僅憑直覺或主觀判斷做出決策,導(dǎo)致陷入盲目和錯失發(fā)展機(jī)會的境地。
總之,統(tǒng)計(jì)思維可以幫助我們更加客觀、理性地看待問題,從而做出更加明智的決策。
二、什么是統(tǒng)計(jì)思維?
統(tǒng)計(jì)思維是一種基于數(shù)據(jù)和概率的思考方式,通過統(tǒng)計(jì)數(shù)據(jù)并對其進(jìn)行分析,進(jìn)而更好地理解現(xiàn)狀、分析原因和預(yù)測未來。
下面簡單介紹一些統(tǒng)計(jì)學(xué)的核心概念,它們是統(tǒng)計(jì)思維的基礎(chǔ)。
① 總體與樣本
總體是統(tǒng)計(jì)研究的整個集合。例如,我們要研究中國人的平均身高,那么所有中國人就是總體。
樣本是從總體中抽出的一個代表子集。例如,從中國人中隨機(jī)抽取 1000 個代表來測量身高,這 1000 個人就是樣本。
② 概率與頻率
概率是某一事物發(fā)生的可能性。例如,拋硬幣出現(xiàn)正面的概率是 50%。
頻率是指在 N 次試驗(yàn)中,某一事件出現(xiàn)的次數(shù) m 與 N 的比值。例如,拋了 100 次硬幣,出現(xiàn) 51 次正面,那么出現(xiàn)正面的頻率是 51%。
③ 參數(shù)與統(tǒng)計(jì)量
參數(shù)是描述總體特征的數(shù)值。例如,總體均數(shù)、總體標(biāo)準(zhǔn)差、總體相關(guān)系數(shù)等。
統(tǒng)計(jì)量是通過樣本數(shù)據(jù)計(jì)算出來的數(shù)值。例如,樣本均數(shù)、樣本標(biāo)準(zhǔn)差、樣本相關(guān)系數(shù)等。
統(tǒng)計(jì)學(xué)的概念還有很多,在此不做一一介紹,感興趣的朋友,可以參考統(tǒng)計(jì)學(xué)的相關(guān)書籍。
統(tǒng)計(jì)思維側(cè)重于「道」的層面,而具體的統(tǒng)計(jì)方法側(cè)重于「術(shù)」的層面。無道之術(shù),就像脫韁的野馬,一路狂奔卻沒有方向。只有用道去駕馭術(shù),才能取得更好的效果。
三、怎么運(yùn)用統(tǒng)計(jì)思維?
統(tǒng)計(jì)思維是為了解決實(shí)際問題而產(chǎn)生的,無論是在工作中,還是在日常生活中,統(tǒng)計(jì)思維都能為我們提供有力的支持。
在運(yùn)用統(tǒng)計(jì)思維解決問題的時候,我們可以先隨機(jī)抽取一些樣本,并盡可能讓樣本能夠代表總體,然后找到與數(shù)據(jù)匹配的思維模型。
這個過程就像福爾摩斯探案,事先并沒有確切的結(jié)論,只能努力先去尋找線索和證據(jù),最后才能讓案件真相大白。
比如,為了用更低的成本,及時了解中國人口的變化情況,統(tǒng)計(jì)局可以選取中國人口的 1? 進(jìn)行抽樣調(diào)查,通過抽樣數(shù)據(jù)來預(yù)估中國人口的變化。
統(tǒng)計(jì)思維不僅可以解決一些數(shù)字相關(guān)的問題,而且能夠解決一些看起來與「數(shù)」無關(guān)的問題。
比如,有人使用詞頻統(tǒng)計(jì)、回歸分析、多重檢驗(yàn)等統(tǒng)計(jì)學(xué)的方法,對《紅樓夢》前 80 回和后 40 回進(jìn)行對比分析,發(fā)現(xiàn)前后存在巨大的語言差異。
其中常用形容詞、副詞、虛詞出現(xiàn)的頻率,以及段落長度、分句、標(biāo)點(diǎn)符號等,都發(fā)生了顯著的變化。而一個人前后用語、用詞以及標(biāo)點(diǎn)符號的習(xí)慣,通常不會發(fā)生太大的變化。因此可以推斷,《紅樓夢》前 80 回和后 40 回的作者大概率不是同一個人。
與統(tǒng)計(jì)思維有關(guān)的正態(tài)分布、冪律分布、泊松分布、相關(guān)分析、假設(shè)檢驗(yàn)等,都可以用來解決一些實(shí)際的問題。
很多人每天都在努力工作、學(xué)習(xí)和運(yùn)動,但是為什么卻看不到效果?
有一種 Sigmoid 函數(shù),能夠直觀反映努力與成果之間的關(guān)系。
Sigmoid 函數(shù)的定義如下:
該函數(shù)對應(yīng)的圖形就像一個大寫的 S 形,剛開始的時候處于停滯期,努力幾乎不會產(chǎn)生什么成果,但是持續(xù)努力一段時間,到達(dá)某種程度之后,就能獲得快速成長,甚至產(chǎn)生質(zhì)的飛躍。
當(dāng)努力變得艱難的時候,不妨想一想 S 型增長曲線,也許就會產(chǎn)生繼續(xù)努力的動力。
在瞬息萬變的世界中,如果我們運(yùn)用統(tǒng)計(jì)思維,提升預(yù)測未來的能力,就更容易把握先機(jī),提前做好的準(zhǔn)備,并采取相應(yīng)的行動。
但是,假如你的預(yù)測模型不對,或者初始條件不一樣,就有可能導(dǎo)致「差之毫厘,謬以千里」。
比如,有一個簡單的數(shù)學(xué)模型:y = 100 ^ x,也就是 100 的 x 次方。當(dāng) x = 1 時,y 等于 100,而當(dāng) x = 2 時,y 等于 10000。雖然初始條件 x 僅相差 1,但是結(jié)果 y 卻相差了 100 倍,差距非常懸殊。
20 世紀(jì) 60 年代,氣象學(xué)家愛德華·洛倫茲提出了「蝴蝶效應(yīng)」,就是在一個復(fù)雜系統(tǒng)中,哪怕一個微小的變化,都有可能引起巨大的連鎖反應(yīng)。
所以,我們在運(yùn)用統(tǒng)計(jì)思維的時候,一定要注意提高警惕。
在《拼湊真相》這本書中,作者蒂姆·哈福德介紹了認(rèn)清紛繁世界的 10 大數(shù)據(jù)法則,這些數(shù)據(jù)法則能夠幫助我們提升洞察事物本質(zhì)的能力。
隨著 AI(人工智能)技術(shù)的發(fā)展,我們可以快速處理和分析海量的數(shù)據(jù)。然而,統(tǒng)計(jì)思維的主角依然是人,因?yàn)樽罱K還是需要靠人來對數(shù)據(jù)進(jìn)行解讀和運(yùn)用。
四、最后的話
在用統(tǒng)計(jì)思維解決實(shí)際問題的時候,我們可能還會面臨 3 大難題。
① 總體是誰?
在現(xiàn)實(shí)生活中,總體往往是難以確定和度量的。
比如,怎么統(tǒng)計(jì)人類的智力水平?這是一個動態(tài)變化且難以度量的問題。
但總體往往又非常重要,因?yàn)樗拖袷谴蠛:叫械臒羲该髁私鉀Q問題的目標(biāo)和方向。
② 數(shù)據(jù)從哪里來?
在大數(shù)據(jù)時代,雖然我們并不缺少數(shù)據(jù),但是要想獲得真正有價值的數(shù)據(jù)也不容易。
比如,怎么統(tǒng)計(jì)每個人的時間分配?這涉及到時間的記錄、分類等操作,面臨著準(zhǔn)確性和及時性的挑戰(zhàn)。
只有拿到正確的數(shù)據(jù),才有可能得出正確的結(jié)果。
③ 結(jié)論到那里去?
這里的結(jié)論,并不是一個簡單的統(tǒng)計(jì)結(jié)果,而是要把統(tǒng)計(jì)結(jié)果與現(xiàn)實(shí)問題緊密地聯(lián)系起來,獲得真正有價值的洞察。
然而,在現(xiàn)實(shí)世界中,統(tǒng)計(jì)結(jié)果很有可能與現(xiàn)實(shí)情況并不一致。
面對以上難題,我們該怎么辦呢?
首先,我們要有用數(shù)據(jù)化解難題的意識,不要輕易做出判斷。
其次,我們可以運(yùn)用統(tǒng)計(jì)思維,獲得化解難題的思路,不妨先大膽提出假設(shè),然后再小心進(jìn)行求證,嚴(yán)格按照統(tǒng)計(jì)學(xué)的流程規(guī)范,確保獲得正確的結(jié)論。
最后,我們要理論聯(lián)系實(shí)際,結(jié)合具體領(lǐng)域的知識背景,提升自己對業(yè)務(wù)的理解和認(rèn)知水平,進(jìn)而更好地解決實(shí)際的問題。
人生是由一系列選擇組成的,我們每天都要做出各種各樣的選擇,從早上幾點(diǎn)鐘起床,到早餐吃什么,再到一天的時間怎么安排,以及晚上幾點(diǎn)鐘睡覺等等。
基于統(tǒng)計(jì)思維做出的選擇,通常都會比隨意選擇得到的結(jié)果要好得多。
學(xué)會運(yùn)用統(tǒng)計(jì)思維,就像擁有一種透視鏡,讓我們能夠透過表面的現(xiàn)象,看到事物背后的規(guī)律和趨勢,進(jìn)而做出更加睿智的決策。
公眾號:林驥,《數(shù)據(jù)化分析》作者
本文由 @林驥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!