數據分析必備思維之:邏輯思維
本文來說一下數據分析必備的第二種思維——邏輯推理思維。邏輯推理一般有演繹法、歸納法、類比法,文章簡單介紹一下數據分析工作中比較常用的演繹法和歸納法。
我翻閱了一些數據分析師的招聘要求,幾乎所有的招聘要求中,都會有這么一條,叫做“邏輯思維能力強”。但是又很少有人能說清楚到底什么叫做“邏輯思維能力強”。
中國的教育在邏輯這一塊上是非常欠缺的,即使是很多接受過高等教育的人,思路依然是非常沒有條理的。日常工作中的數據分析,運用最多的邏輯方法就是邏輯推理,從一堆數據中推理出和業務有關的信息。
今天就來說一下數據分析必備的第二種思維——邏輯推理思維。
邏輯推理一般有演繹法、歸納法、類比法,我簡單介紹一下數據分析工作中比較常用的演繹法和歸納法。
演繹法
首先要明確,數據分析最終產出的最小單位應該不是一個數據,而是數據背后的信息。換句話說,數據分析的產出需要一個論述。
所以,“黑名單用戶占比0.5%”不是一個完整的數據產出。
“黑名單用戶占比0.5%,影響比較小?!边@才是一個完整的數據產出。其中包括論據“用戶占比”,也包括論點“影響比較小”。
這種句式就是一個論述,一個簡單的論述就需要用到基本的邏輯推理方法。
上述這種最常見的數據結論就需要用到邏輯推理中的演繹法。
演繹法,常見的類型有三段論、假言推理、選言推理等。本文主要介紹一下最常見的三段論。
有關三段論最常見的案例是“蘇格拉底三段論”,幾乎所有講邏輯思維的書里都會提到這個案例。
著名的「蘇格拉底三段論」:
(大前提)所有的人都是要死的
(小前提)蘇格拉底是人
(結論)所以蘇格拉底是要死的
這實際上就是邏輯推理中的演繹法。
演繹法就是由「因」推導出「果」,由一般推導出特殊的思維方式。
蘇格拉底三段論中,一般的情況是“所有人都要死”,特殊的情況是“蘇格拉底是人”,所以從一般演繹到特殊,“蘇格拉底是要死的。”
不過我們平時不這么說話,因為很多大前提是約定俗成的,沒必要特別交代。
比如前面的例子“黑名單用戶比例0.5%,影響比較小?!?/p>
大前提:占比1%以下的影響不大。
小前提:黑名單用戶占比0.5%
結論:黑名單用戶的影響不大。
是因為這個大前提人人都知道,我們平時說話是默認別人也知道這個前提的,所以我們往往不會說,但是腦子里會想。
如何質疑演繹法
演繹法的特點是,只要大前提和推理過程都正確,那么結果必然正確。
所以質疑演繹法的方法也很簡單,質疑大前提、小前提或者質疑論證過程。
比如有這樣一個數據分析的結論:當前需要提升新用戶數,所以要進行廣告投放。
大前提是:獲取新用戶必須進行廣告投放。
小前提是:當前需要提升新用戶數。
結論:當前必須進行廣告投放。
如何質疑這個論斷?
大前提錯誤:獲取新用戶必須依靠廣告投放嗎?
小前提錯誤:真的需要提升新用戶數嗎?
如何質疑論證過程?
三段論有五項基本原則:
四項錯誤
中項兩不周延
大項擴大,小項擴大
前提都為否,結論不必然
前提有一否,結論必為否
這里主要講一下四項錯誤和中項兩不周延。
四項錯誤:
一個三段論中,只能有三個不同的概念。有四個,就一定錯了。
比如:人已經存在幾百萬年了;而你沒有存在幾百萬年;所以你不是人。
這個三段論中,看上去有三個概念“人,幾百萬年,你”,但因為前后兩個“人”違反了“同一律”,是不同的,所以其實一共出現了四個概念“人類,幾百萬年,你,人體”。
在實際工作中,可能就會有這樣的論述:
新用戶人均付費金額超過50元就可以在渠道A進行投放獲得新用戶,
付費新用戶的人均付費金額超過50元,
所以可以在渠道A進行投放獲得新用戶。
這個論述中,渠道A的新用戶指的是進入APP的新用戶,而付費新用戶指的是首次付費的新用戶,所以這個論述中有兩個新用戶的概念。一共出現了“APP新用戶人均付費金額、渠道A投放獲得APP新用戶、付費新用戶的人均付費金額、渠道A投放獲得付費新用戶”四個概念,犯了四項錯誤的問題。
中項兩不周延
什么叫中項?
“所有人都是要死的,蘇格拉底是人”,這里的“人”就是中項,用來聯系大前提和小前提。
那什么叫周延?“所有中國人”指全部,是周延的概念;“一部分中國人”,是不周延的概念。
認真聽這個三段論:
一部分中國人很有錢,北京人是一部分中國人,所以北京人很有錢。
“一部分中國人”是聯系大前提、小前提的中項,但是不周延,所以犯了“中項兩不周延”的邏輯錯誤。北京人是一部分中國人,但不一定是有錢的那一部分中國人。
所以“新用戶喜歡使用A功能,甲是新用戶,所以甲喜歡A功能”這句話也是錯的。
因大前提“新用戶喜歡使用A功能”實際上是“大部分新用戶會使用A功能”,這是可以通過數據得出的結論,比如60%的新用戶都會用這個功能。等同于“一部分中國人很有錢”
小前提“甲是新用戶”,實際上是“甲是一部分新用戶”。等同于“北京人是一部分中國人”
所以這句話就是犯了中項兩不周延的錯誤。
本文僅做為一個邏輯推理的入門引導,其他的錯誤類型有興趣可以自己去百度一下。
歸納法
還有一種基本的邏輯推理方法是歸納法。什么是歸納法?
上面三段論中,大前提往往就是歸納法得出來的結論。
因為我們見過的所有人都是會死的,所以我們歸納出一個結論:所有人都是會死的。
所以,歸納法由「果」推導出「因」,由特殊推導出一般的思維方式。
我們平時最常用的邏輯推理方法就是歸納法,因為這種邏輯能力是寫入我們基因中的一種本能。
比如幾百萬年前,原始人看到老虎、狼等猛獸傷人,那么他下次再遇到長著利爪和尖牙的動物的時候,就知道趕緊躲起來。這就是歸納法在起作用,“利齒尖牙的動物代表著危險”。如果人類沒有這種能力,根本活不到現在。
我們很小就有了這樣的能力,比方說小孩曾經摸過冒熱氣的杯子很燙,下次再看到冒熱氣的湯碗,他就知道這個東西也很燙。我們天然就具有這種能力,并不需要經過特別的教育。
但是歸納法有一個問題,就是哪怕你所有的論據都是正確的,結論也可能是錯誤的。
英國哲學家羅素提出過一個問題,被稱為“羅素的火雞”,用來諷刺那些歸納主義通過有限的觀察,得出自以為正確的結論。
在一個火雞飼養場里,一只火雞發現,不管是艷陽高照還是狂風暴雨,不管是天熱還是天冷,不管是星期三和星期四,每一天上午的9點鐘,主人都會準時出現,并給它喂食。于是,它得出了一個驚天大定律:“主人總是在上午9點鐘給我喂食?!?/p>
時間來到圣誕節的前一天,上午9點,主人又一次準時出現,但是這一次,主人帶來的并不是食物,而是把它變成了食物….
歸納法最常見的就是這類“以偏概全”的錯誤。但我們日常生活中經常犯這樣的錯誤。
比如:
交了幾個男朋友都是人渣,所以男人沒有一個好東西。
這只基金過去每年盈利超過10%,所以今年也會超過10%。
這個區塊鏈貨幣,我大姨賺錢了,我二舅賺錢了,所以我也會賺錢。
這些結論我們感覺理所當然,幾乎都不用經過思考,但是稍加思考就會發現這些結論是有問題的。
現在很多的機器學習模型的做法是通過大數據分析找出一些人群的共同點,不帶任何大前提,我覺得這種建立在歸納法基礎上的模型很難說會有怎樣的效果。
我們在做數據分析的時候,因為思維的怠惰,很容易進入歸納法這種思考方式,我們必須警惕這種不經過思考的歸納推理。
人性偏向歸納法,但是分析更需要演繹法。
用更權威的大前提
為什么數據分析要多用演繹法?
之前提到過,演繹法的推理,只要大前提小前提和論證過程正確,那么結論必為真。
但是歸納法只能得出尚未被證偽的結論。一旦發現一個反例,那么這個結論就會被證明是錯誤的,或者限制結論的使用條件。
所以,演繹法更容易把握結論的正確性。
不過還是既然演繹法的大前提往往還是來自于歸納法,怎么樣保證結果的正確性的?
我們可以盡量采用那些前人已經總結過的結論,這些結論經歷了時間的考驗,相比自己臨時歸納的結論更加可靠。
比如:
大前提:你通過自己的使用經歷發現,如果APP界面的交互風格差別比較大,自己用起來體驗不好。
小前提:現在,自家APP的不同功能之間交互風格有差異。
結論:所以自家APP體驗不好。
這個結論是建立在你自己的感受上的,是你過去經歷的歸納。雖然其他人也可能有類似的感覺,但是總感覺聽起來沒那么有說服力。
如果你把大前提改成權威人物的研究,結果就不一樣了。
大前提:根據尼爾森十大交互原則的一致性原則,功能應該保持一種類似的結構,規則的排列順序能減輕用戶的思考負擔。
小前提:自家APP的不同功能之間的交互風格有差異。
結論:自家APP加重了用戶的思考負擔。
這樣看起來是不是就更加有說服力了?
這是因為你的邏輯基礎更加扎實,大前提是一個前人經過大量研究得出的結論,相比自己總結的感受,要更加準確。
搞清對方到底用的是什么邏輯
有些時候,兩種邏輯推理方法不太容易分辨。因為有些話聽起來是一樣,但是背后推理的邏輯是不同的。
比如“A和B都說附近新開的那個飯店不好吃,那肯定不好吃。”
有些人是基于歸納法的思路:
論據:A說那個店不好吃,B說那個店不好吃
結論:所以那個飯店不好吃。
有些人是基于演繹法的思路:
大前提:A和B對美食的要求比較低
小前提:A和B說那個新開的店不好吃
結論:新開的飯店肯定不好吃
這個大前提在他的腦海中,并沒有說出來。
基于歸納法的人說這句話的時候,重音往往會在“都”字上。
基于演繹法的人說這句話的時候,重音往往會在“A和B”上。
你可以體會一下,重新讀一遍這句話,注意重音的不同:A和B都說附近新開的那個飯店不好吃,那肯定不好吃。
你看,同樣一句話,不同的人的內心思路很可能是不同。所以,在和別人溝通的時候,你必須知道對方的邏輯到底是什么。
如果是當面溝通,還能通過語音語調大概猜出對方的邏輯。如果是在網絡上通過文字溝通,那么就要多想想對方到底是什么意思。
組合運用
我們平時的數據分析結論,往往就是演繹法和歸納法層層疊加起來的一座邏輯大廈。
比如:
大前提:A公司的拉新策略是社群裂變
小前提:我們的拉新策略要模仿A公司的拉新策略
結論:我們的拉新策略要模仿社群裂變
那么大前提是怎么來的?小前提怎么來的?
拆解一下,可以得出這樣一幅邏輯結構圖。
以上是一個簡單的案例,通過這樣梳理一下思路,我們就能知道自己結論的邏輯基礎和推理結構到底是什么。
然后遇到歸納法就反思是否有犯以偏概全的問題,或者能不能用更公認的事實做大前提改成演繹法。
排查演繹法時,看看有沒有大前提、小前提、論述過程等錯誤,根據文章前面提到的錯誤類型一一排查。
這樣思考一遍,我們很容易就可以找到自己或他人推理的薄弱環節。
如果你擁有以上這樣的邏輯思考方式,是不是會發現自己可以輕松應對數據分析師崗位要求里“邏輯推理能力強”這一項要求了。
最后說一個三段論。
大前提:對作者最大的尊重是點贊分享
小前提:我尊重作者
結論:我要點贊分享~
小插曲
我在參加人人都是產品經理2019年度作者評選,希望喜歡我的文章的朋友都能來支持我一下~
點擊下方鏈接進入我的個人參選頁面,點擊紅心即可為我投票。
每人最多可投10票哦,登陸了之后就有5票,投完之后可以點擊主頁的“為作者打call”就有機會增加5張選票~
投票即有機會獲得百萬驚喜禮品&起點學院千元豪禮哦!
投票傳送門:http://996.pm/7bebr
#專欄作家#
三元方差,公眾號:三元方差(sanyuanfangcha),人人都是產品經理專欄作家。專注用數據驅動業務增長,擅長數據分析、用戶增長。喜歡閱讀、思考和創作。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
受用,感謝
非常受用,感謝
離散數學學的好,玩過彩票股票的這個都沒問題
質疑下大前提,占比不到1%的核心用戶影響非常大 ??
哈,舉個例子,意思懂就行