大數據幫你洗腦:你是如何混淆因果關系的

0 評論 25335 瀏覽 5 收藏 14 分鐘

這是一個人人都談大數據的時代,不過數據真的是有益的嗎?其實不一定,數據經常也會忽悠人。

請一句話評價下列事件(假設數據是真實的):

  • 研究發現,越是成功人士,睡眠時間越短。
  • 研究發現,女人結婚后變得更加貧窮,男人結婚后變得更加富有。
  • 研究發現,越富有的人越幸福。
  • 研究發現,兒童時期吃西蘭花越多,成年后往往職業收入越多。
  • 研究發現,去醫院越多,越容易生病。
  • 過去20多年跟蹤研究發現,中國GDP越高,90后一代身高越高。

……

根據本人潛水博客論壇觀察總結,大部分人的評價是這樣的(至少前3個事件的評價是這樣):

1,研究發現,越是成功人士,睡眠時間越短。

這么說,我要是不睡覺,是不是薪水就上億了?

2,研究發現,女人結婚后變得更加貧窮,男人結婚后變得更加富有。

看來還是女人對婚姻犧牲大??!結婚導致女人收入變低,卻增加了男人收入。

3,研究發現,越富有的人越幸福。

屌絲們洗洗睡吧,你幻想的窮開心是不現實的。

4,研究發現,兒童時期吃西蘭花越多,成年后往往職業收入越多。

我勒個去,都怪我小時候西蘭花吃少了,大白菜吃多了!

5,研究發現,去醫院越多,越容易生病。

唉,以后生病還是別去醫院了。

6,過去20多年跟蹤研究發現,中國GDP越高,90后一代身高越高。

哇!原來提高GDP還有這好處!不過,如果將來中國GDP下降,下一代怎么辦?

等等,貌似這上面的邏輯有點問題吧?

實際上,上面的每一個推理都有嚴重的邏輯錯誤,都是錯把相關關系當做了因果關系:

A越多,B越多,這是相關關系。

A越多,導致B越多,這是因果關系。

而如果沒有進一步的調查和理論,相關關系是推理不出因果關系的。

為什么?

請看下面這個“腦筋急轉彎”:

猜猜,下圖的雞和蛋是什么關系?

直覺:母雞剛剛下了蛋。

第二直覺:還有可能是這個母雞是由這個雞蛋孵化出來的。

其實,它們有4種可能的關系:

(注:雞蛋例子引用自李宏彬教授講座)

同樣,兩個“A越多,B越多”這樣的相關性實際上有4種可能(以收入和睡眠的為例):

  • A導致B:更少睡眠導致收入增加。
  • B導致A:收入增加導致睡眠減少。
  • A和B同時被C導致:隨著年齡的增長,人對睡眠要求減少,因此睡眠少。同時年齡大的人,往往經驗、人脈、知識更多,也自然收入更多。
  • A和B沒有任何關系: 美國、西歐等經濟發達,導致人們收入高;同時他們愛吃牛排,導致睡眠需求減少。(數據僅為舉例,不代表真有這樣的關系。)

所以,當你看到“睡眠越少,收入越多”這樣的統計結果后,不要天真地認為只要你減少睡眠,你也能收入變高。

當然生活中的確有人是這么做的:

我認識一個人,看到了這樣一個微博上流行的統計結果后,為了獲得成功而刻意減少睡眠。

甚至,當他凌晨2點還在玩DOTA時,你過去問他:“你怎么還不睡?”他的回答是:“睡眠越少,將來越成功!為了賺大錢,我先從減少睡眠開始。而在這漆黑的夜里,只有DOTA能讓我清醒?!?/p>

所以,假設“成功導致睡眠少”而不是“睡眠少導致成功”,你是無法通過減少睡眠而變得更加成功的。就像白種人喜歡吃牛排,但是你無法通過吃牛排變得更白。

除了“成功VS睡眠”之外,其實上面每個新聞都有類似的邏輯錯誤:

研究發現,女人結婚后變得更加貧窮,男人結婚后變得更加富有。

這個數據其實無法推測出結婚讓女人變窮男人變富,還有可能是:預期自己將來沒什么錢賺的女人更想趕緊把自己嫁出去,而預期將來能賺很多錢的男人傾向于趕緊找個老婆。

當然,還有可能是其他原因甚至是完全無關的因素造成了這個相關關系。

研究發現,越富有的人越幸福。

通過這個數據并不能推測出你賺錢后就能變得更加富有。

實際上研究證明,當金錢超過個人基本需求之后(比如已經吃飽穿暖),對長期幸福感沒有顯著影響。

比如中了巨額彩票的人得到的幸福感只是短期的(類似吸毒產生的幸福感),調查發現,中彩票后6個月,即使你變得比之前富有上百倍,但是你的幸福感指數還是維持在6個月前水平。

(此研究詳細請看哈佛大學公開課《幸福課》,by Tal-Ben Sharhar)

那么為什么我們發現富有的人往往很幸福呢?

其實這是因為富有和長期幸福都由類似的因素導致:自信、熱忱、勤奮等。所以,你的自信、熱忱、勤奮等情商特征有2個產物:

  • 能夠提升你長期幸福感,讓你覺得生活更加有意義
  • 能夠讓你賺錢升職。但這不代表賺錢本身可以提高長期幸福感。

所以,“窮開心”還是存在的。

研究發現,兒童時期吃西蘭花越多,成年后往往職業收入越多。

這個新聞是我YY的,但是這句話絕對的正確的!

為什么呢?因為歐美國家的人往往吃西蘭花更多,而這些國家的普遍職業收入也很高,所以在全球統計數據上自然會發現“西蘭花攝入量”和“職業收入”的相關關系。

但是這并不代表你增加西蘭花的攝入會提高未來收入!

研究發現,去醫院越多,越容易生病。

嗯,這個也是我YY的研究,但數據也是千真萬確!但是這不代表不去醫院你就不生病了,因為不是“去醫院導致你生病”,而不是“生病導致你去醫院”。

過去20多年跟蹤研究發現,中國GDP越高,90后一代身高越高。

這更是絕對真實數據!

中國GDP和90后的身高自然是正相關啊—中國GDP從1990年的不到2萬億漲到2013年的50多萬億,90年出生的人身高也從0厘米增長到170厘米。但是這并不能證明是中國GDP幫助了90后長高。

為什么我們總是錯把“相關”當“因果”?

先看下面這樣圖,如果讓你對圖中的形狀分組,你的第一直覺是什么?

我想大部分人是按照位置分類—把圖中的圖形按照上邊的、左邊的右邊的分為3組。

但是相互靠近的圖形可能并沒有任何關系,這樣分類可能是無效的。

那怎么不按照形狀分類呢?第一反應怎么不是把圖形分成三角形、正方形和圓形?

這是因為我們本能—覺得相互靠近的東西一定是有關系的,同時出現的事件也一定是有關系的!

這樣的本能在遠古時代是很有用的,可以幫助人類在陌生的叢林中生存下來。

當他們發現了一個果殼,從而推測出這片森林有大片果樹;當他們聽到雷聲,從而覺得雷聲導致了下雨,得趕緊避雨了等等。這些本能幫助人們更好的在那個簡單、直接的世界生存。

但是現在社會瞬息萬變,信息復雜程度不知道超過遠古時代多少倍,我們已經無法通過簡單的相關關系來推測因果了。同時出現的事件可能毫無關系,因果的順序也可能完全顛倒。

同時無數的錯覺思維和錯誤歸因不斷發生,比如:

1,大眾對新聞的錯誤歸因

假設你看到這樣的新聞:

《同性戀搶劫超市,致6人死亡》

網友評價:同性戀就是喜歡搶劫!以后遇到他們小心點!

但是,你怎么知道他們的搶劫行為是因為他們的性取向導致的?如果搶劫劫匪穿41碼的鞋,今后你會從此遠離41碼鞋的人嗎?“同性戀”和“搶劫”只不過是同時發生的事件,并不代表它們有關系。

當然,媒體人們為了提高點擊率,經常使用這樣的技巧:讓新聞當事人的某個差異性特征出現在新聞上,從而讓大眾把“相關當因果”,覺得是這個差異性特征導致了他的行為。

類似的新聞評論還有:

外籍男坐過車站搶方向盤敲打司機

這是因為他“外籍”的身份而導致其打司機嗎?中國人自己不打司機?

2,盲目學習和模仿

我們經常盲目模仿成功者的特點,覺得模仿了他的特點,我們也能成功。

比如知名的大學無用論:比爾蓋茨和扎克伯格都是輟學后才成功的,所以為了成功,我沒必要上大學。

請問:他們是輟學導致了成功,還是成功導致了輟學,還是其他因素影響?

健康的人都不去醫院,所以你堅持不去醫院,你就能變得健康?

再比如企業管理的例子:

蘋果公司很成功,同時它給設計師付出的薪水也是最高的。難道就說明它的成功是由其設計師的高薪水導致的?所以你提高自己公司設計師的薪水,你就能成功?

3,刻意規避和迷信

你可能對這個故事感覺到很熟悉:

唉,有一年我第一次吃榴蓮,結果當天就遇到了車禍,從此以后,我就再也不敢吃榴蓮了。

實際上主人公的車禍和榴蓮可能沒有任何關系,但是因為是“同時發生的事件”,主人公潛意識覺得吃榴蓮導致了車禍,從而對榴蓮一輩子心有芥蒂。

錯把相關當做因果是很多讓人難以理解的迷信的根源之一。

比如在我家鄉都有敬車的習慣(每年固定時間向燒紙向上天祈福平安),但是去年突然變更了敬車的習俗—由過去的車頭向北變成了車頭向南。后來我才知道是因為去年出了很多車禍,大家覺得是敬車時車頭向北導致的(相關變因果),從而今年改成了向南。

所以,如果你仔細觀察,很多讓你難以理解的祖傳禁忌,實際上可能是當年某個相關事件的發生導致的—比如出了車禍就再也不吃榴蓮了。

結語:

我們正在面臨越來越多的數據和越來越多的復雜事件,同時也被要求做出越來越準確的決策。為了應對這樣的問題,請不要忘記—別拿相關當因果,數據也會忽悠你!

 

轉載自微信公眾號“李叫獸”(ID:Professor-Li),作者李靖。本文已獲轉載授權,如需轉載本文,請聯系原公眾號“李叫獸”

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!