數據也會說謊:隱藏在統計數據中的那些小把戲
數據本身不會說謊,但說謊者需要數據。統計數據在決策時擁有十分重要的意義,然而許多統計機構卻經常以一些謊言掩蓋數據的真實性,因此,學會識破統計數據中的一些常見小把戲非常有必要。
“世界上有三種謊言:謊言、彌天大謊和統計數據!”——美國統計專家達萊爾·哈夫在其傳世之作《統計數據會說謊》中如是說。
對于統計數據,我們似乎對其有著某種天然的信任感,認為其代表著客觀公正,數據不會說謊乃至成為了我們的潛意識,在許多時候成為了我們評判事物好壞與否的標準。
但現實的悖論在于,許多聰明的人或機構就是抓住了我們對于數據的這種天然的信任感做起了文章,通過各種統計手段得出各種或好或壞的各種數據,進而影響普通消費者的判斷。
的確,在日常生活中,我們時常也能看到,在那些競爭激烈的行業,不同的統計機構往往會在同一時間給出相互打架的數據結論,造就同一行業中同時出現多個第一的鬧劇,這在過往的外賣、移動支付、共享單車、智能手機等市場中都已是屢見不鮮。但常識告訴我們,同一行業中同時出現兩個第一,是概率極小乃至是不可能事件。
為何這種統計鬧劇屢見不鮮?
其中原因多種多樣,往小了說有統計口徑差異,基數偏差、數據粉飾、夸大等等,而往大了說那么就有可能是故意為之的數據造假,以求達到不可告人的目的。誠如政治家格羅夫納(C.H.Grosvenor)所言:
“數據本身不會說謊,但說謊者需要數據?!?/p>
所以對于我們而言,在以統計數據作為決策依據時,需要擦亮自己的眼睛,預防辨別出統計數據中時常出現的一些小把戲,選擇具備真正有意義的統計數據來做參考。
一、采用不同統計口徑的統計數據
不同統計口徑造就的數據差異,往往在市場份額、銷量這類統計中時常出現,表現得頗為明顯。
諸如在過往的國產廠商在國內智能手機市場銷量誰是第一的競爭中,甲乙兩家廠商都宣稱自己是當年的市場銷量第一,并且拉出了不同的市場調研機構給出的結論來站臺背書。
的確,從不同統計機構給出的數據來說,這兩家都做到了各自的第一。但問題的有趣之處在于甲乙兩家廠商拉出來給自站臺背書的統計機構所采用的統計口徑卻不盡相同,有的采用的是Sell-in(生產商賣給零售商的商品數量)的統計口徑,有的采用的則是Sell-out(零售商賣給顧客的商品數量)的統計口徑。
而從實際意義或者價值來說,或許把東西銷售到用戶手中的統計會更具價值。而這種由于統計口徑造成的結果差異或者是數據打架現象,不僅在智能手機市場的銷量統計中存在,在其他許多行業也同樣存在。
二、忽略規模基數的統計數據
在日常生活中我們更為容易遇到、也更容易誤導我們的一種統計小把戲是忽略規模基數差異的統計數據。
諸如在許多行業中,用戶會把平臺的顧客投訴量作為一個重要考察指標,也或正因如此,一些機構也做起了聚合用戶各類投訴而后發布不同行業用戶投訴排行榜的事情。
但有時候觀察這些機構發布的這類投訴數據排行榜,我們卻能發現他們發布的這類投訴排行榜其實對于用戶的決策而言,并不能帶來有任何實際意義的參考價值,反而有可能會把用戶帶進坑里。
原因在于這種投訴量排行榜忽略了一個統計中最為基本的要素——用戶基數差異。
顯而易見的一個道理是:不同行業不同品牌、平臺,其用戶規模各不相同,有的平臺用戶規??赡軙艽螅械钠脚_用戶規模則很小。但在眾口難調的現實下,顯然用戶規模更大的平臺,往往就會在這類數量的統計中更為吃虧。
但從實際的整體概率來說,我們卻能發現用戶規模高的平臺,其服務水準、用戶滿意度、平臺安全性可能反而會更高。
所以從這個層面來說,如果要真的去考量一個品牌、平臺的服務水平、產品質量,其實更為合理負責的統計方式不是去統計他的用戶投訴量,而應該是計算用戶的投訴率。
諸如在去年21CN聚投訴發布的2017年十大行業“金蝦獎”這份榜單中,我們就能明顯發現采用用戶投訴量的統計方式所帶來的用戶誤導。
在這份榜單中,淘寶、天貓、微信支付、支付寶、蘋果、海信、玖富等不同行業的領導品牌均登上了這份黑榜。但這份忽略平臺用戶規?;鶖挡町惖陌駟?,其實并不具備任何說服力。
以淘寶、天貓的數據為例,我們看到在聚投訴平臺這份“金蝦獎”榜單中,用戶投訴量是5707件。
這個數據初看之下給人傳遞的感覺是投訴量的確還是蠻多的,但若是考慮到淘寶天貓累計超6億的用戶規模,那么以此投訴量計算投訴率,可以得出實際上淘寶天貓的用戶投訴率僅為0.00000951%。而不僅是淘寶天貓如此,在當時這份榜單上的許多品牌都是如此。
即使不考慮用戶規模差異,僅看當時的這份榜單,我們也能發現其很多方面說不通,諸如在這份榜單中公布的互聯網消費金融行業金蝦獎上榜企業中:投訴量排名第一、解決量排名倒數第一的平臺沒能上榜領獎,反而是那些雖然用戶投訴量在行業靠前但問題解決量也是行業靠前(前五十名)的幾家平臺,如玖富、快貸、向錢貸、用錢寶等被頒發了這個“金蝦獎”,實在是有些令人啼笑皆非。
同樣,這份榜單中的智能手機排名,也存在同樣的問題。諸如上榜的蘋果手機,在聚投訴自己公布的數據中,我們看到2017年,蘋果手機的投訴量在手機行業排名第二,解決率到數第三。那么問題來了,在手機行業中投訴量排名第一,解決率倒數第一的是誰?為什么不把這個獎頒給他們?
而事實上,這類忽略用戶規模而只談數據的統計案例還有很多。諸如在科技互聯網行業中大家最為關注的某些增長率上,往往就會如此。
還是以平臺用戶最為熟悉的智能手機產業為例,我們時??吹?,蘋果三星的銷量增長僅為百分之幾,與動輒銷量增長達到20%乃至30%的國產相比,自然是自慚形穢,許多廠商也會以自己的增速超過蘋果、三星而大加宣傳。
雖然他們的銷量增速放緩是客觀存在,但在描述這在客觀存在時,我們更需要注意的是要以他們現有的銷量基數大小為參考,而若忽略體量談增速,其實是非常不客觀的,畢竟從現實來說,體量越小其實就越能取得高增速。
當你銷量為幾百萬臺時,取得一個30%的銷量增速可能會很容易,而若是當達到了諸如三星的每個季度7000—8000萬臺左右的銷量時,要30%的銷量增速就會極為困難了。
三、圖表擴大化造就視覺誤差
在統計口徑、用戶規模存在差異的統計帶給用戶困擾之外,其實還有另外一種統計手法容易給用戶帶來困擾與誤導——圖表擴大化造就的視覺誤差。
其原理在于:相對于文字而言,人類對于視覺信息有著更快的接受速度也更容易產生深度記憶。而許多“聰明”的公司,就做起了圖表的視覺誤差的文章,這在視覺誤差在對比圖中尤為常見。
諸如在今年華為GUP Turbo這項”嚇人技術“發布的時候,其在與競品們比較游戲時長時,我們就能看到在華為給出的這張對比圖中,雖然榮耀Play在游戲時長上比iPhone X只多了半個小時,但是在上面這張對比圖中,我們一眼看去留下的印象是:榮耀Play的游戲時長超越iPhone X一倍不止。
如果僅給iPhone X標注4.0小時而不給榮耀Play標注4.5小時,把這在圖放出去讓用戶猜測榮耀Play的游戲時長,信息我們心中想到的數據絕不會是4.5小時,而會是擁有至少十個小時的游戲時長。
寫在最后:
毋庸置疑,統計數據對于我們的各類決策,有著重要的參考意義,但他的前提條件是我們尋找參照的統計數據要有意義,不能存在一些統計污染在其中。
但在現實中,許多統計機構卻在真實與謊言的灰色地帶上走鋼絲,使得諸多統計數據開始變得不僅不具備參考意義,反而會把用戶帶進溝里。
在此,需要的是我們擦亮眼睛,學會識破統計數據中的一些常見小把戲。當然,更需要注意的是,上述幾種只是最為常見與簡單的統計小把戲,在更低的統計中,還有更多高深的把戲,這需要我們以更為專業的知識去識破他們。
注:本文所有圖片源自網絡。
#專欄作家#
鄰章,微信公眾號:TMT317,人人都是產品經理專欄作家??萍蓟ヂ摼W觀察評論者,致力于提供有態度、有深度的科技互聯網觀察解讀。關注電商、移動互聯網、人工智能、智能手機等產業。
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
- 目前還沒評論,等你發揮!