從常識出發,解讀數據分析的五大亂象
如果你想做數據分析,你最好是一個敏感的人:要對數據變化敏感、更要對數據變化背后的原因敏感。
數據營銷時代,越來越多人開始接受用數據指導廣告投放。但很多人并不知道,數據可以指導投放的前提是數據分析師/廣告優化師能夠正確的解讀數據。
同樣的數據,通過不同方式的解讀,給投放帶來的指導作用天差地別。
是幫助廣告主更好的實現KPI?還是把營銷帶入另一個無底深淵?本文將從數據分析的角度出發,聊聊各種數據分析亂象,旨在提醒諸位如何避免拿數據耍流氓的行為。
一、數據分析五大亂象
亂象一:數據本身造假
最常見也是最初級的耍流氓行為就是數據造假。
比如,為了讓廣告主對投放工作表示滿意,或者說服廣告主繼續投放廣告,投放方會在結案報告里對數據做一些處理,從曝光量到點擊量到點擊率都做一遍美化,讓廣告主覺得這錢花得挺值,甚至愿意繼續投。
此前國內某地產大腕就因為發現某一個視頻平臺曝光數據作假,一氣之下把與他合作的線上平臺統統查了個遍,鬧得各個平臺的經手人心惶惶,畢竟一年下來也能投好多萬的廣告,如果因為數據作假進了信用黑名單,以后再想合作就基本不可能了。
也正是因為數據作假越來越常態,更多的廣告主開始監測廣告投放。
那么沒有對廣告流量做監測的廣告主該如何識別數據作假呢?
這里分兩種情況:
一種,廣告主本身并不懂數據分析,那么可以通過了解、分析一下行業的行情,看看和同行的數據相比,你的數據表現會不會太好、或者“超出想象”。
如果你拿到的數據非常好,最好能夠讓投放方給出對應的定向、創意等足以支撐數據表現那么好的理由,然后,再決定是否要繼續投放。
另一種,是廣告主本身懂數據分析,那么通過了解投放背景、根據指標之間的耦合關系等就可以識別出數據是否有問題。
所謂耦合關系,在數據分析領域指的是各個數據指標間的關系并不是孤立的,比如如果落地頁的停留時間非常短,那么你的落地轉化率通常也不會好到哪里去,因為用戶根本沒看全你的落地頁在說什么,點開落地頁即有轉化動作的用戶基本不會出現在信息流廣告里。
除了關注耦合關系,還可以參考其他的一些分析方法。比如通常來說,某些數據指標的取值分布是有規律可循的,像有些廣告類目的訪客高峰期可能是在上午的十點左右和下午的三點左右,晚上的訪問高峰期在睡前九、十點鐘,如果半夜三點流量莫名其妙的多起來,你就要注意了,分析看看這個異?,F象是因何而起。
亂象二:指標定義不一
指標是說明總體數量特征的概念。很多公司都有自己的投放KPI指標體系,簡單來說就是通過幾個關鍵指標來衡量公司廣告投放情況的好壞,比如點擊率、曝光量、轉化率、下載量、ROI 等,都是信息流廣告的考核指標之一。
通常情況下,指標需要在一定的前提條件下進行匯總計算才能得出,諸如時間、地點、范圍等都可以作為指標統計的前提條件,也就是我們常說的統計口徑與范圍。
舉例來說,我們要統計某公司2017年的銷售額,那么“銷售額”就是指標,“某公司”、“2017年”都是統計的前提條件,對于這個指標的獲取,需要我們把某公司2017年里每個月的銷售流水加到一起才能得出,而最后統計得出的數額就是指標值。
在實際工作中,因為沒搞清楚指標的定義而對指標值出現誤判的情況經常出現。
比如我們經常在線下沙龍里聽到同行在一起閑聊:“我們的平均獲客成本只要120元?!?/p>
一起參加沙龍的朋友一聽,心想你們好牛逼啊,“我們一個獲客要400元啊!差距好大??!你指點指點啊!”
指點了一番之后,獲客成本400元的老兄才幡然醒悟,其實大家都是400元,只不過剛剛那位120元的老兄說的是銷售線索的成本,而不是實際成交的訂單成本。
120元和400元這兩個指標值的差別,其實就是因為指標的前提條件,也就是口徑和范圍不統一造成的誤會,如果不了解清楚就進行比較,那比較本身就沒有意義。
再比如電商都有DAU(日活躍用戶) MAU(月活躍用戶)的指標,可是對于這兩個指標每家電商的定義可能不一樣,有的只要客戶登錄就算是活躍,而有的定義可能是買了才算活躍,要求更嚴的是買了以后確認收貨才算是活躍用戶。所以當我們談論指標的時候,一定搞清楚大家對指標的定義是否一致,否則這樣的比較和討論就沒有意義了。
亂象三:隱藏關鍵信息
這種情況通常出現在別人想要說服你接受某個指標的時候。
比如公司管理層要給廣告投放定一個KPI指標,號稱Bench marking (標桿管理)的方法開始被用起來。
Bench marking(標桿管理),又稱“基準管理”,其本質是不斷尋找最佳實踐,以此為基準不斷地“測量分析與持續改進”。
比如,優化師經常會聽領導說,某家同行的ROI能做到1:10,你看我們公司也不比他們差,我們產品質量還比他們的好, 所以我們不能低于1:10——這種想法對嗎?
我們說,這是典型的只知其一不知其二其三的盲目跟風現象。
為什么? 因為我們壓根兒不知道同行的1:10是怎么投出來的,怎么跟進?怎么超越呢?
當我們要進行標桿管理的時候,起碼得知道別人家的1:10是基于什么原因做到的,是做了大規模的促銷?還是在用媒體組合拳搶占市場?像上述般不知道營銷大背景,單看一個渠道的投放結果就盲目追隨標桿是不足取的,這也會給優化師的工作帶來巨大的困難。
項目內部自己定指標的時候也容易出現這種問題。比如某個生鮮電商APP公司在給客戶發放大額優惠券時,投放信息流廣告之后獲得的下載率、注冊率和訂單轉化率自然會比沒發券時要好,但如果公司拿發券時的投放指標考核優化師日常投放工作的話,就是拿數據耍流氓了。
為什么呢?因為發券行為大多是短期營銷刺激,在刺激退去之后,用戶的響應概率自然會大幅度下降。如果某些投放指標的獲得并非自然增長,而數據報告里卻又對這些影響指標的關鍵因素只字未提,在隱藏了關鍵背景的背景下提出的指標要求,就屬于典型的耍流氓行為。
這里面提到的自然增長,是指沒有營銷因素刺激的情況下,生意本來的運營情況。
所謂影響指標的關鍵因素,是指對某一個指標結果影響比重較大的因素,比如產品,品牌,價格、促銷等都在某些背景條件下都屬于關鍵指標。
我們認為,合理的定指標的基準是自然增長,也就是說把促銷的因素排除在外之后再來評估指標才是合理而可行的。
再比如剛剛過去的雙11,某一家天貓店說自己家的業績是多么牛逼,一天賣出去六七百萬的銷售額,可他沒告訴你的是,后續的退貨率可能高達25%。
這里的退貨率就是關鍵指標,因為賣多少出去固然重要, 更重要的是買家要確認接受你交付的貨物才能算是真實成交——這種忽略了關鍵背景、只告訴你銷售額的行為,同樣也是一種耍流氓。
以我自己多年運營天貓的經驗看, 某些類目,比如配飾,退貨率20%以上都屬于正常的。但你如果不知道,你就無法準確解讀別人的牛逼,或許還會盲從,說“那么牛逼,我也去開個天貓店吧!”或者“那么牛逼,你能不能幫我來做運營啊!”之類的。
所以,當你看到一個指標特別好,或是特別差的投放的時候,要搞清楚相關的關鍵背景信息,否則就有可能產生誤判,造成更多的損失。
亂象四:亂搞因果關系
我們先來看個調查:
某大數據顯示,醫院是排在心臟病、腦血栓之后的人類第三大死亡原因。
我就問你,看了這個調查,你還敢去醫院嗎?
實際上我們都知道,死于醫院的原因是這些人本來就有病,碰巧在醫院死亡,并非醫院導致其死亡,醫院和死亡建立的是一種相關關系,不存在因果關系。
所以,“醫院是排在心臟病、腦血栓之后的人類第三大死亡原因”的這個結論很可笑,他混淆了因果和相關關系。
同樣混淆的經典搞笑案例還有:
- 睡眠時間越短的人,收入越高(所以我們以后都不要睡覺了)
- 游泳溺亡的人越多,雪糕賣得越好(實際上是因為天熱)
……
為什么會產生這兩種關系的誤讀呢?
因為我們在做歸因的時候,只看到了數據上變化關系,忽視了事物之間的本質聯系。特別是做數據分析時,往往只看到數字,沒看到過程,導致我們認為,某一問題的產生就是其中一個問題導致的,即因果關系。
一旦混淆了因果關系與相關關系,會直接影響我們的判斷,做出錯誤的廣告投放決策。比如信息流廣告投放里常見的價格導致成交的因果關系問題。
我們曾對多個投放婚紗攝影廣告的優化師做過訪談,詢問他們為什么都會用“這樣一套婚紗多少錢”的創意來做投放,他們的回答驚人的一致:“因為客戶就關心價格啊,他們都會問價格,價格合適了就會成交啊!”
也就是說:在優化師和一線銷售看來,價格是影響成交的唯一誘因,所以他們選擇用價格這個方向做投放創意。
那么事實呢?
我們從常識出發,稍微有點消費經歷的朋友都會知道,問價格是成交前的必經步驟,也確實是會因為價格合適才會有下一步的消費決策,但,你是因為價格才進店的嗎?你進店只關心價格嗎?你最后下單只是因為價格合適嗎?
同樣的,對婚紗攝影有興趣的目標客戶一進店、一接咨詢電話就只問了價格嗎?其他什么問題都沒問嗎?
并不是吧。他們還會關心拍攝風格、拍攝場景、服裝、妝容等等,只是,用戶關心的這些不一定以提問的形式表達出來,不提問不代表不關心。
所以,單純認為最終的購買決策是由問價直接導致的是有問題的,歸根結底,價格只是客戶滿意的一個部分,還有更多的的原因導致最后的成交,我們需要了解影響目標客戶做決策的各個相關因素,針對性的去做創意。
亂象五:以局部論整體
我們說因變量的影響因素其實有很多,但分析師往往只看到其中一兩個,就草率的認為因變量的變化就是某個或者某幾個變量的變化造成的,通常來說,由這個做法得出的結論都是片面的。
比如在信息流廣告投放中,經常會有朋友吐槽XX渠道效果好差,不如XX平臺,剛上線就有咨詢。撇除平臺本身的一些差別,我們從廣告投放規律來看這個問題,你會發現,效果好壞的評估需要考慮多個因素。
之前我在給一個電商項目做投放的時候,老板說明星店鋪的廣告ROI 比鉆展還有其他直通車廣告都要來得更硬朗,所以“把其他廣告都撤了吧,把錢都砸到明星店鋪上去!”
那么我們應該聽話的把所有廣告費都花到明星店鋪上嗎?
我們用一個例子來說明:假設我想買個手機:
- 午休的時候我在公司電腦上打開京東網站看了一圈各個品牌手機的介紹;
- 回家的路上我在公交車站臺等車看到了VIVO的全面屏手機廣告,才知道是明星鹿晗代言的;
- 坐車的時候我用頭條刷資訊,刷到了一條VIVO手機的測評,于是點擊進去看看。
- 看完測評沒多久,我在頭條刷到了VIVO的廣告,時間關系,沒有點進去看。
- 雙11前,我上淘寶搜了一下VIVO全面屏,從明星店鋪的廣告入口進入到落地頁之后,發現全面屏手機在大促,于是點擊進去,下單,付款等收貨。
這5步是一個典型的購買歷程。從產生興趣到信息搜尋到備選品牌評估,最后到購買決策,我同時受了好幾個廣告的影響,但并沒有為這些廣告買單,直到通過點擊明星店鋪廣告,我才有了消費。那么,是不是其他廣告都沒有必要存在?步步高公司可以把除了明星店鋪之外的廣告全部撤銷呢?
當然不是。我最終的購買,是之前多個廣告對我共同影響的結果。
這也是我們常說的多渠道歸因(Attribution Modeling),即,消費者的購買決策并不單單受到最后一個媒介廣告的影響,媒介和媒介之間是有交互關系的。
做過電商投放的朋友大都有這樣的經驗,就是去掉了那些看似ROI不高的渠道以后,以為能省下不少廣告費,卻發現原來ROI好的那幾個渠道也莫名其妙的不好了,這其實就是各個渠道在觸發用戶轉化時扮演的角色不同:
- 有些廣告是用來打品牌認知基礎的,
- 有些廣告是強化品牌認知作為助攻的,
- 有些廣告是促進銷售引導轉化的,
……
孤立的評價哪個渠道效果好或者不好,都是不符合消費者購買的行為規律的。
那么同樣的,當你在評價信息流某個或某些個平臺效果不好、但其他渠道效果好的的時候,可以試著從多渠道歸因的角度綜合考量,看看效果不好的那個平臺有沒有可能是觸發最后購買決策的某一根稻草,如果經過分析,確定這個效果不好的平臺不能為你的績效帶來任何幫助,再考慮是不是要取消投放,不要單單憑轉化不好這點就草率的做決定。
二、數據分析三大建議
建議一:切勿預設立場
數據解讀最起碼的要求是不能預設立場。
舉個非常常見的例子,我們辦公室的小姑娘剛來應聘的時候,看到我用的手機是白色,開的車也是白色的,就問我,“是不是男生喜歡白色?我看到很多男生都是用白色的手機,開白色的車。”
這個姑娘的結論就是典型的可獲得性偏見。也就是:當你預設了某個立場之后,你就會忍不住關注那些與自己想法相關的事、物、人,比如這個姑娘,當有了一個預設的想法之后,不自覺的會關注用白色手機、開白色車的人,看看是不是男的,如果是男的,符合自己的設想,甚至還會非常自嗨的說“果然如此”。
而事實上,當你這么想的時候,你的數據分析已經出現了方向性的偏差。
更麻煩的是,絕大部分情況下,我們可能自己都沒意識到,自己只看了那些自己想看的事、物、人。
同樣的,在做數據分析時,如果預設了某個立場,就有可能只統計自己想統計的,然后用來證明自己已有的觀點。
但數據分析的精髓并不在于用數據證明自己的既有觀點,而是從數據里發現洞察,為KPI增長找到方向和突破點。
作為使用數據的營銷人、廣告優化師、數據分析師,應該具有嚴謹負責的態度,保持中立的立場,客觀的評價數據分析工作中存在的問題。
建議二:善用上帝視角
我們說,數據分析是生意的一部分,當我們用營銷視角來看待數據分析的作用時,我們就能提綱挈領的理解數據是怎么回事了。
比如很多銷售導向型的信息流廣告轉化不好,那數據分析師要做的,不是直接鉆到點擊率曝光量這些投放數據里埋頭苦干,而是先要識別當下這個廣告行為有效的前提是什么?
也就是我們常說的,埋頭趕路的同時,別忘了抬頭看天。
我們拿常見的二類電商投放廣告做銷售這個營銷行為舉例,比如一個皮鞋代工廠老板奔著銷售目的投了幾萬塊錢的信息流廣告,期間優化過多次,但也沒有什么用,最終的銷售數據非常慘淡,這是為什么呢?
單從投放本身看,他似乎已經把所有可能的情況都測試了一遍,然而并沒有什么用。
但如果站在營銷的視角去分析,這個問題就很好回答。
我們說大部分銷售導向性的廣告只做了一步,就是把貨鋪到消費者面前,在生產力落后的時代,比如計劃經濟憑票供應那會兒,鋪到消費者面前或許就足以觸發購買了。
但是現在很多產業,比如我們舉例的皮鞋行業,產能整體過剩,商家競爭的戰場已經從貨架轉移到了消費者心智,那么這個時候,我們僅僅做到把貨鋪到消費者面前這一步是遠遠不夠的。因為你的競品在你出現之前就已經把貨鋪到了消費者腦袋里,也就是說,早在你到達之前,你的競品們已經在消費者的心智里完成了預售——消費者已經買了他們,為什么還要買你呢?
所以,當我們理解了鋪貨理論以后,就能很好的解釋,為什么皮鞋廣告的轉化數據不好,因為轉化的關鍵并不在當下這個營銷行為里,老板需要做的,是去調研分析,看看皮鞋這個品類還有那些分化的機會,通過開創并主導一個新品類來搶占市場機會。
建議三:做個敏感的人
正如本文開頭所說的,數據可以指導投放的前提是數據分析師/廣告優化師能夠正確的解讀數據。
數據既定的情況下, 限制數據發揮作用的主要因素,就是分析者對數據的解讀能力。比如前文所說的混淆了因果關系和相關關系的情況,以局部視角詮釋整體格局的誤區,等等。
所以我常說,如果你想做數據分析,你最好是一個敏感的人:要對數據變化敏感、更要對數據變化背后的原因敏感。
比如我們經??吹礁鞔蠡ヂ摼WAPP在推廣初期瘋狂補貼的行為,有的靠補貼獲得了大量的用戶,企業發展隨著用戶量的增長越走越順,比如滴滴打車。而有的在補貼之后沒多久卻銷聲匿跡了,那這背后的原因是什么呢?
如果你單單從推廣初期的轉化漏斗圖上去分析,你除了會更加茫然,并不會有太多的收獲——因為從漏斗圖上看,后續發展得好的APP和后續發展得差的APP在獲取用戶的初期,情況是很類似的:
但如果你追著深挖用戶初次使用APP之后的行為反應,就會發現更有價值的洞察。
比如,后續發展得好的APP,他的很多用戶都會自發轉介紹,為APP帶來更多的用戶加入,而后續發展得差的APP,他的轉介紹情況、跟風使用情況都非常差:
如果你先于其他同行發現了這個問題,你就可以先于他們分析這個數據,看看差是怎么導致的,好又是怎么回事,繼而合理的運用這些洞察來指導接下來的營銷推廣活動,以促成更高效的市場滲透。
所以說,更多時候,數據分析師更像是福爾摩斯,保持敏感的好奇心,凡事多問幾個為什么:
- 為什么是這樣的結果?
- 為什么不是那樣的結果?
- 導致這個結果的原因是什么?
- 為什么結果不是預期的那樣?
……
如此,就能比別人更快、更準確的找到突破點,繼而順藤摸瓜,找到數據背后的商業真相。
最后,借用喬布斯的名言,“stay hungry, stay foolish”,希望更多如我一般的數據分析師,在探尋真相,發現商業洞察的路上越走越順。
作者:杜江(微信公眾號:信息流廣告精準投放),上海極效營銷高級產品經理,11年互聯網營銷經驗、前樓口電商商務智能總監、道瀚亞太區產品經理、愛爾百蘭產品經理,電商魚骨圖、鋪貨理論等理論創始人。
本文由 @杜江 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Unsplash ,基于 CC0 協議
- 目前還沒評論,等你發揮!