通向優(yōu)秀數(shù)據(jù)分析師的6個(gè)階梯
編輯導(dǎo)演:很多同學(xué)都在問:“數(shù)據(jù)分析從0到1的文章看多了,咋樣才能從1到10,從普通到優(yōu)秀呀!”這篇文章作者系統(tǒng)地講述了6個(gè)階梯,助你成為優(yōu)秀數(shù)據(jù)分析師!
很多同學(xué)都在問:”數(shù)據(jù)分析從0到1的文章看多了,咋樣才能從1到10,從普通到優(yōu)秀呀!”今天系統(tǒng)地解答一下?!皟?yōu)秀”是一個(gè)形容詞,只有清晰了參照物,才能知道到底什么是“普通”,什么是“優(yōu)秀”。今天就從“普通”講起,想通往“優(yōu)秀”,需要邁過6個(gè)階梯。
一、搞數(shù)據(jù)
數(shù)據(jù)分析最怕啥?沒思路?沒模型?沒圖表?
都不是!
數(shù)據(jù)分析最怕:沒數(shù)據(jù)!無論是做啥分析,搞數(shù)據(jù),始終是第一位的工作。盡可能多地搞數(shù)據(jù),是第一位要求。不然一切免談。
只不過,同數(shù)倉(cāng)開發(fā)不同,數(shù)據(jù)分析關(guān)注的數(shù)據(jù),是面向業(yè)務(wù)主題的。數(shù)據(jù)服務(wù)的產(chǎn)品、運(yùn)營(yíng)、銷售、營(yíng)銷、售后部門,到底有什么數(shù)據(jù),需要什么數(shù)據(jù),是數(shù)據(jù)分析師必須梳理清楚的。
具體來說,包括:指標(biāo)/維度兩部分。如何衡量是否清晰?可以問自己,以下九個(gè)問題是否清楚。
- 我服務(wù)的部門是……
- 該部門屬于利潤(rùn)中心/成本中心
- 該部門的KPI指標(biāo)是……
- 該部門的主要流程是……
- 該部門流程中,已采集數(shù)據(jù)是……
- 該部門現(xiàn)有過程指標(biāo)是……
- 該部門組織架構(gòu)是……
- 該部門服務(wù)對(duì)象分類是……
- 該部門常用分類維度是……
其中:
- 1、2、3是用來明確主要KPI指標(biāo)的,這是數(shù)據(jù)分析的源頭和關(guān)鍵
- 4、5、6是用來搭建過程指標(biāo)體系的,解釋KPI指標(biāo)如何達(dá)成
- 7、8、9是用來篩選關(guān)鍵分類維度的,當(dāng)KPI指標(biāo)波動(dòng),從這些維度做拆解
很多同學(xué)習(xí)慣于在現(xiàn)有寬表上跑數(shù),向上不清楚業(yè)務(wù)流程、業(yè)務(wù)目標(biāo),向下不清楚數(shù)據(jù)來源、數(shù)據(jù)采集,每天忙著按需求單跑數(shù),連跑的數(shù)是啥意思都不懂。這樣就限制死了自己的發(fā)展空間,無法進(jìn)一步提升能力了。
二、定基線
做到第一階,至少能看懂自己跑的數(shù)據(jù)了,知道每個(gè)數(shù)據(jù)是用在哪個(gè)部門,哪項(xiàng)工作。下一步最關(guān)鍵的是……?
有的同學(xué)可能不假思索地說:建模!還沒到這一步哈。下一步關(guān)鍵的是:定基線。知道自己看的數(shù)據(jù),常規(guī)形態(tài)是啥樣的。知道什么算正常,什么算不正常。
這一步非常重要!因?yàn)閿?shù)據(jù)本身沒有含義,數(shù)據(jù)+標(biāo)準(zhǔn)才有含義。而并非所有指標(biāo),業(yè)務(wù)方都會(huì)給出標(biāo)準(zhǔn)的。很可能,只有銷售數(shù)據(jù)才有具體到每天的考核標(biāo)準(zhǔn),其他數(shù)據(jù)得憑經(jīng)驗(yàn)、憑常識(shí)、憑分析定出基線(如下圖)。
很多同學(xué)無法解讀數(shù)據(jù),做的分析不被業(yè)務(wù)認(rèn)可,都是因?yàn)闆]有跨過這一臺(tái)階。最常見的,看到指標(biāo)跌了,盲目做了一堆交叉,然后業(yè)務(wù)方輕飄飄地:“這是正常波動(dòng)”。
然而第二天又有同樣幅度波動(dòng),業(yè)務(wù)方卻急著煙熏火燎:“這么大波動(dòng)你都看不到嗎!”……被這么折騰幾次,就會(huì)信心全無,懷疑人生。所以想進(jìn)步,就不能被業(yè)務(wù)方牽著鼻子走,得自己有定基線能力。
三、拆因素
跨過第二階后,數(shù)據(jù)分析師已經(jīng)對(duì)業(yè)務(wù)常見走勢(shì),有充足的了解。并且,自己有能力做判斷,就能識(shí)別出異常狀態(tài)。并非所有的異常都不可控,有相當(dāng)多的異常是可觀測(cè)因素導(dǎo)致的,比如宏觀環(huán)境,比如營(yíng)銷動(dòng)作、推廣計(jì)劃。此時(shí),要先有能力先把這些明顯可識(shí)別的“白犀?!闭靼祝賮碚勂渌昂谔禊Z”問題。
看到這里,肯定有同學(xué)會(huì)說:“老師,這個(gè)簡(jiǎn)單,我的PEST,SWOT,4P已經(jīng)按捺不住了,來吧!”然鵝,沒卵用。你看那么多PEST的文章,有一篇教過你怎么量化P、E、S、T四個(gè)指標(biāo)不???
所以這一臺(tái)階,叫“拆因素”,即把這些影響業(yè)務(wù)的因素,拆解到可以量化的,能用一個(gè)或幾個(gè)數(shù)據(jù)指標(biāo)表現(xiàn),并能與內(nèi)部數(shù)據(jù)結(jié)合分析的程度。拆因素可能有若干數(shù)據(jù)形態(tài),比如:
- 1、0、1形態(tài):有XX因素、沒有XX因素
- 2、分類形態(tài):同一事件,ABC三種狀態(tài)
- 3、連續(xù)形態(tài):能用一個(gè)連續(xù)型指標(biāo),代表該因素
具體怎么拆,是需要大量分析工作做基礎(chǔ)的,最后能沉淀下來的,就是最有價(jià)值的經(jīng)驗(yàn)。
四、測(cè)細(xì)節(jié)
跨過第三階段后,數(shù)據(jù)分析師能對(duì)明顯的,重大的影響因素做出判斷。想要進(jìn)一步提升,就得深入到細(xì)節(jié)中,了解活動(dòng)到底怎么做的,產(chǎn)品到底怎么設(shè)計(jì)的,用戶到底需求什么。這些已經(jīng)觸及業(yè)務(wù)的核心,因此很難短時(shí)間內(nèi)搞清楚,需要長(zhǎng)期積累。
想做這一步,有2個(gè)關(guān)鍵工作要做。
1. 打標(biāo)簽
越是觸及業(yè)務(wù)核心,連續(xù)型指標(biāo)能描述的情況就越少,越需要打標(biāo)簽。類似用戶情緒、喜好、產(chǎn)品功能點(diǎn)、營(yíng)銷邏輯,都是靠標(biāo)簽來描述和量化的。準(zhǔn)確地打標(biāo)簽,將業(yè)務(wù)量化,做出清晰的分類,是高級(jí)數(shù)據(jù)分析師的技能。不是說把數(shù)據(jù)庫(kù)里的,現(xiàn)有的維度表拖出來就完事。
2. 做實(shí)驗(yàn)
可能有同學(xué)會(huì)說:ABtest我現(xiàn)在也經(jīng)常干,為啥感覺不到進(jìn)步呢。注意,現(xiàn)在的ABtest,很多是產(chǎn)品驅(qū)動(dòng)的,不是數(shù)據(jù)驅(qū)動(dòng)的。鬼知道產(chǎn)品經(jīng)理從哪里搞了2個(gè)版本,扔過來就測(cè),然后讓數(shù)據(jù)分析師解釋差異。這是非常本末倒置的,只會(huì)讓人陷在瑣碎的數(shù)據(jù)里。
一個(gè)正式的實(shí)驗(yàn),是:
- 有清晰的改進(jìn)目標(biāo)
- 有清晰的改進(jìn)邏輯
- 有關(guān)鍵改善過程指標(biāo)
- 有環(huán)境控制變量
- 有組間差異預(yù)判
謀定而后動(dòng)。這樣才能在解讀實(shí)驗(yàn)數(shù)據(jù)的時(shí)候剔除各種雜糅因素,得到正確結(jié)論。當(dāng)然,想做到這一步,需要業(yè)務(wù)的配合和參與。如果業(yè)務(wù)真的很喜歡自說自話,就靠數(shù)據(jù)分析師個(gè)人能力,至少推動(dòng)剔除一些明顯容易雜糅的因素。
五、理邏輯
邁過第四個(gè)臺(tái)階,數(shù)據(jù)分析師本人已經(jīng)可以實(shí)現(xiàn):描述問題-發(fā)現(xiàn)問題-解釋問題-檢驗(yàn)效果的閉環(huán)了。單純站在數(shù)據(jù)角度,已經(jīng)是個(gè)完整的能力閉環(huán)。
但僅有數(shù)據(jù)能力閉環(huán)是不夠的,因?yàn)樵谄髽I(yè)里,相當(dāng)多的問題不是來自技術(shù),而是來自業(yè)務(wù)。更有甚者,是來自業(yè)務(wù)方的屁股決定腦袋,來自業(yè)務(wù)方急功近利、大干快上,來自業(yè)務(wù)方事前拍腦袋,事后拍大腿。
因此想要讓數(shù)據(jù)更好地展現(xiàn)價(jià)值,就得有能力應(yīng)對(duì)現(xiàn)實(shí)問題。在千頭萬緒中,梳理清楚問題邏輯,找到正確的答案,或者至少給自己找到脫身的辦法(如下圖)。
這時(shí)候“理邏輯”,重點(diǎn)是把口語表達(dá)的,不可量化的業(yè)務(wù)邏輯,轉(zhuǎn)化成數(shù)據(jù)可驗(yàn)證的邏輯,并且選擇合適的數(shù)據(jù)方法得出結(jié)論。除了數(shù)據(jù)能力,還需要數(shù)據(jù)分析師有業(yè)務(wù)洞察,有一些職場(chǎng)溝通技巧,才能完成任務(wù)。
六、組模型
有了以上五個(gè)階段的積累以后,你已經(jīng)能完全在一個(gè)行業(yè)里混得如魚得水了,不但能做好基礎(chǔ)數(shù)據(jù)服務(wù),也能協(xié)助業(yè)務(wù)做出業(yè)績(jī),更能以客觀中立的態(tài)度贏得老板的信任。
此時(shí),可以更進(jìn)一步,提煉一些屬于自己的模型出來:
如果用少數(shù)關(guān)鍵指標(biāo)就能概括這個(gè)行業(yè)的問題,可以捏個(gè)業(yè)務(wù)模型
如果某個(gè)業(yè)務(wù)場(chǎng)景,用特征+算法能得到很準(zhǔn)確的預(yù)測(cè)結(jié)果,就固定成該行業(yè)算法模型。
搞完了,記得也取四個(gè)英文字母做名字以體現(xiàn)檔次。
做這一步,不僅是為了沉淀經(jīng)驗(yàn),提升逼格,更是為了遷移知識(shí),擴(kuò)展使用范圍服務(wù)的。很難保證人一輩子都不換行,掌握了優(yōu)秀分析能力的人,干一行就是一行專家。而遷移知識(shí),靠的是模型的總結(jié)與經(jīng)驗(yàn)積累,兩者缺一不可。
七、小結(jié)
縱觀整個(gè)成長(zhǎng)階梯,核心就是:數(shù)據(jù)分析師要能剝絲抽繭的解決復(fù)雜企業(yè)問題,這樣培養(yǎng)能力,才是我們自己安身立命的法寶。
很多在校的,剛畢業(yè)的同學(xué)們,還習(xí)慣于沉浸在書本中,總覺得越難的知識(shí)越牛逼,一本統(tǒng)計(jì)學(xué)有19章,那第19章肯定比18章牛逼……這樣單純堆疊知識(shí)點(diǎn),可以無窮無盡卷下去,但是對(duì)于提升實(shí)際能力幫助甚小,非常不推薦哈。真有興趣搞這些,推薦去純科研。
特別是,數(shù)據(jù)分析本身就是一個(gè)面向不確定性,用數(shù)據(jù)方法解決企業(yè)經(jīng)營(yíng)不確定性的工種。把數(shù)據(jù)采集上來,服務(wù)好管理層,推動(dòng)業(yè)務(wù)實(shí)現(xiàn)業(yè)績(jī),至少就有一個(gè)公司數(shù)據(jù)部門總監(jiān)位置在召喚,合理而不為呢。與大家共勉!
#專欄作家#
接地氣的陳老師,微信公眾號(hào):接地氣學(xué)堂,人人都是產(chǎn)品經(jīng)理專欄作家。資深咨詢顧問,在互聯(lián)網(wǎng),金融,快消,零售,耐用,美容等15個(gè)行業(yè)有豐富數(shù)據(jù)相關(guān)經(jīng)驗(yàn)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!