為數據分析發愁?5道測試題解決你的問題
對于數據分析項目,很多人可能不知道如何下手,動手做之后又總是效率不高、效果不好。本文作者針對這個問題設置了5道測試題,來闡述如何做數據分析項目。
臨近年底,很多同學問:“如何做出優秀的數據分析項目?不然年終總結都不知道咋寫”。
今天系統回答一下,想做好數據分析類項目,主要靠的是:樹立正確的觀念。
這里有5道測試題,一起來測一測自己有多大可能做出好項目。
五道測試題
題目一(單選題)
做數據分析,項目好壞的衡量指標是什么?
- A. 時間、成本、質量
- B. 算法難度、統計學知識、數學公式
這個題目是最重要的觀念,直接決定了一個數據分析師在當前公司混的好壞。
數據分析工作有它的特殊性:
- 它不同于銷售,不能直接為公司創收;
- 它不同于運營,不能直接拉升活躍\留存\付費指標;
- 它不同于交易/網站/ERP系統的開發,這些系統是業務必須的支撐;
- 它不同于DBA,沒有DBA的公司不存在,沒有專職分析師的公司大把
數據分析工作,本質上是一個可替代程度很高的輔助崗位。在數據分析觀念普及前,很多公司都是找個會寫sql的程序員來頂找個崗位的。就像瞄準鏡與槍的關系,沒有瞄準鏡槍照打,有了瞄準鏡,槍可以打得更準。
因此,雖然數據分析背后有算法、統計學、數據做支撐,可企業關心的不是這些書本章節,而是到底對業務有什么用?有多大用?
同企業里其他項目一樣,數據分析項目最重要的就是考察時間、成本、質量。
如果脫離了這些,空洞地追求“我用的方法好復雜,我好厲害”。那還是在學校里做科研好了,科研才需要追求高精尖。
企業里追求的是:在達成目標的情況下,成本越低越好,時間越短越好。
所以這個題一定選A。
很多剛畢業的、轉行的、新加入的數據分析師喜歡選B,選B也不代表沒前途。因為選B的同學會花很大精力死磕書本,這樣雖然在一個公司混不起來,但是在跳槽的時候過面試的能力還是可以的,所以也能通過一年一跳槽來漲薪。但是想在一個公司做出成績,還是選A的好。
這個題目最關鍵,明白了這個題目,后邊的問題就迎刃而解了。
題目二(排序題)
以下人員,對數據分析項目質量的話語權排序。
- A. 業務部門領導
- B. 數據部門領導
- C. 業務部門員工
- D. 數據部門員工(本人)
如果問題一吃透了,這個題毫無難度,答案是A≥B≥C≥≥D。
領導意見大于員工意見,如果業務部門領導首肯,數據部門領導就直接應聲附和了。如果業務部門領導不發聲,那就看數據部門領導是不是認可。
本人的:我覺得我做的很牛逼,毫無意義,切記切記。
請注意,有時會有業務領導和數據領導態度不一致的情況,這時候以自己直接領導的態度為準,外部門稍后考慮。在大部分企業,直接領導是決定自己績效評分的那個,所以一定不能得罪。
題目三(排序題)
請對以下幾種項目成果,按質量高低排序。
- A. 可視化的數據產品
- B. 每月定期輸出的數據模型
- C. 部門級以上會議的匯報ppt
- D. 無群體匯報的ppt
- E. Excel數據表
- F. 無固定格式的數字
- G. 寫sql跑完數口頭告訴業務
這個題完全解釋需要一整篇文章,但同學們可以用望文生義的辦法,直接作出回答,答案是:A=B≥C≥D=E≥F≥≥G。
數據分析的成果很容易被人當夜壺:用的時候很爽,用完了就忘了,平時還嫌你臟。
所以做數據分析項目,要爭取輸出定期使用的、產品化的、大家必須看的成果。
最好就是上一套BI,或者業務的用戶跟進名單用模型進行優化排序,讓大家不得不用。不濟的話,寫個ppt,但爭取在會議上公開講。
最差最差就是跑了一堆臨時需求單,寫了2000行sql結果連個正式輸出物都沒有,年底寫績效報告都不知道寫啥。
題目四(單選題)
今天是11月11日中午12點,你的領導說,下班前給一個預計,預測一下雙十一我們業績能到多少,你怎么做?
- A. 立馬回去建模,時間序列、XGboost搞起
- B. 回去找運營要推廣費用使用情況,算個投入產出比來拍
- C. 回去看下上午數據,根據去年同期拍一個
這個題非常有迷惑性,特別是剛看完上一題,很多同學會慣性選A。
這個題的題眼不是“預測”而是“中午12點到下班”,數據分析可以建模、可以做BI、可以做可視化,但是統統需要時間。
而很多情況下,業務不等人,必須快速給出結果。這時候要優先選簡單直接的辦法,并結合數據提示風險。所以,建模要學、統計學要學、如何快速合理地拍腦袋也要學。
很多新人夯吃夯吃搞了一堆模型,結果被領導三言兩語推翻,還被批斗“你都干嘛去了這么磨嘰”,就是這個原因。
這個題選C,最好是10分鐘內給答案。領導指示“這個問題非常重要,要用更復雜、更科學的方法”以后,再考慮A和B。
題目五(多選題)
數據分析的工作成本由什么構成?
- A. 數據庫成本
- B. 電腦成本
- C. 開發軟件成本
- D. BI產品成本
- E. 數據采集質量
- F. 數據清洗質量
- G. 程序員工作時間
這個題也非常非常有迷惑性,如果在陳老師問之前,很多人都壓根沒想過做數據分析的成本。
數據分析肯定有成本,而且最大的成本是數據質量,好數據才有好分析,垃圾數據垃圾分析。特別是數據采集,業務流程漏洞百出,業務管理不規范,埋點不做好就上線,基礎數據臟亂差,沒法進行分析。
至于什么軟件成本,電腦成本都是毛毛雨,數據質量是涉及公司根本的問題。所以這一題的答案是ABCDEFG,如果排序的話,是E≥≥F≥G≥A≥D≥B≥C
很多同學會問,為啥有G,而且排序還那么高?
因為數據分析師的工作時間是非常寶貴的。
學校里、論文里、專利里那些巨復雜的模型,都是耗費無數時間燒出來的。普通企業的數據分析師每日應付各種取數、匯報、excel都已經折騰半死了,連找對象都不一定有時間,根本沒有時間弄高精尖模型。
所以,必須考慮工作時間。日常需求要排優先級,集中精力做有產出的東西,那些亂七八糟“我要個數”讓他排隊去。
以上,做完5個題目,理解了題目思路,如何做優秀的數據分析項目就呼之欲出了。
如何做優秀的數據分析項目
- 正式立項,把業務痛點作為項目目標;
- 考慮時間緊迫性和數據質量,設計恰當方法;
- 輸出定期使用的、產品化的、大家必須看的成果;
- 需求排序,給自己留出時間干高品質工作;
- 用快捷分析方法應付簡單需求,留出精力做復雜需求。
為了取得好的效果,這里用了5個最常犯錯的題目。
下次,我們拿一些具體需求,看怎么做能出彩。
作者:接地氣的陳老師,微信公眾號:接地氣學堂。十年資歷的數據分析師,擁有多個行業的CRM經驗。
本文由 @接地氣的陳老師 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
已學習
歸納下這5項:1,3屬于項目管理里的產出管理;2,4,5屬于項目管理里的時間管理。
正式立項,把業務痛點作為項目目標;
考慮時間緊迫性和數據質量,設計恰當方法;
輸出定期使用的、產品化的、大家必須看的成果;
需求排序,給自己留出時間干高品質工作;
用快捷分析方法應付簡單需求,留出精力做復雜需求。
贊,很接地氣
經常有個很奇葩的現象,一邊說趕進度把統計報表砍掉,一邊又在流水里給個總數。我問為什么只看總數,上級就說老板想知道。。。。。。。。。。。。。我能怎么辦我也很絕望
數據可視化真是太重要了,最近在想著通過django搭建一個網站,定期抽取數據,讓運營們自己看吧,陳老師覺得可行嗎?
以我過往經驗,固定報表的打開率大概13%哈,感受下。所以得看這事目的,如果是響應領導需求(或者自己是領導,發起一個需求)就做。如果是想著有個平臺運營就自己看了,少提臨時取數,不太現實哈。大部分人沒有自覺看數的積極性,都是事到臨頭打電話:喂,快給我個數,老板要,急!在線等”