數據分析中的硬實力與軟實力「如何鍛造解決問題的能力」
編輯導讀:數據分析師作為互聯網行業背景下誕生的崗位,聽上去非常高大上,也有不錯的職業發展前景。本文作者針對數據分析這個崗位進行了分析,與你分享。
本文來自知乎問答。
問題:想做一名數據分析師,自學了《統計學》、R、SQL等。入門級別的,現在有點迷茫了,下步學什么才是合適的?
我目前自學了《統計學》、JAVA、R、SQL、SPSS。但都是學到學門級別的,現在有點迷茫了,數據分析有那么多工具,不知道學哪些才是最正確的,不知道怎么規劃了(問題重點)。我目前考慮的問題主要有兩個:
- 短期希望找到一份相關的工作(目前事業編混日子)。
- 長期規劃是做一名數據科學家不想走偏了。
正文:
同樣是因為喜愛而轉行踏上數據科學之路。
畢業工作后,業余時間我一直在關注人工智能的新聞,出于興趣開始在晚上自學相關的理論知識、工具例如統計學、python。突然有一天,我心血來潮,忽然想通了,為何不投身喜愛的行業,要不然也只是空有一腔熱血。
于是我便馬不停蹄地開始學習Python,并決定從人工智能時代通用基礎能力——數據分析入手。
但因為是零基礎轉行,所以剛入職很多都不會,挨罵最多的就是做的計劃不落地、提的方案脫離業務場景……經歷了許多項目、積累了經驗后,我總結了以下能幫到你的經驗。
一、工具篇——硬實力
從題主學習了這么多工具的經歷,想必跟我一樣是個“工具控”,接觸到有趣又強大的工具會忍不住去學習。
現在我作為數據分析師,題主說的工具我都有在用,目前我在用的一些相關工具的應用場景:
1. Python
常用的數據分析工具,數據科學界的明星產品。幾乎是萬能的工具,尤其是在解決重復性工作、大數據分析等場景方面特別好用。在Python列入小學課程的時代里,它絕對是值回票價的編程語言。
2. SQL
通用的數據庫語言,對于數據分析師而言,可以完成取數、分析工作。所謂巧婦難為無米之炊,SQL可以從源頭上解決無數據的問題,要不然你是無法想象IT是如何拒絕或延后你的提數需求的。
3. SPSS
“傻瓜式”的數據分析圖形軟件,可以像操作Excel那樣點點點,很簡單地完成復雜的數據分析工作,例如相關性分析、回歸建模等。
(如圖為我在實戰中使用SPSS進行特征挖掘的PPT)
目前我工作中,很喜歡用它的可視化決策樹。在實際的數據挖掘工作中,可解釋性是很重要的一環,它很多時候決定了模型的邏輯及結論是否被業務所認可。眾多模型中,線性/邏輯回歸在這方面絕對是老大,而在我發現了SPSS中將決策樹模型可視化這個逆天功能后,它就成為了我分析的最愛之一,得益于易懂的可視化圖形,它的邏輯與結論往往也很能被業務所接受。
4. R
數據科學界的老大之一,統治著專業的統計學、生物、醫學等領域。目前我在用它,是因為公司的銷售預測模型是其他同事用R語言寫的。
R與Python的差異在于:R是統計語言,有很多優秀的框架,例如Python里最常用的Pandas庫就是從R移植過去的,再例如可視化圖表的庫的表現一騎絕塵。但是在自動化辦公、應用領域卻沒有Python廣。
所以,建議剛入行的童鞋先學Python這個性價比高的語言,等有進一步明確的需求后,再按需學習R即可。
5. Power BI
非常優秀的可視化分析工具。在用Python做數據分析時,很多時候只能將分析結論可視化后黏貼到PPT里,對業務來說,他們更想要有可互動、動態更新的可視化分析結果。而這,就是我應用PowerBI的場景:數據導入后,建模分析,形成的分析報表業務直接點點點就可以感受到數據變化與特點。
但是PowerBI的建模思維有一定的門檻,而對于大多數分析師來說,Excel的圖表已經可以滿足。所以建議初學者先學習靈活應用Excel的可視化能力。
6. JAVA
是使用最廣的開發語言,與數據分析關系不大。我之所以學它,是因為我負責的數據產品幾乎都是用Java開發的數據接口,所以才需要懂一些基礎。
想要從事數據分析工作的同學,不建議學習Java
7. 分析工具的優勢
以上的提及的工具,建議挑選1-2個,如SQL+Python,進階學習。最重要的是進行項目實戰,可作為短期找工作的敲門磚。
掌握分析工具可以更快地在業務公司搶得眼球,可以應對復雜的業務需求。
工具無法解決的問題——對業務場景的理解
工具可以解決很多深度分析需求,但是重要核心還是用工具的人,分析思維還是要回歸業務場景。
二、思維篇——軟實力
職場里真正重要的是:解決問題的能力,而它由定義問題、找到原因、落地建議三部分組成。
業務需求的提出,簡單地說,便是業務在運營過程中,發現了問題,故想通過數據分析找出問題原因所在,進而解決它。
1. 定義問題的能力
只有正確的問題才能指引數據分析工作往正確的方向進行。
從一個模糊的問題說起:今天領導提出,最近老客表現差了。
下面對領導提的問題進行剖析:
【觀點與事實】
“最近老客表現差了”,首先這是一個觀點,不是事實。
【還原事實真相】
作為專業的數據分析師拿到這樣的觀點之后,第一件事是要還原事實的全部:
- 最近:最近是多長時間周期,這周?近三周?還是上個月?
- 老客:如何定義老客?以往注冊過、但并未消費的客戶?還是說一定是有歷史消費的客戶?
- 表現:哪個指標?重購金額?回柜人數?
- 差了:是同比下降,還是環比下降,還是說增長幅度不及預期?
面對領導的業務觀點,我們還原的事實是:上個月(2020年12月1日-12月31日),以往消費過的老客,在回柜消費時產生的消費金額,環比(與2020年11月1日-11月30日)下降了30%。
【事實與觀點】
組建好事實集合后,要利用信度效度思維,重新審視領導的觀點是否客觀、合理。
信度:
代表的是數據的可靠性程度和一致性程度,反映數據的穩定性和集中程度
也就是說,數據計算結果之前的取數邏輯、數據清洗工作是否合理,是否符合業務場景邏輯?
效度:
指測量工具能夠準確測量出事物真實情況的能力,反映數據的準確性。
簡單地說,這樣環比的比較是否有意義?例如品牌或行業屬性是節日敏感的,上上個月有雙十一大促,而12月是淡季沒有活動,不論是橫向與行業內其他公司,還是縱向按往年的經驗,12月重購金額比11月下降20-30%是合理的波動區間。
所以,這樣的事實似乎無法支撐領導的觀點。
2. 尋找原因的能力
實際工作中,找到問題,并將它明確之后,就要抽絲剝繭般找到問題背后的原因,而這一定要回歸業務場景本身,才能在理解業務的背景下,通過數據分析,找到原因所在。
【了解業務】——梳理業務流程
了解業務的過程,實際上就是在不斷溝通的過程,這也引申出數據分析師職業特性:溝通、溝通與溝通!對此暫不展開講。在與業務溝通的過程中,要盡可能多且深入地了解目前業務的動態,盡可以還原業務的全貌。
這個例子里,因為是在單品價格高的行業里,客戶購買產品后,因為產品價值高,所以一般都會存在護理需求,所以售后政策是在質保期內可以免費護理1次。
而業務也正是找到了這個切入點,針對已享受過護理次數的客戶,贈送免費的護理次數,以吸引他們到店來護理,而有了面對顧客的機會,自然也就有進一步銷售的可能。所以現場還會準備新品、活動宣傳等材料,處處精心營造成沖動消費的心理暗示。
【建立公式】——數據思維+業務流程
從業務流程中抽象出來:圈選目標客戶 → 通過護理吸引到店 → 營銷促銷 → 消費。
應用數據思維,進一步抽象成公式:老客重購金額 = 目標老客數 * 到店率 * 轉化率 * 客單價。
抑或用“人貨場”業務思維進行討論。
【理解業務】——搭建業務模型
基于公式,將流程建成立體的網狀結構,形成針對某個具體場景的業務模型。
【數據分析】—— 找到問題所在
通過在業務模型的框架內進行分析比較,我們才能看到某一個業務的全貌,才能發現背后是哪個模塊引出的問題。例如案例中,數據分析發現觸達客戶中,回柜率很低,問題可能在“老客”、“回柜”。
從歷史數據上看,此次采取的吸引到店玩法都是很成熟的策略,有很好的成功案例,數據表現良好,所以問題可能就是出在“客戶池”——運營維護部分,如沒有分群營銷。
3. 落地建議的能力
【KPI相關】
分析項目是否可推動實現很大程度上取決于是否切合業務KPI。
根據多次和業務合作的經驗,尤其是對數字化決策不那么敏感的公司, 甚至是由上至下的數據分析項目,分析結論很容易淪為一紙報告,而不了了之。很大程度上,是因為分析建議與實際業務動態偏離,即并不是業務的考核重點。在資源有限的情況下,也就難以執行。
所以,在最后給落地建議的階段,還是要回歸業務,了解業務的運營計劃,在現有的項目下,去試驗、實踐分析建議。
【符合實際操作】
不要嘗試去改變業務習慣。
問題在于用戶分群的問題,應用RFM模型進行精細化運營。一般來說,RFM模型分為八大人群,根據不同人群特點進行精細化管理,例如案例中,針對重要價值人群進行新品發布會邀請等差異化體驗,針對重要喚回人群進行節日關懷策略等。
但是如果了解實際業務操作的話,對于零售企業來說,并不會按八個人群去實踐,而是選其中的幾個重要人群,或者進行二次組合,以減少客服部門的觸達量。
知道這樣的背景后,就不要再去建議說分成八個人群給不同的建議,而是有優先級地劃出人群優先級,或者配合給人群合并運營建議等。這樣考慮到實際操作情況,業務自然也能感受。
【分析深度】
另一個落地建議,就是一定要具體可行。
在已知數據分析結論不容易落地的情況下,將結論建議盡可能地具體,給出“令人驚喜的”發現,才能更容易去推動項目。
但是不要忘記數據分析與業務執行之間的邊界,在大部分情況下不要嘗試去給具體的落地計劃,否則很可能會引起反效果。
如何做到具體可行?則需要縱向的分析深度:
分析模型的深度理解:
如圖RFM分析案例中,但在我看來,RFM模型的’KPI’在于良性人群的占比提升。所以將門店RFM人群結構及關鍵數據進行同期對比,可以達到進一步分析的目的。
杜邦分析與指標拆解:
這部分內容可以參考:數據分析的結果該如何落地? | 人人都是產品經理 (woshipm.com)
本文由 @餅干哥哥 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
寫的不錯
大佬~