數據分析中的硬實力與軟實力「如何鍛造解決問題的能力」

2 評論 5450 瀏覽 21 收藏 16 分鐘

編輯導讀:數據分析師作為互聯網行業背景下誕生的崗位,聽上去非常高大上,也有不錯的職業發展前景。本文作者針對數據分析這個崗位進行了分析,與你分享。

本文來自知乎問答。

問題:想做一名數據分析師,自學了《統計學》、R、SQL等。入門級別的,現在有點迷茫了,下步學什么才是合適的?

我目前自學了《統計學》、JAVA、R、SQL、SPSS。但都是學到學門級別的,現在有點迷茫了,數據分析有那么多工具,不知道學哪些才是最正確的,不知道怎么規劃了(問題重點)。我目前考慮的問題主要有兩個:

  • 短期希望找到一份相關的工作(目前事業編混日子)。
  • 長期規劃是做一名數據科學家不想走偏了。

正文:

同樣是因為喜愛而轉行踏上數據科學之路。

畢業工作后,業余時間我一直在關注人工智能的新聞,出于興趣開始在晚上自學相關的理論知識、工具例如統計學、python。突然有一天,我心血來潮,忽然想通了,為何不投身喜愛的行業,要不然也只是空有一腔熱血。

于是我便馬不停蹄地開始學習Python,并決定從人工智能時代通用基礎能力——數據分析入手。

但因為是零基礎轉行,所以剛入職很多都不會,挨罵最多的就是做的計劃不落地、提的方案脫離業務場景……經歷了許多項目、積累了經驗后,我總結了以下能幫到你的經驗。

一、工具篇——硬實力

從題主學習了這么多工具的經歷,想必跟我一樣是個“工具控”,接觸到有趣又強大的工具會忍不住去學習。

現在我作為數據分析師,題主說的工具我都有在用,目前我在用的一些相關工具的應用場景:

1. Python

常用的數據分析工具,數據科學界的明星產品。幾乎是萬能的工具,尤其是在解決重復性工作、大數據分析等場景方面特別好用。在Python列入小學課程的時代里,它絕對是值回票價的編程語言。

2. SQL

通用的數據庫語言,對于數據分析師而言,可以完成取數、分析工作。所謂巧婦難為無米之炊,SQL可以從源頭上解決無數據的問題,要不然你是無法想象IT是如何拒絕或延后你的提數需求的。

3. SPSS

“傻瓜式”的數據分析圖形軟件,可以像操作Excel那樣點點點,很簡單地完成復雜的數據分析工作,例如相關性分析、回歸建模等。

(如圖為我在實戰中使用SPSS進行特征挖掘的PPT)

目前我工作中,很喜歡用它的可視化決策樹。在實際的數據挖掘工作中,可解釋性是很重要的一環,它很多時候決定了模型的邏輯及結論是否被業務所認可。眾多模型中,線性/邏輯回歸在這方面絕對是老大,而在我發現了SPSS中將決策樹模型可視化這個逆天功能后,它就成為了我分析的最愛之一,得益于易懂的可視化圖形,它的邏輯與結論往往也很能被業務所接受。

4. R

數據科學界的老大之一,統治著專業的統計學、生物、醫學等領域。目前我在用它,是因為公司的銷售預測模型是其他同事用R語言寫的。

R與Python的差異在于:R是統計語言,有很多優秀的框架,例如Python里最常用的Pandas庫就是從R移植過去的,再例如可視化圖表的庫的表現一騎絕塵。但是在自動化辦公、應用領域卻沒有Python廣。

所以,建議剛入行的童鞋先學Python這個性價比高的語言,等有進一步明確的需求后,再按需學習R即可。

5. Power BI

非常優秀的可視化分析工具。在用Python做數據分析時,很多時候只能將分析結論可視化后黏貼到PPT里,對業務來說,他們更想要有可互動、動態更新的可視化分析結果。而這,就是我應用PowerBI的場景:數據導入后,建模分析,形成的分析報表業務直接點點點就可以感受到數據變化與特點。

但是PowerBI的建模思維有一定的門檻,而對于大多數分析師來說,Excel的圖表已經可以滿足。所以建議初學者先學習靈活應用Excel的可視化能力。

6. JAVA

是使用最廣的開發語言,與數據分析關系不大。我之所以學它,是因為我負責的數據產品幾乎都是用Java開發的數據接口,所以才需要懂一些基礎。

想要從事數據分析工作的同學,不建議學習Java

7. 分析工具的優勢

以上的提及的工具,建議挑選1-2個,如SQL+Python,進階學習。最重要的是進行項目實戰,可作為短期找工作的敲門磚。

掌握分析工具可以更快地在業務公司搶得眼球,可以應對復雜的業務需求。

工具無法解決的問題——對業務場景的理解

工具可以解決很多深度分析需求,但是重要核心還是用工具的人,分析思維還是要回歸業務場景。

二、思維篇——軟實力

職場里真正重要的是:解決問題的能力,而它由定義問題、找到原因、落地建議三部分組成。

業務需求的提出,簡單地說,便是業務在運營過程中,發現了問題,故想通過數據分析找出問題原因所在,進而解決它。

1. 定義問題的能力

只有正確的問題才能指引數據分析工作往正確的方向進行。

從一個模糊的問題說起:今天領導提出,最近老客表現差了。

下面對領導提的問題進行剖析:

【觀點與事實】

“最近老客表現差了”,首先這是一個觀點,不是事實。

【還原事實真相】

作為專業的數據分析師拿到這樣的觀點之后,第一件事是要還原事實的全部:

  • 最近:最近是多長時間周期,這周?近三周?還是上個月?
  • 老客:如何定義老客?以往注冊過、但并未消費的客戶?還是說一定是有歷史消費的客戶?
  • 表現:哪個指標?重購金額?回柜人數?
  • 差了:是同比下降,還是環比下降,還是說增長幅度不及預期?

面對領導的業務觀點,我們還原的事實是:上個月(2020年12月1日-12月31日),以往消費過的老客,在回柜消費時產生的消費金額,環比(與2020年11月1日-11月30日)下降了30%。

【事實與觀點】

組建好事實集合后,要利用信度效度思維,重新審視領導的觀點是否客觀、合理。

信度:

代表的是數據的可靠性程度和一致性程度,反映數據的穩定性和集中程度

也就是說,數據計算結果之前的取數邏輯、數據清洗工作是否合理,是否符合業務場景邏輯?

效度:

指測量工具能夠準確測量出事物真實情況的能力,反映數據的準確性。

簡單地說,這樣環比的比較是否有意義?例如品牌或行業屬性是節日敏感的,上上個月有雙十一大促,而12月是淡季沒有活動,不論是橫向與行業內其他公司,還是縱向按往年的經驗,12月重購金額比11月下降20-30%是合理的波動區間。

所以,這樣的事實似乎無法支撐領導的觀點。

2. 尋找原因的能力

實際工作中,找到問題,并將它明確之后,就要抽絲剝繭般找到問題背后的原因,而這一定要回歸業務場景本身,才能在理解業務的背景下,通過數據分析,找到原因所在。

【了解業務】——梳理業務流程

了解業務的過程,實際上就是在不斷溝通的過程,這也引申出數據分析師職業特性:溝通、溝通與溝通!對此暫不展開講。在與業務溝通的過程中,要盡可能多且深入地了解目前業務的動態,盡可以還原業務的全貌。

這個例子里,因為是在單品價格高的行業里,客戶購買產品后,因為產品價值高,所以一般都會存在護理需求,所以售后政策是在質保期內可以免費護理1次。

而業務也正是找到了這個切入點,針對已享受過護理次數的客戶,贈送免費的護理次數,以吸引他們到店來護理,而有了面對顧客的機會,自然也就有進一步銷售的可能。所以現場還會準備新品、活動宣傳等材料,處處精心營造成沖動消費的心理暗示。

【建立公式】——數據思維+業務流程

從業務流程中抽象出來:圈選目標客戶 → 通過護理吸引到店 → 營銷促銷 → 消費。

應用數據思維,進一步抽象成公式:老客重購金額 = 目標老客數 * 到店率 * 轉化率 * 客單價。

抑或用“人貨場”業務思維進行討論。

【理解業務】——搭建業務模型

基于公式,將流程建成立體的網狀結構,形成針對某個具體場景的業務模型。

【數據分析】—— 找到問題所在

通過在業務模型的框架內進行分析比較,我們才能看到某一個業務的全貌,才能發現背后是哪個模塊引出的問題。例如案例中,數據分析發現觸達客戶中,回柜率很低,問題可能在“老客”、“回柜”。

從歷史數據上看,此次采取的吸引到店玩法都是很成熟的策略,有很好的成功案例,數據表現良好,所以問題可能就是出在“客戶池”——運營維護部分,如沒有分群營銷。

3. 落地建議的能力

【KPI相關】

分析項目是否可推動實現很大程度上取決于是否切合業務KPI。

根據多次和業務合作的經驗,尤其是對數字化決策不那么敏感的公司, 甚至是由上至下的數據分析項目,分析結論很容易淪為一紙報告,而不了了之。很大程度上,是因為分析建議與實際業務動態偏離,即并不是業務的考核重點。在資源有限的情況下,也就難以執行。

所以,在最后給落地建議的階段,還是要回歸業務,了解業務的運營計劃,在現有的項目下,去試驗、實踐分析建議。

【符合實際操作】

不要嘗試去改變業務習慣。

問題在于用戶分群的問題,應用RFM模型進行精細化運營。一般來說,RFM模型分為八大人群,根據不同人群特點進行精細化管理,例如案例中,針對重要價值人群進行新品發布會邀請等差異化體驗,針對重要喚回人群進行節日關懷策略等。

但是如果了解實際業務操作的話,對于零售企業來說,并不會按八個人群去實踐,而是選其中的幾個重要人群,或者進行二次組合,以減少客服部門的觸達量。

知道這樣的背景后,就不要再去建議說分成八個人群給不同的建議,而是有優先級地劃出人群優先級,或者配合給人群合并運營建議等。這樣考慮到實際操作情況,業務自然也能感受。

【分析深度】

另一個落地建議,就是一定要具體可行。

在已知數據分析結論不容易落地的情況下,將結論建議盡可能地具體,給出“令人驚喜的”發現,才能更容易去推動項目。

但是不要忘記數據分析與業務執行之間的邊界,在大部分情況下不要嘗試去給具體的落地計劃,否則很可能會引起反效果。

如何做到具體可行?則需要縱向的分析深度:

分析模型的深度理解:

如圖RFM分析案例中,但在我看來,RFM模型的’KPI’在于良性人群的占比提升。所以將門店RFM人群結構及關鍵數據進行同期對比,可以達到進一步分析的目的。

杜邦分析與指標拆解:

這部分內容可以參考:數據分析的結果該如何落地? | 人人都是產品經理 (woshipm.com)

 

本文由 @餅干哥哥 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 寫的不錯

    來自廣西 回復
  2. 大佬~

    來自北京 回復