數據思維,讓決策更精準

2 評論 17955 瀏覽 82 收藏 16 分鐘

無論是身處什么行業什么領域,數據分析越來越成為一向必不可少的技能,而運用數據思維進行決策更能產生形成高質量的決策結果。

數據分析正在滲入到各行各業的商業活動中以及各種細小決策中,判斷一個人了是否有數據思維,最核心的因素是看他有沒有通過數據分析做決策的習慣。

一個合格的數據分析師要掌握各種數據分析模型和算法以及熟悉SAS、R、Python等統計工具。有些人可能會說,數據分析的門檻太高了,其實除了數據工作相關產品經理和分析師,并非所有產品經理都需要熟悉數據分析模型和工具,日常大部分數據分析都能夠通過Excel分析出來,如果是比較復雜的數據,產品經理可以通過自己了解業務知識與數據分析師有效的協作,做出有數據依據的決策。

但是每個產品經理都需要了解數據分析思維的重要性,以及熟悉數據分析思維工作流程。

數據分析思維的由來

過去人們做決策主要靠定量分析,定量分析的決策依據來自于決策者的經驗和直覺,這種決策的缺點主要在于決策結果的不可確定性,決策失誤的概率很大。

隨著互聯網的不斷發展和物聯網設備的不斷普及,人們活動的各種數據被有意識的存儲下來了,數據的收集,讓我們可以通過定量分析數據,利用數據實現更好的決策制定。

比如像很多互聯網公司都成立了大數據團隊,收集用戶的社交、電商、搜索行為等數據,通過所搜集的大數據來制定商業決策依據,以及通過數據挖掘形式,找到創新產品的機會。

大的互聯網公司在滿足自己內部決策需求的同時,也成了了大數據部門給其它公司進行賦能,比如螞蟻金服的數據產品芝麻信用,不僅能夠成為螞蟻內部各種金融產品的信用審核依據,也開放給了很多行業如出行、金融、共享服務公司等,極大提高了基于信用服務的門檻和便捷性。

熟悉NBA的球迷都知道,勇士隊曾長期以來一直是聯盟里的魚腩球隊。但是自從來自硅谷風險投資者拉科布收購勇士之后,把數據分析的思想充分融入到了球隊的訓練之中,他們雇傭了許多數據分析師,為球隊提供咨詢幫助,并最先在球館中引入球館錄像和分析系統,為了更好地監測球員的健康狀況。

同時他們根據團隊對歷年來NBA比賽的統計,發現NBA最有效的進攻是眼花繚亂的傳球和準確的投籃,而不是看似觀賞性很強的突破和扣籃。在這個思想的指導下,勇士隊開創性的發明了小球戰術,以三分作為主要進攻手段,開創了四年奪三冠的王朝偉績。

數據分析流程分為發現問題、數據的收集和加工、數據分析、解決對策四個步驟。

發現問題

在工作中并不是所有的事物都需要用到數據分析,只有出現了問題才需要用到數據分析。一類問題是對現狀的不滿意,另一類問題是對未來的預測。

在數據分析中,發現現狀問題有一個萬能的公式,即問題=預期和現狀之間的差距,比如當商品廣告投入和產品質量沒有變化的情況下,本月用戶的平均消費金額下降了。如果廣告和產品質量沒有變化,正常的情況是本月用戶的平均消費金額不變才對,現狀卻是本月用戶的平均消費金額減少,那么我們就認為這里有問題需要被挖掘,利用數據分析的方法,去發掘問題背后的原因。

那么如何找到預期和現狀之間的差距呢?

有兩個辦法找到預期和現狀之間不符的情況下背后的原因。分別是:將數據分解后觀察和將數據比較后觀察

1. 將數據分解后觀察

一般一個預期結果由多因素決定,可以將現狀的數據分解后進行觀察什么因素對結果的影響。對數據分析來講,比較有效的數據分解方式是因素分解方式,即對數據結果進行四則運算分解。

比如:本月平均消費金額=本月消費總額/本月消費人數。

所以本月平均消費金額減少,要么是本月消費總額減少,要么是本月消費人數增加了。接著我們可以去深挖為什么本月平均消費金額減少或者本月消費人數增加,直到找到最根本的原因。

如果數據不能由公式進行分解,那么需要討論數據結果的所有決定因素,以及每種決定因素影響的大小,然后分析有變化的決定因素。比如產品本月用戶滿意度降低了,滿意度并不能通過因素分解,那么可以分析滿意度所有的決定因素,比如涉及滿意度的因素可能有售前和售后服務效率、產品質量、品牌影響力等因素,看看是否有因素發生了變化,如果有因素發送了變化,那極有可能是影響滿意度的決定因素。

2. 將數據比較后觀察

將數據比較后觀察指的是發生問題的數據和未發生問題的數據進行比較,從而找到問題的原因。數據比較的方式比較多,比如按時間序列進行比較,比如昨天和今天的比較、上月和本月的比較、上周和本周的比較、去年和今年的比較,以及同一個活動上次和本次的比較等。

也可以空間進行橫向比較,比如和競爭對手的數據進行比較,公司內部不同部門之間的數據比較等。

還有一種重要的方式是按照用戶的屬性數據進行比較,常用的用戶屬性有用戶性別、用戶來源、用戶操作系統類型、用戶手機類型、用戶年齡、用戶地域、用戶偏好等。

數據比較看似原理比較簡單,但是解釋了為什么我們做的報表和數據分析經常要做比較,因為只有比較才能發現問題。

數據的收集和加工

不管是現狀問題還是對未來的預測,數據收集和加工的過程是非常重要的,數據的收集和加工是整個數據分析過程的“原材料”。如果沒有豐富的“原材料”,那么“巧婦也難為五米之炊”。

1. 數據收集

一個有數據思維的產品經理,在產品設計階段就會盡量把數據提前收集,做數據埋點和數據校驗,保證數據的精準性和完整性。比如設計一個APP的埋點包括啟動次數、頁面訪問時間、功能點擊次數等。

數據校驗也很重要,千萬不要想著功能先做上去就好了,數據校驗可以慢慢做,這樣造成的影響就是在數據統計的沒有校驗的數據統計價值不高。比如下圖中的

系統中,在錄入車輛品牌的時候,直接是錄入操作,而不是品牌選擇,這意味著沒有做數據校驗。

沒有做數據校驗的字段意味著用戶可以隨意填寫該字段,如下圖:

在做數據收集的時候,同樣一個車輛型號,有多行記錄,在數據收集和分析的時候,就需要去額外的投入去判斷哪些數據其實是一個數據。

今日頭條作為一款成功的新聞推薦產品,能做到信息推薦的千人千面,這得益于他們數據收集的完整性,完整性體現在頭條把用戶數據分為人的特征、環境特征、文章特征等。每個特征又分為很多更細化的特征,如文章特征又分為文章時效性、文章熱度、相似文章、停留時間、閱讀的細節行為等。

頭條甚至能通過數據了解用戶什么地方快速劃過、什么地方仔細閱讀過等數據,完整的數據收集為頭條眾多的算法策略提供了數據原料。

在數據收集時,從數據的獲得成本來講,代價最低的是收集已經保存的數據,所以產品經理在設計產品的時候,就需要考慮數據保存。

代價最高的是從外部去購買數據,比如在互聯網金融中,很多平臺會從第三方大數據機構中購買反欺詐名單、黑名單、多頭借貸等數據,外部購買的數據一般是按每筆收費。

2. 數據加工

數據收集完成之后就是數據加工,大部分數據都零散的存放在數據庫中或者文件里面,所以數據加工首先需要將數據整合在一塊,如果數據保存在數據庫中那么需要用SQL整理,如果數據保存在文件中那么就用Excel或者R語言整理。

數據加工的目標是為了得到數據指標的結果,數據指標是我們日常工作的數據化表現,比如我們上面講到本月消費總額和本月消費人數。越是數據驅動的產品,數據指標越多,指標越精細,比如上面今日頭條的基于人、環境、文章等非常精細的數據指標。

除了常規的數據指標,在數據加工的時候還需要對一些連續數據進行指標離散化,在數據加工階段,為了在數據分析的時候,方便采取更準確的決策,我們可以把一些連續數值的數據離散化。

阿里巴巴有了用戶的歷史消費行為、消費能力、支付數據等數據之后,在數據加工階段,可以把按風險把用戶分為不同的層級。如下是網商銀行對外輸出的客戶風險評級:

  • A為1-3層用戶,屬于最優質人群;
  • B為4-6層用,屬于良好用戶;
  • C為7-8層,屬于風險較高用戶,C1為第七層,C2為第八層;
  • Other,為拒絕用戶。

定義好離散化的數據指標之后,那具體哪些用戶屬于什么評級呢,這就是數據分析階段需要做的事情了。

數據分析

在數據分析中,根據問題的難易程度可以用到“決策支持”和“系統優化”的分析方法。

1. 決策支持

決策支持是通過簡單的求和以及易于理解的分析模型,幫助用戶做出決策,比如對比本月同比和環比用戶平均消費金額,從而決定通過什么決策活動來提高本月的用戶平均消費金額。比如建立一個廣告投入因素和新增用戶的關系模型,就能夠預測投入多少廣告額,能帶來多少新增用戶。

簡單的關系模型產品經理是能通過Excel表格分析出來的,如柱狀圖、折線圖等。

如果一項因素引發問題的因素很復雜,則需要建立一個由多個因素組成的預測模型。通過這個模型,我們可以觀察模型中某個因素對整體結果造成的影響。預測模型需要用到的統計方法有交叉列表統計、統計學假設檢驗 、多元回歸分析等,這個階段大部分產品經理都需要求助數據分析師的幫助了。

2. 系統優化

系統優化指的是幫助用戶構建讓計算機執行的方案算法,常用的系統優化方法有機器學習。

相比簡單模型的決策模型,系統通過機器學習方法分析出系統中更詳細的因素,比如系統優化能分析出廣告投入多少金額,能帶來新用戶的快速增長,以及廣告投放中具體什么投放渠道,效果最好。

機器學習的優勢在于能從數據中學習出其本身包含的模式和規律,并以此來建立模型。比今日頭條,就是通過分析我們過去瀏覽的記錄,利用機器學習建立模型,從而給我們推薦類似的內容。系統優化用到的統計方法有邏輯回歸分析、聚類、主成分分析、決策樹分析等。

解決對策

對于數據分析中決策支持的得出的結果,我們可以通過決策結果直接決定做或者不做某事,對于數據分析中系統優化得出的結果,我們可以在計算機上執行解決問題的決策算法。

無論什么決策結果,都需要評估執行決策結果的成本以及決策風險。

為了評估成本和風險,在做決策的時候,我們可以通過把預估的數據代入到決策模型中,進行模擬仿真,從而得出可能出現的結果。

與此同時,我們還需要不斷的和周圍的人傳達我們整個數據分析的流程,告訴他們我們的決策是有數據依據的,這樣有助于推進決策結果的推進。

#專欄作家#

青蛙王子,微信公眾號:guatalk,qq:1418191947,人人都是產品經理專欄作家。

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. “過去人們做決策主要靠定量分析,定量分析的決策依據來自于決策者的經驗和直覺,這種決策的缺點主要在于決策結果的不可確定性,決策失誤的概率很大?!睉撌嵌ㄐ苑治?。

    來自北京 回復
    1. 好的。謝謝

      來自浙江 回復