設計師必須掌握數據分析要點

4 評論 9916 瀏覽 50 收藏 29 分鐘

編輯導語:對于設計師來說,熟練運用數據分析很重要,只有掌握了數據才能摸清用戶需求,從而設計出用戶滿意的產品。本文作者以數據分析為中心,逐層抽絲剝繭,回答了數據分析要解決什么問題?數據分析師的工作是什么樣的?數據分析的流程有哪些?最后,為我們總結了一些注意事項。

交互設計師通常會有一個苦惱,不知道如何去衡量自己的方案是否有效。畢竟發聲的用戶都是對體驗不滿的用戶,沒有問題的用戶都是沉默的。

針對上面的這些問題,筆者根據這么多年的設計經驗,總結了兩種方法:

定性法:

當你的產品沒有辦法收集大量數據的時候,只能定性的去觀察分析這個產品體驗的好壞了。

如:很多B端的用戶界面,很難收集完整的數據或用戶反饋,只能通過專家走查或者收集用戶意見來判斷產品是否好用。常用的方法有:Google的HEART模型、阿里的TECH模型。

定量法:

如果你的產品是很成熟的C端產品,可以收集大量用戶數據,并將這些數據可視化,去分析用戶如何使用產品,設計師也可以很好的去量化設計的效果。

如:DAU漲了5%、人均VV降了0.4、CTR提高了10%等等,可以很客觀的衡量設計方案的效果。

以上這兩種方法,都是數據收集的過程,第一種更感性,第二種更理性客觀。

一、數據分析要解決什么問題?

那數據分析能幫助我們解決哪些問題呢?

1. 研究歷史

舉個例子:視頻行業某個產品的DAU有一段時間突然迅猛增長。

如果是一個新手設計師,可能會困惑:這段期間沒有做任何需求和活動,為何數據會漲?然后他去看看了去年的DAU趨勢,才恍然大悟:原來是每次到了寒暑假的周期,孩子們放假了,就會呆在家看視頻,DAU自然會漲。

由此可見,數據分析可以幫設計師客觀的描述事實,追溯歷史。但有個小問題,就是這些數據都是存儲在云端的,服務器的內存是有限,有的公司只能存1-3月的數據,這樣就會導致無法追溯太久遠的數據。

2. 解釋現狀

對于一些核心數據,如:DAU、PV、用戶停留時長,它們時刻都在變化,需要每天監測。幫助檢查線上是否出現設計事故,也可以用來評估設計方案上線后的效果如何。

3. 預測未來

在了解問題發生原因的基礎上,設計師也可以根據曲線預測業務的發展趨勢和影響程度。

張小龍曾經在微信公開課上講過,他堅信一個原則:一個新產品如果沒有獲得一個自然的增長曲線,就不應該推廣它。因此,直到微信2.0的時候,他看到了增長曲線,雖然不是很快,但是是自然往上走的。

此時,他們才開始了著力推廣。

數據分析能幫我們對一個產品的未來趨勢走向進行宏觀的預測,輔助我們做更正確的決定。這個相對而言會比較難,也需要經過時間慢慢的驗證。

4. 洞察商機

你尋找到一定的規律,就能挖掘更多未被滿足的需求。如果發現已登錄的用戶購買VIP的概率更大,是不是可以想辦法去提高用戶的登錄率。

5. 尋求最佳方案

這個也是設計師經常會用到的,ABCD哪一個最好?如何驗證?

除了Netflix的ABtest的方式,還可以可以通過分渠道、分設備ID或者灰度測試的方法,都可以快速的去驗證當前的方案是否可行,如果發現問題,可以快速修改。

二、數據分析師的工作

一個專業的數據分析師能力模型應該是什么樣的呢?

下圖中可看出一個常規的數據分析師日常工作都是在收集數據、處理數據,根據二八原則,他們花了80%的時間只能做20%的價值,而真正有價值的是洞察、決策、行動來創造用戶價值的工作,這部分的工作只占20%,但是尤為重要。

大部分的工作崗位均是如此,如:一個視覺設計師,需要非常熟悉PS、AI之類的工具,這些工具和技能帶來的價值沒有設計策略高,但是到設計策略這個層面是更難的,設計師應該需要看到完整的職位能力模型地圖。

三、數據分析流程

數據分析的主要流程分為:數據分析框架—數據獲取—數據處理—數據分析—和撰寫報告這5步。

  1. 數據分析框架:包括確定分析的目標、確定要分析數據的指標、想清楚分析的時間和數據應用的公式。然后把需求提給后臺的產品經理,讓研發同學做好埋點;
  2. 數據獲?。悍绞胶芏啵河芯€上、線下的;部門內部的、外部的;公司內部的、外部的;
  3. 數據處理:主有:數據清理、數據抽取、數據合并、數據計算和數據可視化;
  4. 數據分析:主要有5種方法:對比分析法、分組分析法、預測分析法、漏斗分析法和ABtest分析法;
  5. 撰寫報告:報告建議結論先行,因為通常一份數據分析的報告是很長的,如果把結論分散的放在后面,閱讀性比較差,觀看者很少會耐心看完。

然后就是措辭要嚴謹,寫清楚分析的目的、分析的要點,不要放與結論支撐無關的數據,寫完結論后可以附上相關的建議,這樣完成了數據分析閉環,其他配合同學可明確知道優化的需求點。

1. 數據分析框架

數據分析框架包含哪些內容呢?

首先需要想清楚為什么要分析這個數據,它影響的核心指標有哪些。

舉個例子:在視頻播放器里有一種叫4k的碼流,效果比超清畫質更好,最開始屬于VIP權益;后來為了提高登錄率,戰略上把4k改成了登錄權益,那么分析這個需求的目的就是看看4k的權益更改之后對登錄率的影響。

指標就是設備登錄率,公式是登錄UV除以DAU;然后還需要對這個公式的結果進行預測,以4K這個功能為例,理論上數據應該是會提升的。

一些經驗豐富的產品還會加上預測的數值:比如預計提升1%或者3%等等,這個預估的數值也是基于公式來評估的,比如預估登錄UV提升20W,DAU預估提升多少,然后得出預估提升的比例。

起初這些數值可能是拍腦袋得出來的,但是拍版的次數多了,經驗值也就越準了。

然后是版本型號,因為同時在線的可能有很多版本,需要分析的這個功能在哪個版本上線,需要與哪個版本對比,這些都是需要考慮的。

然后就是查詢時間段,這個需要特別說明一下,通常會取新版本發布后前兩個周的數據,因為2周的用戶量本足夠了,且用戶行為特征也基本形成了。

這里需要注意一點,很多PM也可能會弄錯,他們查詢時間段會取新版本發布后的2周數據和老版本在新版發布前兩周的數據。也就是說:如果新版本是3月15日發布的,取的數據就是新版版3.15到3月28日和老版本3.1日到3.14。

通常情況下不建議這么取數據,因為用戶不在一個周期范圍。

第一波更新用戶和最后一波更新用戶的行為模式是不一樣的,發版后立馬使用產品的人一定是非?;钴S的用戶,他們的用戶粘性和行為特征與其他用戶是不同的,這里沒有控制用戶屬性變量。

但是如果選的都是發版后的數據對比又有什么問題呢?

如果是跟運營內容強相關的數據,變量太大了。比如你正好要統計的這個區間《延禧宮略》完結,哪肯定會影響DAU。

所以如果這個數據非常重要,就需要運營同學在這兩個版本之間控制好內容,不要突然新增一個熱門內容?;蛘咴u估用戶周期和內容的影響程度,更好的取舍——數據分析很難做到絕對的控制變量。

查詢方式通常有兩種:

一種是看BI報表,就是簡單的輸入需要的版本號、日期和篩選維度,就可以拉出數據了。

pingback就是一種數據埋點的方式,當用戶發生某種行為時,我們向后臺發起請求,記錄下這個行為的發生,就是一種統計的方式。比如:制定全屏播放的時候t=1,小窗口播放是t=0,然后輸入簡單的類似代碼的運算符,就可以跑出需要的數據了。

pingback要注意的一點就是可能會經常出bug或者數據不準的情況,需要設計師自己去判斷數據的真實性。比如如果登錄人數比DAU還多,那肯定是有問題。

然后就是優先級,埋點是需要向后臺產品或技術提需求,他們需要根據優先級進行排序埋點、生成報表的。通常P1是必須要做的,P2是要做但是可以分期做,P3是可做可不做的。

最后就是備注。

備注可以增加一些額外的需求,比如小渠道期間就要觀察數據,那么小渠道期間埋點就要做好。通常體量大的成熟的產品都會有灰度測試,可以通過小渠道、批量放量的方式進行數據監測。

因為TV端的渠道有很多,什么沙發、當貝之類的,可以通過先在部分渠道push新版本的安裝包觀察用戶反饋。

手機端、pc端可以通過IP地址來篩選一批少量用戶使用新版本?;叶葴y試的目的其實就是為了測試產品新增的改動用戶是否有負面反饋。因為產品體量比較大,貿然的全量可能會造成事故。

2. 數據獲取

數據是進行數據分析的前提,“巧婦難為無米之炊”說的就是這個道理。

因此,數據的收集是非常重要的。按收集方式的不同,數據收集可以分為線上收集和線下收集;按收集渠道的不同,又可以分為內部收集和外部收集。

線上收集的數據指的是利用互聯網技術自動采集的數據,例如,企業內部通過數據埋點的方式進行數據收集,然后將收集來的數據存儲到數據庫中。

另外,利用爬蟲技術獲取網頁數據或借助第三方工具獲取網上數據等都屬于線上收集方法。一般情況下,互聯網科技企業、互聯網電商企業、互聯網游戲企業等都采用這種方式來收集用戶行為數據,因為效率很高且錯誤率很低。

線下收集的數據相對比較傳統,對技術要求不高。

例如,通過傳統的市場調查問卷獲取數據,就屬于線下收集。除了問卷調查這種很熟知的方式之外,通過手工錄入獲取數據以及通過其他人提供的電子表格獲取數據等等,都屬于線下收集方式。

這種收集數據的方式效率低且容易出現偏差。一般情況下,傳統制造型企業、線下零售企業、市場調研咨詢類企業等都采用線下方式收集數據。

內部收集數據指的是獲取的數據都來源于企業內部數據庫、日常財務數據、銷售業務數據、客戶投訴數據、運營活動數據等等。這種數據的獲取相對較為方便,數據分析員可以根據實際業務需求對內部收集的數據進行處理分析。

關于內部收集的數據有時候會存在跨團隊咨詢,這里有一個巧妙的方法,可以提前驗證設計方案是否可行。假設設計師想以設計為出發點做一個功能,但是不確定這個功能效果如何,用戶反饋如何,這個時候怎么辦呢?

很多企業內部是按平臺劃分的,如pc端、移動端、web端、tv端等等,可以先看看其他平臺或者競品有沒有做過類似的功能,他們是怎么做的?數據如何?

如果數據不錯,就驗證功能本身沒問題,設計師只要把控好交互就可以了。也就是說如果有前人鋪路,可以直接把數據拿來輔助功能可行性。

這里需要注意一點:由于企業內部的數據比較敏感,不同業務線之間是沒有權限查看數據的,可以向上請求幫助或者郵件往來記錄一下為什么需要這個數據會更容易一些。

外部收集的數據指的是數據不是企業內部產生的,而是通過其他手段從外部獲取的。

例如,利用爬蟲技術獲取的網頁數據,從公開出版物收集的權威數據,市場調研獲取的數據以及第三方平臺提供的數據等。外部數據的收集不像內部收集那么容易,且大部分都是碎片化、零散的數據。

所以,數據分析師需要對這些數據進行清洗和整合,然后再去進行分析。

總之,不管以什么方式獲得的數據,都應該是有價值和意義的,設計師更應該去發現數字背后暗藏的規則和發展趨勢。

3. 數據處理

一般通過不同途徑收集過來的原始數據都是相對比較粗糙且無序的,此時,需要利用數據處理軟件進行一系列的加工處理,降低原始數據的復雜程度,最終匯總成用戶可以解讀的業務指標。

數據處理過程如下:

1)數據清洗

將多余的重復數據篩選清除,將缺失的數據補充完整,將錯誤的數據糾正或刪除。

2)數據抽取

也就是抽取保留數據表中的某些字段和紀錄部分信息。

3)數據合并

就是綜合數據表中某幾個字段的信息或不同的紀錄數據,組成新的字段或新紀錄數據。最后就是將獲取的數據按公式進行處理和計算,并進行可視化。

簡單來看就是,當設計師拿到一個數據表,是關于播放浮層里面的一些功能使用情況。

首先,按照第一步對數據進行清理,去掉所有空的、沒有字段的數據,可能是技術同學發錯了,刪除即可。數據抽取和數據合并可以直接在excel里建立數據透視分析表,然后進行數值計算,可以求平均值、求和之類的,最后就把這個數據做成圖表。

常用的數據處理工具包括Excel之類的電子表格軟件、各類數據庫軟件、Python、SPSS等,這些工具都包含數據處理模塊,方便用戶對數據進行快速清洗,然后進行分析。

4. 數據分析

處理完數據之后,設計師需要對這些處理完的數據進行分析。常用數據分析方法,分別是:對比分析法、分組分析法、分析預測法、漏斗分析法和ABtest分析法。

1)對比分析法

對比分析法,又叫比較分析法,通過指標的對比來反映事物數量上的差異和變化,屬于統計分析中最常用的方法。

在實際應用中,大家應該都聽過縱向對比和橫向對比的說法,縱向對比指的是同一事物在時間維度上的對比。

這種對比方法主要包含環比(如日活用戶數DAU在本月與上月之間的對比)、同比(如銷售額在今年第一個Q與去年第一個Q的對比)和定基比(比如我們分別拿2月份、3月份、4月份和5月份的點擊量均與1月份的點擊量做對比)。

而橫向對比指的是不同事物在固定時間上的對比(比如:不同用戶等級在客單價之間的差異;不同商品之間的利潤率高低;新用戶在不同渠道的支付轉化率)。

采用對比分析法,得到的結果可以是相對值(如百分數、倍數、系數等),也可以是相差的絕對數和相關的百分點(一個百分點即指1%),即把對比的指標做減法運算。

所以,通過對比分析法就可以對規模大小、水平高低、速度快慢等做出判斷和評價。

產品設計中對比分析法,通常是時間周期固定,新舊版本的對比。

2)分組分析法

分組分析法與對比分析法很相似,不同的是分組分析法可以按照多個維度將數據拆分為各種組合,并比較各組合之間的差異。

3)預測分析法

預測分析法主要用于未知數據的判斷和預測,這個方法在大數據時代顯得尤為突出和重要。

比如我們可以根據過去三年的歷史銷售數據,預測未來六個月的銷售額;根據患者各項體檢指標的檢查,預測其患某種疾病的可能性;利用消費者在互聯網留下的日志數據,向消費者推送可能購買的商品等。

預測分析法大致可以劃分為兩種:一種是基于時間序列的預測,即根據指標值的變化與時間依存關系進行預測(具體的預測方法有移動平均法、指數平滑法等);另一種是回歸類預測,即根據指標之間相互影響的因果關系進行預測(具體的預測方法有線性回歸、KNN算法、決策樹模型等)。

圖表中年份上寫了E的都是預測數據:

4)漏斗分析法

漏斗分析法通常也稱為流程分析法,其目的是關注某事件在重要環節上的轉化率,這個方法在互聯網行業的用的非常多。

以B2C的電商為例,用戶從瀏覽頁面到完成購買通常會有4個重要的環節,即用戶通過主頁或搜索的方式進入商品列表頁,再到點入具體的商品進入商品詳情頁,接著將心儀的商品加入到購物車,最后將購物車內的商品結賬完成交易。

直觀判斷可知,經過這4個重要環節的用戶數量肯定越來越少,進而形成錐形的漏斗效果。

在實際的數據整理中,我們可以借助于漏斗分析法對產品運營過程中各個重要環節的轉化率、運營效果和過程進行監控及管理,對于轉化率特別低的環節,或者波動發生異常的環節加以有針對性的修正,進而保證轉化率的提升,從而提升整體運營效果。

5)AB測試分析法

AB測試分析法也是一種對比分析法,該方法側重于對比AB兩組結構相似的樣本(如用戶屬性和行為相似、產品特征相似等),并基于兩組樣本的指標值挖掘各自的差異。

例如某APP的同一個功能頁面,設計了兩種不同風格的頁面布局,然后將兩種風格的頁面隨機分配給測試用戶(這些用戶的結構都比較相似),最后根據用戶在該頁面的瀏覽轉化率來評價不同頁面布局的優劣。

5. 撰寫報告

撰寫數據分析報告,這個是很重要的一個環節,首先需要想想閱讀對象是誰,老板肯定會看,其次業務方也會看,與需求利益相關的人都會看這個報告,所以報告的呈現很重要。

首先要結論先行,金字塔原則—— 先說重點,感興趣的同學再深入研究,所以通常需要把核心的數據結論和表現放在目錄里。

分析的指標內容,通常每期一定會分析核心的3個KPI數據,與核心指標相關的就歸于一類,比如說新增用戶的次日留存,那么所有跟新增用戶次日留存相關的需求按優先級進行排列。

而且每個需求需要單獨列出分析的小結,結論中要包含主要數據和分析結論——這個是一個目錄的要求。

到每個詳細的需求分析時,需要列出每個需求的描述,就是我們理解的需求背景、功能介紹、分析思路。要說清楚跟上一個版本的改動點,最好有界面配圖。

截圖這里也需要注意,就是控制變量嘛,所以如果需要比較兩個版本的方案變化,最好是截取同一個場景,觀看者可以很直觀的看出哪里發生了變化。

然后就是放可視化圖表了,圖表要寫選取數據的時間周期,標明哪個顏色是哪個版本,空白的地方要寫出數據表現情況,分析數據變化原因,橫縱坐標要標出單位。

還有一點很重要:要列出你計算的公式。

因為很多公司衡量數據的指標是不一樣的,哪怕同樣一個名稱,比如DAU:有的公司DAU=UV、有的公司DAU大于UV、有的公司DAU小于UV,因為它統計的口徑不一樣,所以一定要標出數據指標。

四、注意事項

分析報告的輸出是整個分析過程的成果,是評定一個產品、一個運營事件的定性結論,很可能是產品決策的參考依據。

一份好的分析報告,有以下一些要點:

  1. 要有一個好的框架,像蓋房子一樣,好的分析肯定是有基礎有層次,基礎堅實,并且層次明了才能讓閱讀者一目了然,架構清晰、主次分明才能讓別人容易讀懂,這樣才讓人有讀下去的欲望;
  2. 好的分析要有很強的可讀性,這里是指易讀性,每個人都有自己的閱讀習慣和思維方式,寫東西時你總會按照自己的思維邏輯來寫,自己覺得很明白,別人不一定如此了解,要知道閱讀者往往只會花10分鐘以內的時間來閱讀,所以要考慮分析閱讀者是誰?他們最關心什么?必須站在讀者的角度去寫分析報告;
  3. 數據分析報告盡量圖表化,用圖表代替大量堆砌的數字會有助于人們更形象更直觀地看清楚問題和結論,當然,圖表也不要太多,過多的圖表一樣會讓人無所適從;
  4. 不要害怕或回避“不良結論”,分析就是為了發現問題,并為解決問題提供決策依據,發現產品問題,在產品缺陷和問題造成重大失誤前解決它也是分析的價值所在;
  5. 不要創造太多難懂的名詞,如果老板在看分析報告10分鐘內讓你三次解釋名詞,那么你寫出來的價值又在哪里呢,當然如果無可避免地要寫一些名詞,最好要有讓人易懂的“名詞解釋”。

以上就是一些基礎的數據分析要點,后續會繼續給大家分享使用案例,解釋每種數據分析方法如何使用。

 

本文由 @一顆小西紅柿? 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 期待具體案例分享

    來自上海 回復
    1. 感謝支持,我會繼續更新的

      來自北京 回復
  2. 剛入門的小白覺得很不錯,你收獲了點贊、收藏加關注三連

    來自北京 回復
    1. 感謝支持

      來自北京 回復