數據產品經理——平臺架構知識加持讓你更專業
“數據產品經理角色有很多種,要處理的問題也有多方面,想做好數據產品工作,最基礎要做到比用戶更懂系統,比研發更懂用戶。”
01
一個好的數據產品經理在工作中一定是在不斷地做角色切換,但是能讓你角色切換自如的基礎一定是你夠專業,對于工作中遇到的問題能快速響應并解決。作為數據產品經理,用戶和研發是我們的主要客戶,解決他們的問題占了我們日常工作的很大一部分。相信你經常會遇到以下問題:
1. 用戶
“我用excel直接透視很快就能計算完成的表,你們怎么就做不了呢?為什么做不了,你能給個理由嗎,還是就是你們不想做?”
“你別跟我說這是業務系統的問題,我的表是你們開發的,數據有問題我不找你們找誰?”
“這個數據取不到,跟我們有什么關系啊,取不到你們就想辦法去取啊?!?/p>
“這么簡單的一個東西你們做出來還需要一周的時間?你搞錯了吧? ”
2. 研發
“這個指標計算邏輯就不合理啊,不能這么做,我做不出來。”
“這個表指標邏輯很復雜,我需要兩周。為什么?因為研發過程很困難啊!跟你說了你也不懂,你就跟用戶說搞不出來就行了?!?/p>
“我跟你說過啊,這個數據出不來不是我們的原因,你去找業務系統那邊的人解決?!?/p>
面對上述用戶和研發提出的這些問題,如果數據產品經理不知道如何處理,那你可能經常被懟的手足無措,產品研發工作推進滯后,然而責任還都是你的。
02
怎么辦呢?細看下上述問題,如果你了解一些開發相關的知識,清楚數據產品研發過程,你就會清楚為什么有些問題必須要業務系統先解決;你也能判斷開發預估的研發時間是否合理;你甚至能直接跟開發提供一個解決方案,從被動接受轉變為主動規劃。
對開發知識的了解,建議你先從平臺架構開始,一般很少有人會主動去跟你介紹平臺的架構,大家都覺得這是開發要清楚的事,所以很多數據產品很容易就讓自己對于某個問題陷入模棱兩可狀態。了解數據平臺架構不僅讓你輕松解決上述問題,同時讓你能提前預見研發過程中可能存在的問題及難點,并在做產品設計環節甚至內容規劃環節就能考慮到風險點并提前規劃解決方案。
03
數據平臺架構,網上查一下就有很多相關的書籍資料,不過每個人的接受和理解程度不一樣,接下來我會以數據產品經理的角度基于日常遇到的問題進行歸納總結,希望能對大家有幫助。
在公司業務規摸小,產生數據量少的時候,對于數據的需求都是直接從業務系統數據庫直接取數,并沒有數據平臺架構的概念,但隨著數據量的增多,數據分析需求與日俱增,公司開始組建大數據團隊,搭建數據平臺。
數據平臺架構從數據流向來看,簡單來說分為三大層:源系統數據層、ODS層、數據倉庫層、大數據平臺應用層。
具體框架如圖所示:
1. 業務系統層
在業務層面,大數據平臺本身不產生數據,所有數據均來自于各業務系統,以零售行業來說,如銷售訂單數據、商品信息、商品庫存數據、會員信息等數據。
2. ODS層
ODS層翻譯過來是指操作性數據存儲,是介于業務系統數據庫和數據倉庫之間的一種數據存儲形態,數據從業務系統抽取至ODS層,一般不會做處理,與源系統數據保持一致,這樣就降低了數據抽取過程中數據轉化的復雜性。
之所以有ODS層,目的是為了在業務系統和數據倉庫之間形成一個隔離層,同時轉移一部分業務系統細節查詢的功能。在建立數據倉庫之前,數據都是直接從業務系統提取,隨著數據量和指標復雜性增強,對業務系統產生了比較大的壓力,有了ODS層之后,這部分的需求就可以直接在ODS層進行。
3. 數據倉庫層
數據倉庫以ODS層數據為基礎,通過一定的邏輯轉換輸出表。基于數據集成程度不同,數據倉庫的表也分為三個層次:基礎數據層,主題大寬表、數據集市層。
基礎數據層
基礎數據層的數據是基于ODS層數據進行輕度匯總,產生出一定的明細表。譬如商品相關的主要信息譬如商品的大中小分類、商品供應商信息、商品配送信息等在業務系統里面分散在不同的表中,數據倉庫將這些數據進行匯總成商品主數據,后面跟商品相關的信息的則可以直接查詢。
大寬表主題層
大寬表主題層的數據來自于ODS層和基礎數據層,在這一層,會將業務數據按主題劃分聚合集成。譬如分析商品時,一般業務會將商品庫存作為一個主題去分析,在這一層,開發會將商品庫存相關的數據按一定的維度及指標進行聚合。譬如商品在門店、各倉庫的現在庫存、在途庫存、調撥庫存、在單庫存等,報表一般會到最細顆粒(商品、倉庫庫位)。
數據集市層
數據集市層出的表及字段一般都是直接按用戶需求出表,基于基礎數據層和大寬表主題層報表進行進一步的高度集成,譬如用戶需要分析不同大類的商品庫存金額、庫存數量,開發則會將商品主數據和商品庫存表上部分字段按一定邏輯進行聚合生成用戶需求報表。
4. 數據應用展現層
數據倉庫開發完成用戶需求報表數據后,通過大數據平臺應用層展現給用戶查詢使用。當然大數據平臺的內容很多,這里我們只按數據流向說明數據平臺的應用功能。
上述為根據數據流向解析的大數據平臺架構,平臺搭建和實際開發過程中肯定更為復雜,其中數據倉庫的建設與研發同事對于業務的理解和報表數據結構的規劃有很大關系,但是作為數據產品經理,能清楚這個數據開發過程就能解決我們工作中的很多問題了。
04
1. 作為數據產品經理,日常工作中會遇到很多問題需要你有一定的開發只是作為基礎去解決,清楚大數據平臺架構,理解數據開發過程和流向能讓我們更專業地解決上述問題。
2. 大數據平臺架構體現的數據研發過程以及平臺建設過程,按數據流向來看能助你更好的理解:數據分布在產生數據的業務系統,大數據平臺抽過來通過一定邏輯集成、組合并生成用戶需求數據。
3. 下次面對用戶或者研發的問題,你可以這樣回,譬如:
“你別跟我說這是業務系統的問題,我的表是你們開發的,數據有問題我不找你們找誰?”
——我們數據平臺不產生數據的,基礎數據都來自于業務系統,這個指標數據有誤,是因為業務系統那邊對應的基礎數據有誤,我也問了他們產品經理,原因是您所在部門負責維護這個字段的人維護數據有誤。
“這個表指標邏輯很復雜,我需要兩周。為什么?因為研發過程很困難??!跟你說了你也不懂,你就跟用戶說搞不出來就行了?!?/p>
——我已經問了另一個同事,這個指標對應的基礎數據已經全部從業務系統抽取過來了,并有相應基礎數據大寬表,指標對應字段你都是可以直接取數的,請問難度要兩周的原因在哪里呢?
作者:王小涂,微信公眾號:數據產品經理進階之路(ID:DATAPMLZ)希望和你一起探討數據產品經理進階之路!
本文由 @王小涂 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
怎么保證交易數據準確
大家期待已久的《數據產品經理實戰訓練營》終于在起點學院(人人都是產品經理旗下教育機構)上線啦!
本課程非常適合新手數據產品經理,或者想要轉崗的產品經理、數據分析師、研發、產品運營等人群。
課程會從基礎概念,到核心技能,再通過典型數據分析平臺的實戰,幫助大家構建完整的知識體系,掌握數據產品經理的基本功。
學完后你會掌握怎么建指標體系、指標字典,如何設計數據埋點、保證數據質量,規劃大數據分析平臺等實際工作技能~
現在就添加空空老師(微信id:anne012520),咨詢課程詳情并領取福利優惠吧!
謝謝作者!
此前在公司內部培訓聽過數據集市產品的講解,當時沒上心,也就對這一塊有了大致概念。文章中內容偏基礎,但概念說的挺清晰的,作者加油。