表格改變字段時,該如何兼容歷史數據?

3 評論 7676 瀏覽 62 收藏 15 分鐘

當原有產品無法滿足當前業務發展時,有時候我們會通過改動表格中的字段設計滿足業務新需要、服務新場景。而改動“數據表格”的字段很容易引發數據沖突的情況,所以我們有必要去解決“表格改變字段”后產生的數據沖突,去兼容歷史數據,減少改動對數據產生的負面影響。那么問題來了,我們該怎么去兼容歷史數據呢?

業務是不斷變化發展的,產品也是會隨之不停迭代的,數據表格作為基本組件也常常需要變動,這在我們的日常工作中是非常常見的。

比如下面這個例子,一款分析淘寶商家移動端店鋪數據的產品,其中菜單“流量來源”是對店鋪流量的分析,在店鋪發展初期“淘內免費”、“付費流量”、“自主訪問”能夠支撐業務方對于店鋪數據的分析,但是隨著店鋪業務不斷發展做大做強,對于流量分析的顆粒度要求越來越細,只是對流量的簡單劃分已經無法滿足業務方的需求。希望能對于淘內流量能有更細的分類,幫助業務方對店鋪流量有更細致的了解,從而根據不同流量大小調整運營策略,促進店鋪銷售數據的發展。

  • 現狀:淘內免費 付費流量 自主訪問
  • 期望:手淘搜索 我的淘寶 淘內免費其他 手淘微淘 手淘掃一掃等
  • 需求:改動“流量來源”數據表格中的字段

當原有產品無法滿足當前的業務發展時,為了滿足業務的新需要,服務于新的場景。不得不要求我們去改變最初的產品設計,改動表格中的字段設計。而改動“數據表格”的字段很容易引發數據沖突的情況,包括數據類型沖突、數據格式沖突等。

如果在改動表格字段時,不去考慮數據沖突的影響,不去考慮如何兼容歷史數據,會導致產品內的數據在完整性和一致性上出現問題,比如上文中案例如果不進行歷史數據兼容處理,選擇在3.19號上線新的統計功能,關于流量的劃分就會存在兩種不一樣的統計方式,19號前的流量數據劃分方式和19號之后不一致,按月維度下沒有辦法對3月的流量數據做一個統一劃分。

歷史數據一定意義上成為了“臟數據”,有句話說的好叫“垃圾數據進垃圾數據出”,數據質量對于分析結果的重要性甚至高于分析方式和模型?;烊肱K數據后產出的結果對業務造成嚴重的影響,甚至做出了錯誤的決策,帶來不可磨滅的損失

因此,我們有必要去解決“表格改變字段”后產生的數據沖突,去兼容歷史數據,減少改動對數據產生的負面影響。那么問題來了,我們該怎么去兼容歷史數據呢?

01 歷史數據都是需要保留的嗎

表格改變字段出現數據沖突的情況后,在我們去兼容歷史數據之前可以先思考一個問題:歷史數據都是需要保留的嗎?一起來看下下面的兩個場景。

場景1

某電商to b產品,在一次迭代中,對“店鋪銷售”菜單增加了“客單價”字段,那么歷史數據中的客單價對我們有意義嗎?

場景2

我們設計了一套問卷用于統計“國內大學生的不同專業的就業情況”,投放問卷一段時間后對問題就行了修改,那么收集的歷史數據對我們還有意義嗎?

通過兩個具體的場景,我們可以發現“歷史數據”在不同的場景下的保留策略是不同的:

場景1中的“客單價”能幫助復盤店鋪歷史的客單價情況,和當前時間的“客單價”進行對比,對店鋪策略起到數據指導作用,在此場景下歷史數據具有重要意義,需要保留。

而場景2中收集的“你的國家是什么”和場景題干“國內大學生”矛盾,問卷的修改也是為了解決這一矛盾才修改題目的,所以該題目收集來的歷史數據無效,不需要保留可以直接廢棄。

歷史數據是對過去業務情況的記錄和反饋,但并不是所有的歷史數據都是有意義的,也不是所有歷史數據都需要保留的。當需要考慮歷史數據兼容問題前,建議先從實際的場景出發去分析一下“歷史數據”對于業務的價值和意義,如果關聯不大或者本身就是錯誤的數據,直接廢棄歷史數據就OK了。對于要保留的歷史數據,才需要去考慮沖突在哪里,以及怎么去兼容

02 怎么去兼容歷史數據

在我們思考了歷史數據的價值和意義之后,確定要保留歷史數據,那么我們怎么去兼容歷史數據呢?首先,我們需要區分不同的數據表格改變方式,會帶來怎么樣的數據沖突,再根據不同的沖突情況去提出相對應的兼容方案

1. 增加字段

我們經常會遇到在表格上“增加字段”的情況,比如增加了新的業務字段,增加了新的統計項。

如果不做兼容處理,就會出現增加的字段有增加后的新數據,但是沒有歷史數據。這種情況下,需要我們判斷歷史數據能否被補全,若能,則補全歷史數據;若無法補全,新增的字段歷史數據空白展示。

2. 減少字段

當出現“減少字段”的情況,如果不做處理,會出現減少的字段沒有新數據,但是有歷史數據。這種情況下,我們的處理方式是保留歷史數據,減少統計后該字段空白展示。

3. 原字段統計邏輯或規則改變

統計邏輯或規則被改變時,不進行數據兼容的話,因為新數據和歷史數據的統計方式不一致,會導致數據結果出現差異。這個時候,需要我們去判斷歷史數據能否按新的統計邏輯換算,若能,則按新邏輯重新統計;若不能保留歷史數據,并記錄統計邏輯的改變記錄。

4. 原字段下鉆或合并統計

這種改變會出現新字段和歷史字段是包含或者被包含的關系,需要我們去補全歷史數據,比如字段A被下鉆成了新字段B+新字段C,根據下鉆規則補全新字段B和C的歷史數據值。

而在實際的場景中,數據沖突會同時存在多種,所采用的方案也是多個解決手段組合的。

比如下面這個案例,我們對“客戶管理”模塊進行迭代,通過調研發現內部銷售團隊希望能在“客戶管理”菜單中增加“客戶微信”字段,并提供根據客戶等級自動計算出“下次回訪時間”,為此我們對“客戶管理”的字段進行了調整。

表格改動為:增加“客戶微信”、“下次回訪時間”字段,減少“創建時間”字段。這里就涉及到了“增加字段”和“減少字段”兩種情況,通過分析“客戶微信”和“下次回訪”字段對存量客戶具有重要意義,收集到客戶的微信聯系方式和具體的回訪時間,方便業務員展開業務,兩個字段的數據也有被補全的條件;而減少的“創建時間”字段對于業務影響不大,可以廢棄?;谏厦娴目紤],我們對“客戶管理”菜單做了如圖處理。

迭代發布上線后,產品同學提出“下次回訪時間”直接展示時間,對銷售團隊來說不夠直觀,可以對“下次回訪時間”進一步處理,更加直接明了,因為“下次回訪時間”字段中原有的時間格式是支持現在的規則換算的,就可以對時間進行了換算處理。

對“下次回訪時間”的展示進行處理,計算“下次回訪時間”和當前時間的差值:

  • 原統計格式:yyyy-mm-dd
  • 新統計格式:X天后回訪;已過期X天

隨著業務的發展又遇到了“字段統計邏輯和規則無法轉化”的情況,“客戶管理”中“意向產品”的可選項從“商品1,商品2,商品3”變成了“商品5,商品6,商品7”,改動前后的數據沒有辦法去簡單的進行兼容,而前后數據對于業務來說都是具有意義的,那么我們需要在保留兩者數據格式的前提下,做一些文案上的提示,例如在操作日志記錄系統對于規則的更改。

從上面這個案例中我們發現,表格的變動不單單只有出現一種沖突,我們采取的解決方案也是多樣的。

03 兼容歷史數據的價值和場景

表格字段的改動會導致歷史數據和改動后數據的沖突,而數據沖突會導致在產品層面的數據沒有連貫性,進一步導致了用戶無法理解前后數據,對產品產生了疑問,以至于產生了負面情緒。

簡單的對表格字段進行增減,對于用戶的影響相對于較少,降低了用戶對數據的可讀性,比如上文案例中增加減少字段,不做處理的話,用戶會對部分情況有數據部分情況無數據產生疑惑增加了理解成本。

但是對于更改統計邏輯的,就不只是簡單用戶體驗上的問題了,會給業務帶來實際的影響,比如上文中意向產品中可選擇的產品變更了,如果不及時對于歷史數據進行兼容,做相關的變動說明處理,很容易給業務員帶來之前的商品仍然可以進行銷售的誤判,最終導致下錯訂單甚至下單后無法發貨,給公司業務帶來實質的虧損

由此可見,兼容歷史數據的價值,在于解決這一系列的數據沖突,既保證了產品層面的數據連貫性,也讓用戶了解到數據變動的原因,降低了用戶的負面情緒和理解成本。更重要的是,不僅可以 能幫助用戶復盤業務情況,對業務起到指導作用,而且避免事故和損失的發生

但是兼容歷史數據也不是在所有場景都適用的,當我們涉及到的改動非常大的時候,比如業務發生巨大的變化導致原有表格字段全部推翻重新設計時,就不建議采用上文的兼容方案,可以選擇新老數據交替過渡,原有的表格提供對老數據的支持,新建一個表格用于支持新字段的展示,通過這種方式,完成從歷史存量業務到新業務的過渡;又比如整體項目需要重構,可以選擇數據遷移方案

現在當我們再次遇到歷史數據沖突需要兼容的情況時,可以判斷如何選擇了嗎?

 

本文由 @晌午 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 請問當新建項目表單頁增加了一個必填字段,歷史數據無法統一賦值時該如何處理,如果為空又不能滿足必填要求

    來自香港 回復
    1. 個人建議看下歷史數據下的該“必填字段”是否有業務意義,如果有的話,需要進行歷史數據的補全;如果沒有的話,是不是可以考慮歷史數據展示空,當對歷史數據進行重新編輯時才需要填寫該字段

      來自浙江 回復
    2. 謝謝解答~,受教了

      來自香港 回復