數(shù)據(jù)產(chǎn)品的數(shù)據(jù)更新機制

1 評論 8413 瀏覽 19 收藏 8 分鐘

編輯導語:數(shù)據(jù)產(chǎn)品,是指可以發(fā)揮數(shù)據(jù)價值去輔助用戶更優(yōu)的做決策(基至行動)的一種產(chǎn)品形式。它在用戶的決策和行動過程中,可以充當信息的分析展示者和價值的使能者。那么,數(shù)據(jù)產(chǎn)品的數(shù)據(jù)更新機制到底是怎樣的呢?本文作者為我們做出了解答。

一、背景

對于數(shù)據(jù)產(chǎn)品來說,核心包括數(shù)據(jù)更新、數(shù)據(jù)質控、數(shù)據(jù)查看、數(shù)據(jù)查詢、數(shù)據(jù)應用、數(shù)據(jù)導出等幾個大的方面。而數(shù)據(jù)更新是其中重要一環(huán)。只有新數(shù)據(jù)源源不斷的進入,整個數(shù)據(jù)庫才會變成活庫,才會更有意義。

以我熟悉的醫(yī)療科研數(shù)據(jù)庫為例。某醫(yī)院的專病科研數(shù)據(jù)庫在建立之初,醫(yī)院提供了50位患者的前10次就診記錄的原始病歷數(shù)據(jù),數(shù)據(jù)經(jīng)過處理和用戶確認以后進入數(shù)據(jù)庫。

針對該疾病,患者在生存狀態(tài)下會繼續(xù)進行復診。如果后續(xù)就診數(shù)據(jù)不納入到系統(tǒng)中來,醫(yī)生將無法了解該患者的疾病進展,在做進一步的醫(yī)學研究時可能恰好需要患者后續(xù)疾病進展情況。

例如,研究患者所服用新藥對某個疾病的影響,由于缺乏進一步的就診數(shù)據(jù)支撐,致使該患者的數(shù)據(jù)在該科研課題下無法被使用。該患者數(shù)據(jù)的價值將會縮減。

相反,如果患者記錄數(shù)量和患者就診次數(shù)不斷增加,該數(shù)據(jù)庫可以支撐的醫(yī)療科研方向將更廣泛。

同時由于數(shù)據(jù)量的增加,得出的科研結論也更加具有說服力。同時還可以拓寬科研方向,不只是做回顧性研究,還支持前瞻性研究。

數(shù)據(jù)更新是針對已有數(shù)據(jù)而言的,指的是針對同一條數(shù)據(jù)記錄,新數(shù)據(jù)項替換數(shù)據(jù)庫中與之對應的已有數(shù)據(jù)項,或者在已有數(shù)據(jù)記錄的基礎上增加新的數(shù)據(jù)記錄。

共有四種形式,新增數(shù)據(jù)記錄,完善數(shù)據(jù),修改數(shù)據(jù),刪除數(shù)據(jù)。

1. 新增數(shù)據(jù)記錄

指的是,在數(shù)據(jù)表中新增一條全新的數(shù)據(jù)記錄,新增數(shù)據(jù)記錄必然帶來ID的增長。

例如:患者表中有100位患者,新增一個患者,則會在患者表中插入一個新的數(shù)據(jù)記錄,ID也會隨之增長。

2. 完善數(shù)據(jù)

指的是,對于某條數(shù)據(jù)的某個字段,該字段原值為空,將該空值填入數(shù)據(jù)的過程。

例如:患者張三的“醫(yī)保類型”字段為空,填入數(shù)據(jù)“商業(yè)保險”。

3. 修改數(shù)據(jù)

指的是,針對數(shù)據(jù)庫中有值的字段,將該字段的值從A改為B的過程。

例如:將患者張三的“醫(yī)保類型”,從“商業(yè)保險”改成“城鎮(zhèn)職工醫(yī)保”

4. 刪除數(shù)據(jù)

指的是,針對數(shù)據(jù)庫中有值的字段,將該字段的值改成空的過程。

例如:將患者張三的“醫(yī)保類型”字段的內容從“城鎮(zhèn)職工醫(yī)保”改成空。

在新增數(shù)據(jù)記錄、完善數(shù)據(jù)、修改數(shù)據(jù)、刪除數(shù)據(jù)的過程中,如果所有數(shù)據(jù)操作均由程序做出決策,則程序采取同一種策略處理,要么全部接受插入,要么全部拒絕插入;要么全部使用新值,要么全部使用舊值。

因為每條數(shù)據(jù)的前后文語境不同,有的數(shù)據(jù)需要接受插入,有的數(shù)據(jù)需要拒絕插入。

統(tǒng)一的處理策略,必然會導致部分數(shù)據(jù)錯誤。而程序不具備識別上下語境的能力。所以只能將決策的工作交給用戶,由用戶根據(jù)每條數(shù)據(jù)的前后文來對每一條數(shù)據(jù)進行單獨決策,從而確保數(shù)據(jù)的準確性。

例如:張三的“臨床診斷”字段已有數(shù)據(jù)是“肺小細胞肺癌”,待入庫數(shù)據(jù)是“肺鱗癌”。

此時兩個數(shù)據(jù)出現(xiàn)了不一致,無論用新值還是舊值都有可能造成數(shù)據(jù)的錯誤。進一步造成科研結論的不準確。此時就需要人工去查看該患者的就診信息,來決策該患者的臨床診斷。而程序是無法完成該項工作的。

由于系統(tǒng)采取統(tǒng)一的策略來處理數(shù)據(jù),從而帶來的數(shù)據(jù)準確性的問題。該問題產(chǎn)生的原因是未能將決策權交給用戶。所以需要在恰當?shù)臅r機引入人工決策,以確保數(shù)據(jù)準確性。

二、解決方案

當批量數(shù)據(jù)入庫時,觸發(fā)數(shù)據(jù)更新機制。數(shù)據(jù)更新過程中,遇到數(shù)據(jù)沖突或者清空時,才引入人工決策機制。

1. 數(shù)據(jù)沖突

指的是,針對某數(shù)據(jù)項,已有數(shù)據(jù)中有值,待入庫的數(shù)據(jù)也有值,但是兩個值不一致。

當數(shù)據(jù)產(chǎn)生沖突時,如果系統(tǒng)強制使用新值或者原值,將有可能造成數(shù)據(jù)的錯誤。并且程序無法判斷原值是正確的數(shù)據(jù),還是現(xiàn)值是正確的數(shù)據(jù),需要將該決策告知用戶。

用戶可以執(zhí)行接受新值、拒絕新值的操作。接受新值后,新值將進入數(shù)據(jù)庫。

拒絕新值后,則不對舊數(shù)據(jù)做任何操作。如果用戶不作任何決策,在用戶查看數(shù)據(jù)詳情時,再次給予提示,否則該數(shù)據(jù)記錄處于只讀狀態(tài),不允許編輯。直到用戶做出決策。

2. 數(shù)據(jù)清空

指的是,針對某數(shù)據(jù)項,已有數(shù)據(jù)中有值,待入庫的數(shù)據(jù)中沒有值。

當某項數(shù)據(jù)需要清空時,如果系統(tǒng)強制直接清空,將有可能造成正確的數(shù)據(jù)被誤刪。同時,也有可能原值是錯誤的。但是程序無法判斷數(shù)據(jù)的正確與否,需要將該決策告知用戶。

用戶可以執(zhí)行接受刪除或拒絕刪除的操作。接受刪除后,該值將會被置空。

拒絕刪除后,則不對舊數(shù)據(jù)做任何操作。如果用戶不作任何決策,在用戶查看數(shù)據(jù)詳情時,該數(shù)據(jù)記錄處于只讀狀態(tài)。并且再次予以提示,直到用戶做出決策。

 

本文由 @申bobo 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 如果用戶不作任何決策,在用戶查看數(shù)據(jù)詳情時,該數(shù)據(jù)記錄處于只讀狀態(tài)。并且再次予以提示,直到用戶做出決策。—–意思這個提示會一直緊緊提示性的存在,是不是對某些關鍵性數(shù)據(jù)也可以采取強制性的提示,必須做出決策后才能改變數(shù)據(jù)記錄狀態(tài)。

    來自浙江 回復