淺談數字化轉型中的數據展現、分析和合規問題
編輯導語:2021年是數據隱私保護的元年,這一年以來,隱私的保護受到了重視。企業在數字化轉型中也應當注重隱私數據是否合乎規定,不泄露他人信息。本文列舉了幾個案例,分析數據對產品的價值以及我們需要明確的問題。
一、從“數據駕駛艙”和“大屏”談起
不知道是不是電動汽車在國內更普及的原因,越來越多的國內項目招標的時候,都模擬電動車的設計,規劃了“數據駕駛艙”或者“大屏”的需求。令人尋味的是,這種項目里最貴的不是軟件,而是硬件,是LED的屏幕(各位不了解行情的,可以自行翻一翻相關材料)。
可想而知,LED屏幕或者駕駛艙是需要一個至少幾百平的大匯報廳去布置。軟件里最貴的,不是SQL語句,而是UI設計。我能夠理解“數據駕駛艙”和“大屏”在數字化轉型過程中,門面的地位和作用。在這里,“UI設計”實際上應該稱為“室內設計”,需要和大廳的裝潢相適應。
我并不是在吐槽,因為確實這個場館正常也要安裝LED屏幕,不算是浪費。但這種趨勢實際上是代表了硬件項目,由軟件廠商做總集成的現實。這種現實的背后,是經營主體更加重視數據化轉型,數據在業務經營中的重要性的地位在不斷地提高。
往下再探一層,其實我們會發現,數字化轉型在國內,仍然處在一個非常初級的階段。這個表現就是經營主體花了大量的成本在“數據駕駛艙”和“大屏”,錯誤的把“數據展現層”的應用當成了“數據決策層”的應用。
我講得更直白一點,業務決策根本不需要“數據駕駛艙”和“大屏”。
二、“中國式報表”的隱憂
除了“數據駕駛艙”和“大屏”,還有一個很有意思的設計是“中國式報表”。就是你不能說這個BI沒用,你只能說這種報表讓數據更華麗了。但數據就是數據,從來沒有人會認為穿著“高級定制”的數據質量更好。
“中國式報表”呈現了一種冗余設計,核心表現是表格復雜,信息量大,表頭混亂。為了做表而做一張表,是不是很像為了加班而加班的我們?
“中國式報表”的問題在于,缺少對問題的預判和分析結論。就好像寫論文,沒寫開題報告、論點和結論,只有論證。大而全的報表內容,承認了繁重的工作量,但卻不解決問題。
很多和數據有關的產品,成了“呈現原始數據”的產品,而不是“聚焦+決策”的產品。這也是經營主體,在在數字化轉型中,數據中心“建了不如不建”的原因所在。
三、實現數據aPaaS能力的美好愿望
夯實數據能力的關鍵,是快速“聚焦+決策”問題。于是,有人想到在報表的能力上,增加“數據模板”和“實時報表”兩個模塊,這是很多自助型報表工具誕生的原因。
把復雜問題聚焦在幾張主題報表上,只關心和主題相關的數據,把中國式報表作為數據源,通過“托拉拽”完成數據的可持續化的運營。這里面產品售賣的就不僅僅是數據采集和加工,同時也看產品方對行業數據的理解能力。
讓客戶主動“托拉拽”可能是一個美好的愿望,這種產品教育,可不是打打字就能很快完成的。aPaaS的模式可能還要很長一段時間,才能成為主要選項被大家認可。業務方需要定制化產品的情況,還會持續。
總之,在產品初期階段,我想至少應該有簡單主題數據模板的能力,這種產品才能商業化。
四、描述數據質量的三個維度
從BI分析像技術底層部分觀察,“大數據計算”這個詞已經被售前們用爛了,各個公司張口閉口就是大數據計算和人工智能,殊不知產品只有幾個核心讀寫庫,技術水平、運營能力都難上桌面。
大數據最基本的衡量指標應該是數據量、準確性和實時性。數據量是處理能力,數據庫級別的處理能力,和數據集群分庫分表的難度是不一樣的,這是第一個難度級。
準確性是指數據采集和清洗的能力,這個能力可能是和RPA技術相關,可能是和IoT技術相關,也可能是和接口標準的組織能力相關,這是第二個難度級。
最后,實時性是反應在數據實時計算、實時查詢的能力。分析型數據庫的性能、成本控制、數據結構的設計是第三個難度級。
數據的質量是數據分析的基礎,“大數據計算”能力雖然不懂行的人不會深究,但是對照看來,很多廠商其實都“掛羊頭賣狗肉”。能力就處在數據庫的存取+篩選排序的程度。很難說這樣的公司具備大數據解決方案的能力。
五、“接口費”和產品化的矛盾
另一個經常遇到的問題是,有一些行業有“接口費”這一說,基本上是負責核心業務服務商的遺留問題。
有的項目里,數據源的對接是很大一塊成本。我見過一個老的核心產品的核心收入就全部都是接口費。對于這種額外成本,目前這個階段很難避免,新的下游的業務完全依賴產生數據的核心業務系統,而核心業務系統基本上是被業務廠家綁架的狀態,換也換不掉,也無法順利升級,就是一個接一個的收“接口費”。
在之前的文章里,有講到產品要做到業務的上游和下游去,在數據源上,也要爭取數據源的上游和下游的拓展。核心業務系統,就是核心產生數據,數據量最大的業務。“接口費”和產品化的矛盾可能只有在核心業務被其他業務系統蠶食的那一天,才能避免。
六、產品不提供算法到底行不行
數據量在時間的統計尺度下,積累3~5年才可能會有算法的需求。所以時間尺度下,數據沒有積累,是基本上不用考慮依靠算法去提高產品競爭力的。
在有了3~5年歷史數據積累的情況下,還要再判斷這個業務算法,解決的是存量問題還是增量問題。存量問題就是和過去3~5年變量一致的樣本數據,增量問題就是需要依靠新的變量做預測的業務。算法很難對增量問題測得準,需要依靠關鍵崗位的關鍵判斷,才能準確產出。
所以產品可以有算法,但沒必要過分關注算法,有時候程序和流程的優化效果會遠遠大于算法帶來的價值。
七、2021年是數據隱私保護元年
從數據呈現、決策,講到數據技術和算法,最后這部分是數據采集的合規性。2021年我會把這一年定義成“數據隱私保護”的元年。《中華人民共和國數據安全法》和《中華人民共和國個人信息保護法》兩個重要法規,均在2021年正式生效。
凡是和數據沾邊的開發者,都應該守好數據合規的底線,數據保護是開發者、業務方、使用者共擔責任,任何人不能以任何理由,在當事人未經許可的情況下,擅自收集或泄露私密數據。
目前聽到很多“多邦安全計算”、“隱私計算”等等技術,都沒有很明確的合規定義。建議所有數據產品開發者,審慎看待數據業務,在法律允許的范圍內開展業務,不漠視數據安全的風險,一絲不茍做好數據安全“等?!?/p>
八、寫在最后
定義好客戶是產品價值的原動力,明確你的客戶是誰很重要,明確你的客戶的客戶是誰,更重要。
#專欄作家#
稀奇先生,公眾號:稀奇星球,人人都是產品經理專欄作家。擁有十余種標準化產品規劃經驗,7年TO G業務老兵、智能化解決方案產品專家。
本文原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0
不是很明白,我的理解,簡單主題數據的模板,不就是由多個相同主題的“數據模板”和“實時報表”構成的嗎?不管是主題模板還是駕駛艙/大屏, 并不一定是原始數據的展示,最起碼有一部分是分析后的數據展示,這個不就是聚焦決策,為決策提供幫助的嗎
分析很到位?? 數改就是要跟管理決策綁一起,單純的數據工具不能發揮核心價值
“aPaaS的模式可能還要很長一段時間,才能成為主要選項被大家認可?!边@句話說得對