數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)
編輯導(dǎo)語(yǔ):在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)已經(jīng)公認(rèn)是一項(xiàng)重要的資產(chǎn)。元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù),如今也越來(lái)越多的出現(xiàn)在大眾視野中。但是對(duì)于元數(shù)據(jù)的概念、元數(shù)據(jù)有什么用、元數(shù)據(jù)該如何管理,非業(yè)內(nèi)人士可能理解的不夠清晰。本文中,作者將從以上幾個(gè)方面來(lái)介紹一下關(guān)于元數(shù)據(jù)的那些知識(shí)。
之前講解數(shù)據(jù)相關(guān)的基本概念的文章,提到了元數(shù)據(jù)。這篇文章將會(huì)展開(kāi)細(xì)講,主要分享我學(xué)習(xí)的過(guò)程、我的理解以及對(duì)全過(guò)程的總結(jié)。
一、為什么會(huì)接觸元數(shù)據(jù)
我所在的行業(yè),是教育信息化行業(yè)。
教育信息化1.0時(shí)代,國(guó)家提出要打造「三通兩平臺(tái)」,在國(guó)家政策引導(dǎo)下,教育局、學(xué)校采購(gòu)了大量的教學(xué)、管理類(lèi)軟硬件設(shè)備。
而教育信息化2.0時(shí)代,國(guó)家提出「三全兩高一大」的理念,繼續(xù)提高信息化系統(tǒng)的覆蓋率的同時(shí),強(qiáng)調(diào)了提高數(shù)據(jù)治理能力,尤其重視數(shù)據(jù)方面的綜合治理和利用。
簡(jiǎn)單來(lái)說(shuō),1.0時(shí)代解決了數(shù)據(jù)上網(wǎng)的問(wèn)題,2.0時(shí)代優(yōu)化數(shù)據(jù)上網(wǎng),并重點(diǎn)解決怎么用好數(shù)據(jù)的問(wèn)題。
基于政策背景,我司也制定了相關(guān)戰(zhàn)略,提出了打造大數(shù)據(jù)、數(shù)據(jù)治理類(lèi)產(chǎn)品。而元數(shù)據(jù)管理是數(shù)據(jù)治理的基礎(chǔ),作為產(chǎn)品設(shè)計(jì)者,我就接觸到了元數(shù)據(jù)。
二、初識(shí)元數(shù)據(jù),我被概念繞暈
接觸新概念,當(dāng)然先看定義。但是官方解釋?zhuān)雌饋?lái)像個(gè)套娃:「元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù)」。
接下來(lái),我又接觸到了元元數(shù)據(jù)、元模型等概念:「元元數(shù)據(jù),是定義元數(shù)據(jù)結(jié)構(gòu)和語(yǔ)義的信息」、「由元元數(shù)據(jù)組成的模型稱(chēng)之為元模型」。
當(dāng)時(shí)我腦子演繹了自問(wèn)自答的情景:
【問(wèn)】元數(shù)據(jù)它也是一種數(shù)據(jù),那解釋元數(shù)據(jù)的數(shù)據(jù),叫做什么?
【答】叫元元數(shù)據(jù),
【問(wèn)】那,是不是還有元元元數(shù)據(jù)?
【答】對(duì)!沒(méi)錯(cuò),講道理是的!
【問(wèn)】那,是不是…
【答】對(duì)!沒(méi)錯(cuò)!別給我沒(méi)完沒(méi)了的!打住!
看完這一圈概念,很容易聯(lián)想到”道生一, 一生二,二生三,三生萬(wàn)物”,很有哲學(xué)的味道??偟膩?lái)說(shuō),初接觸元數(shù)據(jù),非常抽象,有點(diǎn)懵。
三、元數(shù)據(jù)是什么?
借助例子理解一下:概念晦澀難懂,借助例子理解是一個(gè)不錯(cuò)的方式。網(wǎng)上很多文章也列舉了不少元數(shù)據(jù)的例子,比如奶茶上飲料上的營(yíng)養(yǎng)成分表。
只有結(jié)合左邊和上邊的說(shuō)明,我們才能理解,每100g奶茶含能量166KJ。按照定義,「能量」、「每100g」 都是對(duì)數(shù)據(jù)166KJ的解釋說(shuō)明,這二者就是166KJ的元數(shù)據(jù)。
看完這樣的例子,一下子就能對(duì)元數(shù)據(jù)有了直觀(guān)的認(rèn)知。但是,我給小伙伴講完以后,小伙伴們反饋例子是一看就懂,但是換一個(gè)場(chǎng)景,還是有點(diǎn)懵,還是分不清哪里是元數(shù)據(jù),以及元數(shù)據(jù)要用來(lái)干嘛。
追根究底,是因?yàn)槎鄶?shù)人沒(méi)有用元數(shù)據(jù)解決問(wèn)題的體驗(yàn)。
四、產(chǎn)品經(jīng)理常見(jiàn)的兩類(lèi)元數(shù)
接下來(lái),我以產(chǎn)品經(jīng)理舉例,介紹元數(shù)據(jù)的兩大運(yùn)用場(chǎng)景。不同行業(yè),產(chǎn)品經(jīng)理所需的行業(yè)知識(shí)和技能不同,但是通常情況下,都會(huì)接觸兩類(lèi)人:業(yè)務(wù)人員、研發(fā)人員。
1. 業(yè)務(wù)元數(shù)據(jù)如何理解
作為產(chǎn)品,你大概率聽(tīng)過(guò)這些業(yè)務(wù)指標(biāo):PV、UV、DAU、MAU。
回想一下,初次接觸DAU這個(gè)英文縮寫(xiě)的時(shí)候,你肯定也不懂,經(jīng)過(guò)百度查詢(xún),你知道了DAU是指「每日活躍用戶(hù)數(shù)」。但是,因?yàn)闃I(yè)務(wù)不同,實(shí)際場(chǎng)景里,不同公司對(duì)于DAU「每日活躍用戶(hù)」的定義還有差異。
A公司的業(yè)務(wù)人員,將DAU定義為「每日用戶(hù)登錄次數(shù)」;B公司的業(yè)務(wù)人員,將DAU定義為「每天在平臺(tái)停留20分鐘以上用戶(hù)的數(shù)量」。
業(yè)務(wù)人員結(jié)合實(shí)際需要,對(duì)數(shù)據(jù)作了”定義”,用以溝通交流時(shí)進(jìn)行“解釋”。這些定義和解釋?zhuān)褪菢I(yè)務(wù)語(yǔ)義下的元數(shù)據(jù),即「業(yè)務(wù)元數(shù)據(jù)」。
2. 技術(shù)元數(shù)據(jù)如何理解
系統(tǒng)需要技術(shù)人員實(shí)現(xiàn),所有的數(shù)據(jù)都是經(jīng)過(guò)系統(tǒng)處理和存儲(chǔ)的。
A公司的研發(fā)人員理解了DAU的業(yè)務(wù)語(yǔ)義后,便要負(fù)責(zé)定義DAU在系統(tǒng)中計(jì)算、存儲(chǔ)的格式和約束,如下:
這段的含義是,DAU的數(shù)據(jù)類(lèi)型是int。研發(fā)人員為什么要定義這個(gè)呢?
其實(shí)這樣是按照程序語(yǔ)言的規(guī)范,定義了一個(gè)計(jì)算機(jī)能懂的數(shù)據(jù)類(lèi)型,這個(gè)信息將會(huì)經(jīng)過(guò)層層編譯,變成計(jì)算機(jī)能理解的形式。
下一次,當(dāng)收到一個(gè)數(shù)據(jù)類(lèi)型不為int的DAU數(shù)據(jù)時(shí),計(jì)算機(jī)就能夠識(shí)別,進(jìn)而按照研發(fā)小哥設(shè)定的邏輯進(jìn)行相應(yīng)的處理,比如提示或報(bào)錯(cuò)。
技術(shù)人員因?yàn)榫幋a需要,也對(duì)數(shù)據(jù)作了”定義”。技術(shù)語(yǔ)義下的元數(shù)據(jù),即「技術(shù)元數(shù)據(jù)」。
3. 元數(shù)據(jù)類(lèi)型如何定義
大家會(huì)發(fā)現(xiàn),不同的標(biāo)準(zhǔn)、不同的組織對(duì)元數(shù)據(jù)有不同的分類(lèi),很多初學(xué)者經(jīng)常被搞暈:說(shuō)的都不完全相同,到底有多少種元數(shù)據(jù),應(yīng)該掌握哪些元數(shù)據(jù)?
元數(shù)據(jù)的類(lèi)型取決于在什么場(chǎng)景、面向什么人作解釋?zhuān)獢?shù)據(jù)的類(lèi)型,不是被事先定義出來(lái)的,而是根據(jù)使用場(chǎng)景進(jìn)行的歸類(lèi),任何人都可以按需要定義新的元數(shù)據(jù)類(lèi)型。
五、為什么要管理元數(shù)據(jù)
先看看一個(gè)極端的例子:一個(gè)程序員在網(wǎng)上聊天,有一天,別人問(wèn)他,你是程序員嗎?
程序員本能反應(yīng),立刻就回了一個(gè)「true」。但是對(duì)方不懂編程,也不懂英語(yǔ),一陣交涉,最終明白:原來(lái)很多程序語(yǔ)言里,true就等同于「是」。
奇葩說(shuō)里馬東說(shuō):“被誤解是表達(dá)者的宿命”,當(dāng)然被誤解絕對(duì)不是表達(dá)者的希望的結(jié)果,為了盡可能不被誤解,我們要用好元數(shù)據(jù)進(jìn)行解釋。
人們要合作,要交流,要理解對(duì)方表達(dá)的意思,而元數(shù)據(jù)就是溝通和理解的橋梁。
六、元數(shù)據(jù)怎么管
知道了what,why,接下來(lái)就要弄清楚how,怎么管理元數(shù)據(jù)。
以往,做人事、貨物管理系統(tǒng),這些系統(tǒng)管理的對(duì)象都是現(xiàn)實(shí)生活中存在的,但是要做一個(gè)元數(shù)據(jù)管理系統(tǒng),元數(shù)據(jù)如此抽象,該怎么設(shè)計(jì)?
在建學(xué)生管理系統(tǒng)前,我們會(huì)定義學(xué)生實(shí)體的屬性,即”學(xué)生模型”,學(xué)生:姓名,性別,年齡…
同樣的道理,元數(shù)據(jù)也是根據(jù)實(shí)際場(chǎng)景定義屬性,元數(shù)據(jù)會(huì)有通用的屬性,比如名稱(chēng)、類(lèi)型。不同類(lèi)型的元數(shù)據(jù)還會(huì)有自己特定的屬性,比如下圖中的儲(chǔ)蓄匯總表元數(shù)據(jù),有匯總金額和網(wǎng)點(diǎn)號(hào)兩個(gè)屬性。
元數(shù)據(jù)既然也是數(shù)據(jù),肯定是存儲(chǔ)在數(shù)據(jù)庫(kù)中的。元數(shù)據(jù)存儲(chǔ)庫(kù)是指存儲(chǔ)元數(shù)據(jù)的物理數(shù)據(jù)庫(kù)表,通常采用開(kāi)放標(biāo)準(zhǔn)的關(guān)系型數(shù)據(jù)庫(kù)平臺(tái)實(shí)現(xiàn)元數(shù)據(jù)存儲(chǔ)庫(kù)。
至于為什么選用關(guān)系型數(shù)據(jù)庫(kù),這里就不展開(kāi)講了。
七、寫(xiě)在最后
元數(shù)據(jù)早就存在了我們生活中,只是我們用「元數(shù)據(jù)」這個(gè)詞代指了這一類(lèi)解釋其他事物的事物。
當(dāng)你問(wèn)別人,XXX是什么,是什么意思,后續(xù)別人給的回答和解釋?zhuān)鋵?shí)就是「無(wú)形的元數(shù)據(jù)」,當(dāng)這些解釋落到紙面的時(shí)候,就成了「有形的元數(shù)據(jù)」。
學(xué)習(xí)元數(shù)據(jù)的初期,我看了很多文獻(xiàn),被各種概念按在地上反復(fù)摩擦。通過(guò)不斷地理解和實(shí)踐,終于沖破了混沌,有了一定的理解。
復(fù)盤(pán)這段過(guò)程,有失有得。
我花費(fèi)了很多時(shí)間研究概念,而忘了自己為什么要研究概念。其實(shí),一直看元數(shù)據(jù)概念反而會(huì)迷失在其中,將數(shù)據(jù)平臺(tái)搭建起來(lái),最終能把數(shù)據(jù)用起來(lái),便能體會(huì)其中奧義。
為了鉆研概念,我搜集了非常多的資料,提升了資料搜尋能力,元數(shù)據(jù)是數(shù)據(jù)產(chǎn)品的核心概念,這也為我后續(xù)理解數(shù)據(jù)產(chǎn)品的其他概念打好了基礎(chǔ)。
實(shí)踐是檢驗(yàn)真理的唯一途徑,也是探索、理解真理的唯一途徑。實(shí)在弄不懂一個(gè)概念,那就去實(shí)踐理解吧,你總會(huì)有頓悟的那一刻。
參考資料:
【1】艾中良,麥中凡,朱美正;元數(shù)據(jù)和元模型[A];2001全國(guó)軟件技術(shù)研討會(huì)[C];2001年
【2】數(shù)據(jù)治理之元數(shù)據(jù)管理實(shí)踐[OL]
【3】元數(shù)據(jù)新型存儲(chǔ)架構(gòu)的探索[OL]
【4】數(shù)據(jù)產(chǎn)品經(jīng)理實(shí)戰(zhàn)進(jìn)階-8.3元數(shù)據(jù)管理
【5】被誤解是表達(dá)者的宿命[OL] 2018-11-07?
作者:lee;公眾號(hào):樂(lè)說(shuō)樂(lè)言
本文由 @lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自?Unsplash,基于 CC0 協(xié)議
咋感覺(jué)元數(shù)據(jù)就是數(shù)據(jù)表的說(shuō)明捏?標(biāo)明了每列數(shù)據(jù)的數(shù)據(jù)類(lèi)型、意義、不同情況的處理方式等等?元元數(shù)據(jù)又在表說(shuō)明上再提升了一層,用表在對(duì)已有的表進(jìn)一步說(shuō)明??
請(qǐng)問(wèn)業(yè)務(wù)元數(shù)據(jù)和數(shù)據(jù)標(biāo)準(zhǔn)中的業(yè)務(wù)術(shù)語(yǔ)有沒(méi)有關(guān)系呢
看了這篇文章,總算是搞清楚啥是元數(shù)據(jù)了,不再糾結(jié)于晦澀的感念,真爽!
我還是沒(méi)理解元元數(shù)據(jù)和元模型的概念
沒(méi)理解的話(huà),就不糾結(jié)啦,先搞其他的事~
寫(xiě)的非常易懂!
感謝感謝~
如何理解元數(shù)據(jù)方案?
元數(shù)據(jù)管理方案?
最近也一直不太理解具體元數(shù)據(jù)是什么意思,今天看后深有啟發(fā)
歡迎交流~