數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

11 評(píng)論 11645 瀏覽 61 收藏 12 分鐘

編輯導(dǎo)語(yǔ):在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)已經(jīng)公認(rèn)是一項(xiàng)重要的資產(chǎn)。元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù),如今也越來(lái)越多的出現(xiàn)在大眾視野中。但是對(duì)于元數(shù)據(jù)的概念、元數(shù)據(jù)有什么用、元數(shù)據(jù)該如何管理,非業(yè)內(nèi)人士可能理解的不夠清晰。本文中,作者將從以上幾個(gè)方面來(lái)介紹一下關(guān)于元數(shù)據(jù)的那些知識(shí)。

之前講解數(shù)據(jù)相關(guān)的基本概念的文章,提到了元數(shù)據(jù)。這篇文章將會(huì)展開(kāi)細(xì)講,主要分享我學(xué)習(xí)的過(guò)程、我的理解以及對(duì)全過(guò)程的總結(jié)。

一、為什么會(huì)接觸元數(shù)據(jù)

我所在的行業(yè),是教育信息化行業(yè)。

教育信息化1.0時(shí)代,國(guó)家提出要打造「三通兩平臺(tái)」,在國(guó)家政策引導(dǎo)下,教育局、學(xué)校采購(gòu)了大量的教學(xué)、管理類(lèi)軟硬件設(shè)備。

而教育信息化2.0時(shí)代,國(guó)家提出「三全兩高一大」的理念,繼續(xù)提高信息化系統(tǒng)的覆蓋率的同時(shí),強(qiáng)調(diào)了提高數(shù)據(jù)治理能力,尤其重視數(shù)據(jù)方面的綜合治理和利用。

簡(jiǎn)單來(lái)說(shuō),1.0時(shí)代解決了數(shù)據(jù)上網(wǎng)的問(wèn)題,2.0時(shí)代優(yōu)化數(shù)據(jù)上網(wǎng),并重點(diǎn)解決怎么用好數(shù)據(jù)的問(wèn)題。

基于政策背景,我司也制定了相關(guān)戰(zhàn)略,提出了打造大數(shù)據(jù)、數(shù)據(jù)治理類(lèi)產(chǎn)品。而元數(shù)據(jù)管理是數(shù)據(jù)治理的基礎(chǔ),作為產(chǎn)品設(shè)計(jì)者,我就接觸到了元數(shù)據(jù)。

二、初識(shí)元數(shù)據(jù),我被概念繞暈

接觸新概念,當(dāng)然先看定義。但是官方解釋?zhuān)雌饋?lái)像個(gè)套娃:「元數(shù)據(jù),是解釋數(shù)據(jù)的數(shù)據(jù)」。

接下來(lái),我又接觸到了元元數(shù)據(jù)、元模型等概念:「元元數(shù)據(jù),是定義元數(shù)據(jù)結(jié)構(gòu)和語(yǔ)義的信息」、「由元元數(shù)據(jù)組成的模型稱(chēng)之為元模型」。

當(dāng)時(shí)我腦子演繹了自問(wèn)自答的情景:

【問(wèn)】元數(shù)據(jù)它也是一種數(shù)據(jù),那解釋元數(shù)據(jù)的數(shù)據(jù),叫做什么?

【答】叫元元數(shù)據(jù),

【問(wèn)】那,是不是還有元元元數(shù)據(jù)?

【答】對(duì)!沒(méi)錯(cuò),講道理是的!

【問(wèn)】那,是不是…

【答】對(duì)!沒(méi)錯(cuò)!別給我沒(méi)完沒(méi)了的!打住!

看完這一圈概念,很容易聯(lián)想到”道生一, 一生二,二生三,三生萬(wàn)物”,很有哲學(xué)的味道??偟膩?lái)說(shuō),初接觸元數(shù)據(jù),非常抽象,有點(diǎn)懵。

三、元數(shù)據(jù)是什么?

借助例子理解一下:概念晦澀難懂,借助例子理解是一個(gè)不錯(cuò)的方式。網(wǎng)上很多文章也列舉了不少元數(shù)據(jù)的例子,比如奶茶上飲料上的營(yíng)養(yǎng)成分表。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

只有結(jié)合左邊和上邊的說(shuō)明,我們才能理解,每100g奶茶含能量166KJ。按照定義,「能量」、「每100g」 都是對(duì)數(shù)據(jù)166KJ的解釋說(shuō)明,這二者就是166KJ的元數(shù)據(jù)。

看完這樣的例子,一下子就能對(duì)元數(shù)據(jù)有了直觀(guān)的認(rèn)知。但是,我給小伙伴講完以后,小伙伴們反饋例子是一看就懂,但是換一個(gè)場(chǎng)景,還是有點(diǎn)懵,還是分不清哪里是元數(shù)據(jù),以及元數(shù)據(jù)要用來(lái)干嘛。

追根究底,是因?yàn)槎鄶?shù)人沒(méi)有用元數(shù)據(jù)解決問(wèn)題的體驗(yàn)。

四、產(chǎn)品經(jīng)理常見(jiàn)的兩類(lèi)元數(shù)

接下來(lái),我以產(chǎn)品經(jīng)理舉例,介紹元數(shù)據(jù)的兩大運(yùn)用場(chǎng)景。不同行業(yè),產(chǎn)品經(jīng)理所需的行業(yè)知識(shí)和技能不同,但是通常情況下,都會(huì)接觸兩類(lèi)人:業(yè)務(wù)人員、研發(fā)人員。

1. 業(yè)務(wù)元數(shù)據(jù)如何理解

作為產(chǎn)品,你大概率聽(tīng)過(guò)這些業(yè)務(wù)指標(biāo):PV、UV、DAU、MAU。

回想一下,初次接觸DAU這個(gè)英文縮寫(xiě)的時(shí)候,你肯定也不懂,經(jīng)過(guò)百度查詢(xún),你知道了DAU是指「每日活躍用戶(hù)數(shù)」。但是,因?yàn)闃I(yè)務(wù)不同,實(shí)際場(chǎng)景里,不同公司對(duì)于DAU「每日活躍用戶(hù)」的定義還有差異。

A公司的業(yè)務(wù)人員,將DAU定義為「每日用戶(hù)登錄次數(shù)」;B公司的業(yè)務(wù)人員,將DAU定義為「每天在平臺(tái)停留20分鐘以上用戶(hù)的數(shù)量」。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

業(yè)務(wù)人員結(jié)合實(shí)際需要,對(duì)數(shù)據(jù)作了”定義”,用以溝通交流時(shí)進(jìn)行“解釋”。這些定義和解釋?zhuān)褪菢I(yè)務(wù)語(yǔ)義下的元數(shù)據(jù),即「業(yè)務(wù)元數(shù)據(jù)」。

2. 技術(shù)元數(shù)據(jù)如何理解

系統(tǒng)需要技術(shù)人員實(shí)現(xiàn),所有的數(shù)據(jù)都是經(jīng)過(guò)系統(tǒng)處理和存儲(chǔ)的。

A公司的研發(fā)人員理解了DAU的業(yè)務(wù)語(yǔ)義后,便要負(fù)責(zé)定義DAU在系統(tǒng)中計(jì)算、存儲(chǔ)的格式和約束,如下:

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

這段的含義是,DAU的數(shù)據(jù)類(lèi)型是int。研發(fā)人員為什么要定義這個(gè)呢?

其實(shí)這樣是按照程序語(yǔ)言的規(guī)范,定義了一個(gè)計(jì)算機(jī)能懂的數(shù)據(jù)類(lèi)型,這個(gè)信息將會(huì)經(jīng)過(guò)層層編譯,變成計(jì)算機(jī)能理解的形式。

下一次,當(dāng)收到一個(gè)數(shù)據(jù)類(lèi)型不為int的DAU數(shù)據(jù)時(shí),計(jì)算機(jī)就能夠識(shí)別,進(jìn)而按照研發(fā)小哥設(shè)定的邏輯進(jìn)行相應(yīng)的處理,比如提示或報(bào)錯(cuò)。

技術(shù)人員因?yàn)榫幋a需要,也對(duì)數(shù)據(jù)作了”定義”。技術(shù)語(yǔ)義下的元數(shù)據(jù),即「技術(shù)元數(shù)據(jù)」。

3. 元數(shù)據(jù)類(lèi)型如何定義

大家會(huì)發(fā)現(xiàn),不同的標(biāo)準(zhǔn)、不同的組織對(duì)元數(shù)據(jù)有不同的分類(lèi),很多初學(xué)者經(jīng)常被搞暈:說(shuō)的都不完全相同,到底有多少種元數(shù)據(jù),應(yīng)該掌握哪些元數(shù)據(jù)?

元數(shù)據(jù)的類(lèi)型取決于在什么場(chǎng)景、面向什么人作解釋?zhuān)獢?shù)據(jù)的類(lèi)型,不是被事先定義出來(lái)的,而是根據(jù)使用場(chǎng)景進(jìn)行的歸類(lèi),任何人都可以按需要定義新的元數(shù)據(jù)類(lèi)型。

五、為什么要管理元數(shù)據(jù)

先看看一個(gè)極端的例子:一個(gè)程序員在網(wǎng)上聊天,有一天,別人問(wèn)他,你是程序員嗎?

程序員本能反應(yīng),立刻就回了一個(gè)「true」。但是對(duì)方不懂編程,也不懂英語(yǔ),一陣交涉,最終明白:原來(lái)很多程序語(yǔ)言里,true就等同于「是」。

奇葩說(shuō)里馬東說(shuō):“被誤解是表達(dá)者的宿命”,當(dāng)然被誤解絕對(duì)不是表達(dá)者的希望的結(jié)果,為了盡可能不被誤解,我們要用好元數(shù)據(jù)進(jìn)行解釋。

人們要合作,要交流,要理解對(duì)方表達(dá)的意思,而元數(shù)據(jù)就是溝通和理解的橋梁。

六、元數(shù)據(jù)怎么管

知道了what,why,接下來(lái)就要弄清楚how,怎么管理元數(shù)據(jù)。

以往,做人事、貨物管理系統(tǒng),這些系統(tǒng)管理的對(duì)象都是現(xiàn)實(shí)生活中存在的,但是要做一個(gè)元數(shù)據(jù)管理系統(tǒng),元數(shù)據(jù)如此抽象,該怎么設(shè)計(jì)?

在建學(xué)生管理系統(tǒng)前,我們會(huì)定義學(xué)生實(shí)體的屬性,即”學(xué)生模型”,學(xué)生:姓名,性別,年齡…

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

同樣的道理,元數(shù)據(jù)也是根據(jù)實(shí)際場(chǎng)景定義屬性,元數(shù)據(jù)會(huì)有通用的屬性,比如名稱(chēng)、類(lèi)型。不同類(lèi)型的元數(shù)據(jù)還會(huì)有自己特定的屬性,比如下圖中的儲(chǔ)蓄匯總表元數(shù)據(jù),有匯總金額和網(wǎng)點(diǎn)號(hào)兩個(gè)屬性。

數(shù)據(jù)產(chǎn)品核心概念之元數(shù)據(jù)

元數(shù)據(jù)既然也是數(shù)據(jù),肯定是存儲(chǔ)在數(shù)據(jù)庫(kù)中的。元數(shù)據(jù)存儲(chǔ)庫(kù)是指存儲(chǔ)元數(shù)據(jù)的物理數(shù)據(jù)庫(kù)表,通常采用開(kāi)放標(biāo)準(zhǔn)的關(guān)系型數(shù)據(jù)庫(kù)平臺(tái)實(shí)現(xiàn)元數(shù)據(jù)存儲(chǔ)庫(kù)。

至于為什么選用關(guān)系型數(shù)據(jù)庫(kù),這里就不展開(kāi)講了。

七、寫(xiě)在最后

元數(shù)據(jù)早就存在了我們生活中,只是我們用「元數(shù)據(jù)」這個(gè)詞代指了這一類(lèi)解釋其他事物的事物。

當(dāng)你問(wèn)別人,XXX是什么,是什么意思,后續(xù)別人給的回答和解釋?zhuān)鋵?shí)就是「無(wú)形的元數(shù)據(jù)」,當(dāng)這些解釋落到紙面的時(shí)候,就成了「有形的元數(shù)據(jù)」。

學(xué)習(xí)元數(shù)據(jù)的初期,我看了很多文獻(xiàn),被各種概念按在地上反復(fù)摩擦。通過(guò)不斷地理解和實(shí)踐,終于沖破了混沌,有了一定的理解。

復(fù)盤(pán)這段過(guò)程,有失有得。

我花費(fèi)了很多時(shí)間研究概念,而忘了自己為什么要研究概念。其實(shí),一直看元數(shù)據(jù)概念反而會(huì)迷失在其中,將數(shù)據(jù)平臺(tái)搭建起來(lái),最終能把數(shù)據(jù)用起來(lái),便能體會(huì)其中奧義。

為了鉆研概念,我搜集了非常多的資料,提升了資料搜尋能力,元數(shù)據(jù)是數(shù)據(jù)產(chǎn)品的核心概念,這也為我后續(xù)理解數(shù)據(jù)產(chǎn)品的其他概念打好了基礎(chǔ)。

實(shí)踐是檢驗(yàn)真理的唯一途徑,也是探索、理解真理的唯一途徑。實(shí)在弄不懂一個(gè)概念,那就去實(shí)踐理解吧,你總會(huì)有頓悟的那一刻。

參考資料:

【1】艾中良,麥中凡,朱美正;元數(shù)據(jù)和元模型[A];2001全國(guó)軟件技術(shù)研討會(huì)[C];2001年

【2】數(shù)據(jù)治理之元數(shù)據(jù)管理實(shí)踐[OL]

【3】元數(shù)據(jù)新型存儲(chǔ)架構(gòu)的探索[OL]

【4】數(shù)據(jù)產(chǎn)品經(jīng)理實(shí)戰(zhàn)進(jìn)階-8.3元數(shù)據(jù)管理

【5】被誤解是表達(dá)者的宿命[OL] 2018-11-07?

 

作者:lee;公眾號(hào):樂(lè)說(shuō)樂(lè)言

本文由 @lee 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自?Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 咋感覺(jué)元數(shù)據(jù)就是數(shù)據(jù)表的說(shuō)明捏?標(biāo)明了每列數(shù)據(jù)的數(shù)據(jù)類(lèi)型、意義、不同情況的處理方式等等?元元數(shù)據(jù)又在表說(shuō)明上再提升了一層,用表在對(duì)已有的表進(jìn)一步說(shuō)明??

    來(lái)自海南 回復(fù)
  2. 請(qǐng)問(wèn)業(yè)務(wù)元數(shù)據(jù)和數(shù)據(jù)標(biāo)準(zhǔn)中的業(yè)務(wù)術(shù)語(yǔ)有沒(méi)有關(guān)系呢

    來(lái)自四川 回復(fù)
  3. 看了這篇文章,總算是搞清楚啥是元數(shù)據(jù)了,不再糾結(jié)于晦澀的感念,真爽!

    來(lái)自湖南 回復(fù)
  4. 我還是沒(méi)理解元元數(shù)據(jù)和元模型的概念

    來(lái)自湖北 回復(fù)
    1. 沒(méi)理解的話(huà),就不糾結(jié)啦,先搞其他的事~

      來(lái)自廣東 回復(fù)
  5. 寫(xiě)的非常易懂!

    回復(fù)
    1. 感謝感謝~

      來(lái)自廣東 回復(fù)
  6. 如何理解元數(shù)據(jù)方案?

    回復(fù)
    1. 元數(shù)據(jù)管理方案?

      回復(fù)
  7. 最近也一直不太理解具體元數(shù)據(jù)是什么意思,今天看后深有啟發(fā)

    來(lái)自海南 回復(fù)
    1. 歡迎交流~

      來(lái)自廣東 回復(fù)