如何理解主題域?

0 評論 1157 瀏覽 0 收藏 4 分鐘

我們可以將主題域看作多個主題的合集。那么,為什么要劃分主題域?主題域和數倉分層又有什么關系?這篇文章里,作者嘗試進行了解答,一起來看。

前面介紹了數倉為啥要分層?那為啥要劃分主題域?這倆有啥區別?

一、啥是主題域?

啥是主題?

回想我們小時候學習語文做的題目“總結這篇文章的中心思想”、“以‘夢想’為主題去寫一篇作文”;去參加論壇,一般都可以從論壇海報上了解此次論壇的主題;去看展覽,我們也能早早知道展覽的主題是什么。

所以在文學作品中主題是作者所表達的中心意思,它滲透、貫穿于文章的全部內容。主題在不同的領域中也有著不同的定義和解釋,在數據領域中,主題是從較高層次,根據對業務的宏觀認知或使用習慣抽象出的能表達某類相同含義的數據合集。

主題域就是多個主題的合集。

二、為啥要劃分主題域?

在數倉中,對數據進行了分層處理,合理的存儲了一堆數據,但數據最終是要拿出去用的,要面向業務的。

此時用戶是業務人員,核心動作是找數據。

如果沒有主題劃分,面對海量數據,應該怎么查找呢,通過表名?記不住,也理解不了。就像你的衣服一樣,以面料,加工工藝來區分衣服,那記得頭發都要掉光了。

既然是給業務人員使用,那么就應該以業務能夠理解的方式去組織和劃分數據,業務過程就成了主題劃分的依據。就比如服飾可以劃分為春裝,秋裝,帽子,首飾等,然后分類存放,這樣才比較好找,不至于找不到還翻得亂七八糟。

三、與分層有啥關系?

數倉分層是從存儲,從管理角度對數據進行組織,是縱向空間上的劃分。

主題域劃分是從使用,從業務的角度對數據進行組織,是橫向業務上的劃分。

大概就是魔方的那種感覺吧。

四、如何劃分主題域?

主題域的劃分沒有特定的方法論??梢允强陀^的,也可以是主觀的。

  • 按照業務過程劃分:劃分主題域的前提,先理清業務過程,根據業務過程去抽象出主題,比如瀏覽,曝光,點擊,都屬于用戶行為的業務過程,就可以抽象成流量主題。
  • 按照部門劃分:比如傳統企業的人資、財務、物資、項目等主題。

看看同行是怎么劃分的:搜索一下同行劃分的主題域,結合公司實際的業務情況,取其精華去其糟粕。

總之:主題域劃分的目的是快速找到數據,所以主題域劃分的重點是和最終用戶去商討確定,看看什么樣的劃分結構用戶更容易理解,并用發展的眼光去看待主題域的建設。

本文由 @清小墨 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!