Google 26億美元收購,Looker產(chǎn)品有何魅力?

0 評論 4345 瀏覽 3 收藏 18 分鐘

本文將對 Looker 進(jìn)行更高層次的回顧和分析,并剖析它的功能與優(yōu)缺點。

本文翻譯自 Holistic 的產(chǎn)品博客,作者是其聯(lián)合創(chuàng)始人兼首席設(shè)計師 Thanh Dinh。

Holistic 是一家建立于 2015 年的國外 BI 廠商,在新加坡,越南,印尼等地設(shè)有辦公室。今年上半年 Looker 被 Google高價收購的消息漫天飛揚(yáng),卻沒有找到一篇中文文章介紹 Looker 產(chǎn)品本身,遂起了翻譯本文之心。

原文意在對 Looker 及其優(yōu)缺點進(jìn)行全面分析。在流行的商業(yè)智能(BI)工具中,Looker 以其創(chuàng)新的數(shù)據(jù)建模和探索方法而獨(dú)樹一幟。在這篇文章中,我們將對 Looker 進(jìn)行更高層次的回顧和分析,它的功能以及它的優(yōu)缺點。

匯總

Looker 是一種創(chuàng)新產(chǎn)品,采用了獨(dú)特的 BI 方法。Looker 擁有自己的專有建模語言,稱為 LookML,這是 Looker 的強(qiáng)項,但有趣的是,這也成為了它的弱項。它提供了既可重用又可維護(hù)的數(shù)據(jù)建模層,但其陡峭的學(xué)習(xí)曲線使其比其他競品更難上手。

Looker 最適合經(jīng)驗豐富的數(shù)據(jù)團(tuán)隊。他們欣賞其獨(dú)特的數(shù)據(jù)建模方法和其允許組織中的每個人自己對數(shù)據(jù)進(jìn)行切片和切塊(Slice&Dice)的功能。它還需要一個現(xiàn)有的數(shù)據(jù)倉庫,對于已經(jīng)建設(shè)完畢的數(shù)據(jù)團(tuán)隊來說更加友好。

隨意跳到最感興趣的部分,我們將在這里涵蓋以下主題:

  • 數(shù)據(jù)連接器(Data Connectors)
  • 使用LookML數(shù)據(jù)建模
  • 數(shù)據(jù)探索及可視化
  • 下鉆和鉆透(Drilldowns and Drill-throughs)
  • 數(shù)據(jù)混合(Data Blending)
  • 數(shù)據(jù)交付和調(diào)度(Data Delivery and Scheduling)
  • 使用Looker管理組織
  • 訪問控制和權(quán)限管理
  • 數(shù)據(jù)準(zhǔn)備功能
  • 定價
  • 結(jié)論

一、數(shù)據(jù)連接器

與其他任何 BI 工具一樣,在 Looker 中,您需要立即設(shè)置與數(shù)據(jù)源的連接。作為基于 SQL 的 BI 工具,遺憾的是,Looker 僅支持 SQL 數(shù)據(jù)庫。從好的方面來說,它所支持的數(shù)據(jù)源列表相當(dāng)不錯,從常見的RDBMS(如Oracle,Microsoft SQL Server)到晦澀的 Denden 和 XtremeData。

可用的高級選項數(shù)量也令人印象深刻,其中包括最大連接數(shù)和連接池超時等選項。但是,最好將這些選項隱藏在“高級”復(fù)選框的后面,以使表單不太混亂和令人生畏。

二、使用LookML

一個能立即將 Looker 與其他選擇區(qū)分開來的操作要求是:在任何數(shù)據(jù)可視化之前需要先花時間進(jìn)行數(shù)據(jù)建模。對于 Looker 而言,這意味著首先要在 LookML 中學(xué)習(xí)并準(zhǔn)備建模工作,作為對 SQL 數(shù)據(jù)庫的抽象。

1. LookML 概念

這是 Looker 文檔中 LookML 的定義:

LookML 是一種用于描述 SQL 數(shù)據(jù)庫中的維度,聚合,計算和數(shù)據(jù)關(guān)系的語言。

在Looker 中最重要的概念是視圖(Views),探索(Explores)和模型(Models) ,他們被直接建模在 LookML 中。

2. 視圖

在 Looker 中, 視圖是一組鏈接到物理表或派生表的字段。這些字段又分為兩種類型:維度和度量(Dimensions & Measures)。你可以將維度視為數(shù)據(jù)庫表中的列以及以這些列繪制的計算字段,將應(yīng)用了 SQL 聚合(總和/平均/最小/最大/等)的列作為度量。(譯者注:類似于數(shù)據(jù)采集和清洗)

3. 探索

Looker 稱可查詢的「視圖」為「探索」?!柑剿鳌箷暶髋c其他視圖的關(guān)系(稱為 Joins),并用作查詢的起點,或者在 SQL 術(shù)語中,它是 FROM子 句中引用的表的起點。(譯者注:類似于數(shù)據(jù)計算和連接)

4. 模型

Looker 將「模型」稱為數(shù)據(jù)庫的自定義門戶。本質(zhì)上,它是一組相關(guān)的視圖和探索,可以與業(yè)務(wù)用戶共享以提供拖放式(Drag-and-Drop)數(shù)據(jù)探索。(譯者注:類似于設(shè)計報表的可視化)

Looker 的三步數(shù)據(jù)建模過程從定義視圖開始,到利用表間關(guān)系將視圖合并為探索,然后結(jié)合探索聯(lián)結(jié)成模型來共享給業(yè)務(wù)方。

5. 使用 LookML 定義視圖,探索和模型

開發(fā)模式與生產(chǎn)模式

Looker 在數(shù)據(jù)建模過程中區(qū)分開發(fā)模式和生產(chǎn)模式。開發(fā)模式允許您創(chuàng)建和編輯LookML 項目,而生產(chǎn)模式允許企業(yè)用戶瀏覽創(chuàng)建的 LookML 模型。當(dāng)您只想完成事情時,將兩種模式分開會使用戶感到乏味。但是這樣做的好處是,您可以在業(yè)務(wù)用戶可用的內(nèi)容和仍在開發(fā)的內(nèi)容之間清楚地區(qū)分。

GIT集成

Git 是一個分布式版本控制系統(tǒng),程序員廣泛使用它來管理源代碼。Looker 的獨(dú)特之處在于,它迫使您使用 Git 來管理 LookML 項目。您可以在不具有 Git 集成的開發(fā)模式下使用 Looker,但是如果要與業(yè)務(wù)用戶共享并在生產(chǎn)模式下進(jìn)行數(shù)據(jù)瀏覽,則必須設(shè)置 Git。

對于 Looker 這種版本控制方法,意見兩極分化。經(jīng)驗豐富的分析師將贊賞像 Git 這種版本控制系統(tǒng)的可維護(hù)性和靈活性。對于不熟悉 Git 的分析師,您將需要學(xué)習(xí)Git 概念(例如提交,分支等),以充分了解整個工作流程。這涉及的學(xué)習(xí)曲線可能對帶來普通用戶本能性的強(qiáng)烈抵抗,搞不清為什么他們需要經(jīng)過這么復(fù)雜的操作才能進(jìn)行數(shù)據(jù)建模。

LOOKML編輯器

為了開始數(shù)據(jù)建模過程,Looker 為您提供了一個基于 Web 的文本編輯器來開發(fā)LookML。

該編輯器具有代碼編輯器期望的標(biāo)準(zhǔn)功能,例如自動完成功能,甚至在您遇到麻煩時甚至支持 Vim/Emacs 鍵綁定??焖賻椭鷤?cè)欄非常有用,因為否則您將需要不斷查閱 Looker 的官方文檔站點。

編輯的經(jīng)驗還不錯,但是最糟糕的是漫長的反饋循環(huán)。與 PowerBI 等其他工具不同,在該工具中,您可以即時查看建模過程的每一步,而在 Looker 中,您需要真正了解自己在做什么:輸入正確的規(guī)則,單擊“驗證”按鈕,然后單擊“保存”按鈕,嘗試使用創(chuàng)建的模型探索數(shù)據(jù)以進(jìn)行驗證,然后修改并重復(fù)。一路上任何錯誤的步驟都將需要您重新開始循環(huán)。根據(jù)我們的經(jīng)驗,與其他類似工具相比,此缺點是 Looker 數(shù)據(jù)建模產(chǎn)品中最薄弱的部分。

三、數(shù)據(jù)探索和可視化

一旦在 LookML 中定義了視圖和探索,用戶現(xiàn)在就可以開始在 Looker Explore 中進(jìn)行自助式數(shù)據(jù)探索。為此,您可以從左側(cè)欄中選擇感興趣的字段,然后單擊“ 運(yùn)行” 按鈕?!付ㄎ弧拱粹o很簡單,但不是很直觀,因為您需要單擊要定位的字段按鈕再進(jìn)行選擇,而不是像 Excel 中那樣將字段拖到列/行框中。

使用 Looker 的數(shù)據(jù)瀏覽功能一段時間后,您將開始意識到實際上是在運(yùn)行 SQL 查詢構(gòu)建器。Looker 使用您的輸入并將其與基礎(chǔ)視圖/探索設(shè)置預(yù)先結(jié)合起來,以生成并執(zhí)行最終的 SQL 查詢,以將數(shù)據(jù)返回給您。

使用 Looker 進(jìn)行數(shù)據(jù)可視化時,您會注意到的第一件事是,每次更改內(nèi)容時都需要手動單擊“運(yùn)行”按鈕。這是 Looker 工作方式的結(jié)果:只要您更改數(shù)據(jù)可視化配置,便會生成一個新的SQL查詢。當(dāng)您熟悉其他提供即時反饋而不必重新運(yùn)行查詢的BI工具時,你會發(fā)現(xiàn)Looker 的設(shè)計雖然合乎邏輯但是很煩人。

在可視化方面,Looker 的產(chǎn)品尚可使用,但不能與 Tableau 甚至 PowerBI 或QlikView 之類的產(chǎn)品相匹配。它通過標(biāo)準(zhǔn)自定義支持大約15種不同類型的圖表,例如調(diào)色板,系列類型(折線,面積,散布等)和其他常見的可疑對象。

探索完成后,您可以將單個探索保存到 Looker 所謂的 Look,或?qū)⒁唤M Looks 保存到儀表板。

四、鉆取和鉆透

與 Looker 中的幾乎所有其他內(nèi)容一樣,您需要使用 LookML 定義鉆取。熟悉Looker的工作方式后,它非常直觀。(譯者注:鉆取指的是根據(jù)維度的下級維度或關(guān)聯(lián)維度下鉆,鉆透則是連接到相關(guān)的報表或其他可視化形式)

您設(shè)置了一組字段,當(dāng)您對某個特定維度或度量進(jìn)行深入鉆取時,這些字段將公開。

現(xiàn)在,當(dāng)選擇“訂購商品計數(shù)”度量時,您可以在該字段下鉆取。

例如,當(dāng)您單擊圖表中的列時,將鉆取相應(yīng)的度量“訂單項計數(shù)”,并觸發(fā)其鉆取字段(“產(chǎn)品ID”和“產(chǎn)品名稱”),并返回新的結(jié)果集:

單擊在“從這里瀏覽”中,將為您提供一個新的瀏覽窗口,其中預(yù)先選擇了“產(chǎn)品ID”和“產(chǎn)品名稱”:

從上面的示例中,我們可以看到由于其強(qiáng)大的數(shù)據(jù)建模層,Looker 的向下鉆取很容易設(shè)置并提供流暢直觀的用戶體驗。

五、數(shù)據(jù)混合

Looker 通過「合并結(jié)果」的概念支持?jǐn)?shù)據(jù)混合。它像結(jié)果集之間的 SQL 連接一樣工作,甚至跨數(shù)據(jù)庫也是如此。

為了使用它,您將需要使用「探索」來生成結(jié)果集。完成后,您可以從菜單中單擊“合并結(jié)果…”:

然后,您將需要添加另一個結(jié)果集(Looke r將其稱為「查詢」)以將其合并到原始結(jié)果集中。

您可以添加多個查詢以合并,但是您需要將一組查詢作為主查詢。

我認(rèn)為合并結(jié)果與 Looker 進(jìn)行數(shù)據(jù)建模的方式不合時宜,盡管如此,它仍使用戶能夠很好地處理常見的用例。

六、數(shù)據(jù)交付和調(diào)度

Looker 提供了不錯的數(shù)據(jù)交付內(nèi)容,如下面的截圖所示。您可以通過電子郵件,webhooks,Amazon S3 或 SFTP 服務(wù)器發(fā)送數(shù)據(jù)結(jié)果。

您甚至可以使用“高級”選項創(chuàng)建自定義警報,僅在結(jié)果集為空或自上次運(yùn)行以來結(jié)果發(fā)生更改時才發(fā)送結(jié)果集。

七、使用 Looker 管理組織

使用 BI 工具一段時間后,隨著您開始擁有龐大的外觀和儀表板,事情變得越來越難管理。為了簡化管理,Looker 提供了一項稱為“空間”的功能?;旧?,“空間”是一個允許您存儲外觀和儀表板的容器。一個空間也可以包含其他空間,從而可以創(chuàng)建類似于文件系統(tǒng)工作方式的分層文件夾結(jié)構(gòu)。

空間也用于權(quán)限和訪問控制,這將在下一節(jié)中詳細(xì)介紹。

八、訪問控制和權(quán)限管理

與其他 BI 工具相比,Looker 具有一組相當(dāng)健壯和完善的功能來支持訪問控制和權(quán)限管理。Looker 有 3 種訪問類型:

  • 內(nèi)容訪問:控制訪問和管理 Spaces 的權(quán)限
  • 數(shù)據(jù)訪問:控制用戶可以查看哪些數(shù)據(jù)。這通過對過濾器的限制完成
  • 功能訪問:控制用戶可以在 Looker 中執(zhí)行的操作類型。這通過創(chuàng)建具有特定權(quán)限的自定義角色并將這些角色分配給特定用戶來完成
  • 對于具有現(xiàn)有身份驗證基礎(chǔ)結(jié)構(gòu)的公司,Looker 還集成了LDAP和SAML。我們還沒有機(jī)會進(jìn)行嘗試,但是如果您的組織已經(jīng)使用這些技術(shù)進(jìn)行身份驗證,那當(dāng)然是一個加分點。

    從 Looker 的訪問控制和權(quán)限管理設(shè)計中,我們可以清楚地看到,Looker 的目標(biāo)是針對具有復(fù)雜需求的企業(yè)客戶,因為它的系統(tǒng)似乎對較小的組織來說有點高射炮打蚊子的意思。

    九、數(shù)據(jù)準(zhǔn)備功能

    Looker 不提供數(shù)據(jù)準(zhǔn)備功能,而是依靠其合作伙伴(如 Stitch 或 Alooma)提供數(shù)據(jù)準(zhǔn)備/數(shù)據(jù)管道功能。盡管如此,Looker 還是有一種稱為持久派生表(PDT)的東西,可以用于某些數(shù)據(jù)準(zhǔn)備用例。

    當(dāng)您想要通過在數(shù)據(jù)庫中實例化一些數(shù)據(jù)來簡單地加快查詢速度時,PDT足夠好并且可以正常工作。它的工作方式如下:首先,直接從 SQL 或通過將 Look 保存到 LookML 來設(shè)置派生模型。然后,為 Looker 設(shè)置時間表,以將數(shù)據(jù)從該模型具體化到您的數(shù)據(jù)庫。您還可以設(shè)置其他選項,例如索引或?qū)崿F(xiàn)頻率。

    但是,Looker PDT的選擇非常有限,因為它沒有像 Holistics 或 dbt 那樣提供增量和依賴的實現(xiàn)。

    十、定價

    Looker 不在其網(wǎng)站上提供公開定價,而是選擇提供定制的定價模型。最終價格將取決于多個因素,包括總用戶數(shù),用戶類型(查看器與編輯器),數(shù)據(jù)庫連接以及部署規(guī)模。

    根據(jù)第三方網(wǎng)站的數(shù)據(jù),Looker 的價格從 $3000- $5000/10人/月起計,每位新用戶每月額外收取 $50。這種類似于傳統(tǒng)的企業(yè)定價結(jié)構(gòu),可能對熟悉基于SaaS 可預(yù)測且透明定價模式的潛在客戶并不具備吸引力。

    十一、客戶支持

    我們在 Looker 的客戶支持方面沒有直接的經(jīng)驗,但是根據(jù)與部分Looker客戶的評論和交談,Looker的支持經(jīng)驗似乎反應(yīng)迅速且很有幫助。

    十二、總結(jié)

    Looker 的數(shù)據(jù)建模方法是獨(dú)特的,創(chuàng)新的,但并非沒有缺點。它的特點有兩點:

    它利用了現(xiàn)代數(shù)據(jù)倉庫的功能,而不是構(gòu)建自己的存儲層,從而無需將數(shù)據(jù)加載到其專有引擎中。這提供了兩個好處:完全訪問行級原始數(shù)據(jù),并且消除了管理加載/刷新數(shù)據(jù)的麻煩,并向用戶保證,查詢數(shù)據(jù)時會更新數(shù)據(jù)。另一方面,這種方法是一把雙刃劍,因為它意味著查詢性能完全取決于基礎(chǔ)數(shù)據(jù)倉庫,并且從Looker 用戶的角度來看無法預(yù)測或標(biāo)準(zhǔn)化。

    它使用 LookML 和 Git 集成意味著數(shù)據(jù)團(tuán)隊擁有一個集中的,版本控制的單一真實數(shù)據(jù)源來用于數(shù)據(jù)建模邏輯。這使得數(shù)據(jù)建模過程更加可維護(hù)和可重用。不利的一面是該語言陡峭的學(xué)習(xí)曲線和數(shù)據(jù)建模過程漫長的反饋回路。

    總的來說,Looker是一種創(chuàng)新的BI產(chǎn)品,具有獨(dú)特的數(shù)據(jù)建模方法。對于經(jīng)驗豐富的數(shù)據(jù)團(tuán)隊來說,這是一個很好的選擇,他們需要復(fù)雜的數(shù)據(jù)建模需求,并且欣賞可維護(hù)性和可重用性。

    這里是幾個關(guān)鍵點:

    它對LookML的使用提供了陡峭的學(xué)習(xí)曲線,但提供了可維護(hù)和可重用的數(shù)據(jù)建模層

    一旦您熟悉LookML,Looker的向下鉆取功能將非常強(qiáng)大且易于使用

    Looker 沒有自己的存儲層 ,而是依靠客戶的數(shù)據(jù)倉庫

    從本質(zhì)上講,Looker是一個 SQL查詢構(gòu)建器引擎 ,可將業(yè)務(wù)用戶的拖放輸入轉(zhuǎn)換為SQL查詢

    Looker提供了高度靈活和復(fù)雜的訪問控制和權(quán)限管理,從而簡化了功能。

    與其他工具相比,Looker的數(shù)據(jù)準(zhǔn)備功能有限,因此將這項任務(wù)委托給其合作伙伴來提供這些功能。

    譯者注

    這筆收購案中,Google 應(yīng)是看重了 Looker 的數(shù)據(jù)能力和客戶能力,借此推廣 Google Cloud 業(yè)務(wù)。Looker的多云環(huán)境可以讓GCP更好地切入,且能有機(jī)會撬動其他云廠商如 AWS,Azure的蛋糕,這比收購那些只有GCP或者只用其他產(chǎn)品如 Domo來說,預(yù)期的收益會大許多。
    Forbes 專欄作家 Peter Cohan ,過去數(shù)年間采訪了三次 CEO Frank Bien ,也給出了他認(rèn)為 Google 此次收購的 4 個原因:

  • 數(shù)據(jù)分析是一塊增長迅速的市場:2018 年比 2017 年增長 11.7%,達(dá)到 $166B,并將在 2022 到達(dá) $260B
  • Looker 比市場增長得更快:CEO 給出的數(shù)據(jù)是 YoY 70%
  • CEO是個前朋克搖滾者,不希望運(yùn)營一家上市的大公司:這哥們從 2003 年至今做了 4 家被高價收購的公司
  • Google Cloud CEO 希望做出自己的業(yè)績:促進(jìn)云業(yè)務(wù)快速增長
  • 目前來看,國內(nèi)并沒有類似的BI平臺出現(xiàn)?,F(xiàn)有的 GrowingIO,神策更多是產(chǎn)品分析工具,BI 要涉及到多數(shù)據(jù)源的整合。原因在于這塊市場要滯后于其他ToB產(chǎn)品的發(fā)展。只有一批比較成熟的新企業(yè)服務(wù)產(chǎn)品出來,擁有相對穩(wěn)定的數(shù)據(jù)規(guī)范,在這之上才能長出來一堆BI平臺工具。目前這個趨勢正在慢慢形成。

    本文介紹 Looker 一些產(chǎn)品概念,在這之上,有些特性也頗有有趣。比如為了減少獲取數(shù)據(jù)方面的難度,Looker設(shè)計了Block的概念,預(yù)置了一些常見的流程工具,幫助用戶清洗和建立數(shù)據(jù)模型等。同時,還有Act 概念,他能方便和其他tob產(chǎn)品聯(lián)動,如Slack,Jira等等。

     

    原文來源:Holistic 的產(chǎn)品博客

    原文作者:Holistic聯(lián)合創(chuàng)始人兼首席設(shè)計師 Thanh Dinh

    編譯作者:陳新濤,微信公眾號:三生萬數(shù)(ID: ourStone),現(xiàn)任轉(zhuǎn)轉(zhuǎn)數(shù)據(jù)負(fù)責(zé)人,曾任美團(tuán)外賣首任數(shù)據(jù)產(chǎn)品經(jīng)理。

    本文由 @陳新濤 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

    題圖來自Unsplash,基于CC0協(xié)議

    更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
    評論
    評論請登錄
    1. 目前還沒評論,等你發(fā)揮!