數(shù)據(jù)可視化,我應(yīng)從何開啟?

1 評論 7131 瀏覽 66 收藏 10 分鐘

我喜歡數(shù)據(jù),并將它廣為人知。

如果您最近和我參加聚會,我在您耳邊說的都是有關(guān)數(shù)據(jù)可視化工具或者最近使用的酷R包,對此我在這向您表示歉意。

如果您和我玩范特西游戲,歡迎您來到圖表世界,這里有很多的圖表。

190

不要為越來越頻繁地聽到下面的問題感到驚訝:“Nick,我想走向數(shù)據(jù)分析和數(shù)據(jù)可視化,我應(yīng)該從哪里開始?”

不幸的是,沒有一個完美的答案適合所有的人–每一個人的需求不同且人們已經(jīng)知道的東西相差很大。但令我高興的是一件關(guān)于最近科技/教育/商業(yè)環(huán)境事情:

來自不同職業(yè)道路和背景的聰明人都對自己說:“我需要從數(shù)據(jù)中得到更多”。

但是,在很多初學(xué)者溝通后,發(fā)現(xiàn)了的共性。很明顯,這些共性不是適合每一個人的:

一個老練的工程師會嘲笑共性上說的第一時間學(xué)習(xí)Java腳本或者Python。

早已知道D3.js 的人會疑惑選擇哪一個可視化工具?或者疑惑怎么樣將數(shù)據(jù)驅(qū)動轉(zhuǎn)換應(yīng)用頂級的3D中?

這些適合想進一步了解接近數(shù)據(jù)可視化的學(xué)術(shù)科學(xué)家、學(xué)校老師、研究咨詢師、項目經(jīng)理、失業(yè)快樂族或者MBA畢業(yè)生……。

如果符合你,我認(rèn)為你應(yīng)該開始于從“無編碼”有計劃地學(xué)習(xí)到“愛編碼”。

無編碼

首先,如果你對excel一無所知,這是值得去做的。嚴(yán)肅地告訴你至少得學(xué)會透視表,聽起來有些差勁,但是Excel能做很多超乎人們想象的事情。如果你善于嘗試,Excel甚至能做出很多漂亮的圖表。

如果你已經(jīng)有一些數(shù)據(jù),僅僅想用一個好的工具來探索可視化或者輸出更多引人注目的圖表。Tableau 就很流行、功能驚人,它有免費的公共版和一個十分昂貴費用的付費版,

2

不過如果你是學(xué)生就可以享受到免費版。它一般會在網(wǎng)上,或者論文上以靜態(tài)圖表形式發(fā)布,也可以傳送到Instagram上或者以墻圖輸出。在它的官網(wǎng)上可以找到很多模板,激發(fā)你的靈感。

遺憾地是,將要探討的另一個工具–Infoactive,可惜已經(jīng)下架了,但沒關(guān)系,Tableau吸收了Infoative所有優(yōu)點。這個意味著Tableau很有可能是未來公認(rèn)的好工具。我將牽頭一本免費的書,它是Infoactive團隊帶領(lǐng)下涉及數(shù)據(jù)可視化設(shè)計工具的背景資料,下面談?wù)摰娜魏喂ぞ?

數(shù)據(jù)+設(shè)計

一個簡單有關(guān)準(zhǔn)備和可視化信息的說明介紹

簡單編碼

如果要選擇一款獨立的程序語言來操作單機數(shù)據(jù),我會選擇R語言。因為R語言是免費的,且支持大量的在線開發(fā)加載有用的頂級基礎(chǔ)語言程序包,并且有大量的免費資源學(xué)習(xí)如何運用它。在這些資源中–我極力推薦Coursera課程:

354

數(shù)據(jù)科學(xué)家證書|課程

約翰霍普金斯大學(xué)驗證通過的數(shù)據(jù)科學(xué)專業(yè)化專家成為數(shù)據(jù)科學(xué)家自由談?wù)摗?/p>

它們可能會抹殺一個真正的初學(xué)者,但是課程能帶你走出一條重要數(shù)據(jù)科學(xué)項目和想法的路線,通過所有的方式探索數(shù)據(jù)分析(它涵蓋了有用的R包,例如ggplot,一個十分受歡迎的可視化工具)的交互性,通過Shiny和數(shù)據(jù)故事發(fā)布在網(wǎng)頁上。

R是我最常用來處理小型快速的分析和數(shù)據(jù)可視化工具–如果有一個數(shù)據(jù)(數(shù)據(jù)量大、不易于可視化)Excel處理不了,R最適合快速探索。

453

“是的,你可能要學(xué)些一些SQL”,另外一個快速入門的語言–SQL,與R相比(實際上,這已經(jīng)超出了蘋果和蘋果的比較),SQL是一門比較有針對性的語言:

如果你希望在數(shù)據(jù)庫中用任何工具或者語言集成數(shù)據(jù),這將是一個很好的機會讓你有學(xué)習(xí)SQL的興趣。

愛編碼

通常,在網(wǎng)頁上看到一個美好的交互式可視化界面,都會浮現(xiàn)一個問題“我們要從何學(xué)起?”。我著迷于這個創(chuàng)新的領(lǐng)域(點擊這可以看更多深入的調(diào)查)。

不幸地是,如果你喜歡這些作品:

547

一個機器學(xué)習(xí)的可視化介紹

讓我們重新審視73英尺高的邊界,提出了我們的建議,看看我們是怎樣地提高直覺。明顯地……

……它可以令你沮喪的發(fā)現(xiàn)還有多少東西需要自己學(xué)習(xí)。反復(fù)的實踐以求得“《紐約時報》一樣好”是一個艱難的目標(biāo),值得但是困難。

幸運的是,這里有很多幫助資源。

交互式的作品后面的邏輯庫,和很多在網(wǎng)頁上運行的數(shù)據(jù)可視化作品都是Mike Bostock創(chuàng)作的D3.js。D3.js是一個很好的工具去學(xué)習(xí)作品網(wǎng)頁發(fā)布和交互式。

博斯托克(Bostock)的網(wǎng)站是一個有關(guān)金礦的例子和教程網(wǎng)站(你不需要筋疲力竭地從邏輯庫的創(chuàng)建者學(xué)起……)。

我也推薦Murry創(chuàng)建的網(wǎng)頁版交互式數(shù)據(jù)可視化,你可以從 O’Reilly 那購買或者網(wǎng)上在線免費使用:

網(wǎng)頁交互式數(shù)據(jù)可視化

這是一個關(guān)于非程序員的編程數(shù)據(jù)可視化的書。如果你是一個擁有視覺技能的藝術(shù)家或圖形設(shè)計師,但沒有從事數(shù)據(jù)或代碼工作的先驗經(jīng)驗,這本書適合你。如果你是一個擁有大量數(shù)據(jù)的記者或研究人員,但沒有數(shù)據(jù)可視化或代碼的先驗工作,這本書也適合你。

在線版本很好–你可以跟著書本本身編寫代碼腳本,運行它并拿你的輸出結(jié)果和模板比較。Murray 還特別為初學(xué)者量身定制,這個網(wǎng)站能很好的引導(dǎo)初學(xué)者從HTML/CSS和Javascript基礎(chǔ)到深入學(xué)習(xí)相對難的D3。

D3的地理空間可視化是一個值得一提的長處。D3擅長創(chuàng)造很多不同效果的地圖,如果這是你的專業(yè)領(lǐng)域,這里可以獲得不錯的專用教程:

讓我們畫一個泡泡地圖

我以前讓地圖教程介紹了如何用D3和topojson做一個基本的地圖;現(xiàn)在是時候讓它覆蓋……

D3很難操作,但也有工具能降低難度,我建議使用最基礎(chǔ)的D3而不是復(fù)雜的繪圖程序,如果你人覺得棘手,那使用Plot.ly會更實際。

如果你要學(xué)萬能的程序語言,那Python是最適合。它功能強大目的性強,很受歡迎。

我發(fā)現(xiàn)Python是一種極易上手且多用途的編程語言。但實際上,如果你要做的是探索和可視化數(shù)據(jù),它會讓你覺得吃力:例如Youtube就是用Python開發(fā)的……代碼有一百萬行。如果你想了解Python,Code Academy 課程是一個短且有趣的語言介紹。

625

最后,和前面介紹的D3.js , Javascript or ggplot ,R一樣, Python也有很多資料庫。最值得推薦的是,Seaborn(建立在一個年長受歡迎的庫,matplotlib)和Bokeh很有可能是一流的,但是這是一個快速發(fā)展和提升的領(lǐng)域。Seaborn and Bokeh 的網(wǎng)站包括畫廊展示你用這些工具創(chuàng)建的各種各樣的可視化作品。

啊!太多太多!祝您愉快–如果你創(chuàng)造了一些有趣的東西,請聯(lián)系我:在Twitter上@uptownnickbrown或者發(fā)我的郵箱nick@quanticle.co

原文連接:Getting into data visualization?—?where should I start?

作者:Nick Brown 本文由Teradata挖掘顧問肖小花翻譯,轉(zhuǎn)載自36大數(shù)據(jù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 如果你已經(jīng)有一些數(shù)據(jù),僅僅想用一個好的工具來探索可視化或者輸出更多引人注目的圖表。Tableau 就很流行、功能驚人,它有免費的個人版和一個付費的企業(yè)版?!獓鴥?nèi)相似的工具BDP也是這樣吧。

    來自北京 回復(fù)