為什么科學(xué)家需要更好地進(jìn)行數(shù)據(jù)可視化

0 評(píng)論 3900 瀏覽 7 收藏 30 分鐘

編輯導(dǎo)語(yǔ):數(shù)據(jù)可視化,是數(shù)據(jù)科學(xué)家工作的重要組成部分。在項(xiàng)目的早期階段,科學(xué)家通常會(huì)進(jìn)行探索性數(shù)據(jù)分析,以獲取對(duì)數(shù)據(jù)的一些洞察;在項(xiàng)目結(jié)束時(shí),能以清晰、簡(jiǎn)潔和引人注目的方式展示最終結(jié)果也非常重要,這樣才能讓你的非技術(shù)性客戶能夠理解你的意圖。

想象一本沒(méi)有圖像的科學(xué)教科書,沒(méi)有圖表、圖表、帶有箭頭和標(biāo)簽的插圖或圖表,科學(xué)將很難理解。

那是因?yàn)槿祟愄焐褪且曈X(jué)生物,人們以圖形形式吸收信息,而這些信息會(huì)以文字形式逃避。圖像對(duì)于各種敘事都是有效的,尤其是在故事復(fù)雜的情況下(如科學(xué)常常如此)。

科學(xué)的視覺(jué)效果對(duì)于分析數(shù)據(jù),傳達(dá)實(shí)驗(yàn)結(jié)果甚至做出令人驚訝的發(fā)現(xiàn)至關(guān)重要。

麻省理工學(xué)院廣泛研究所的創(chuàng)意總監(jiān)Bang Wong說(shuō):可視化可以揭示很難或不可能以其他任何方式找到的數(shù)據(jù)模式,趨勢(shì)和聯(lián)系?!袄L制數(shù)據(jù)可以使我們看到數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu),而如果要查看表,則無(wú)法看到這些結(jié)構(gòu)?!?/p>

但是,很少有科學(xué)家會(huì)像在生成數(shù)據(jù)或撰寫數(shù)據(jù)時(shí)一樣,對(duì)視覺(jué)效果給予同等的關(guān)注。

數(shù)據(jù)可視化科學(xué)家SeánO’Donoghue說(shuō):大多數(shù)科學(xué)出版物附帶的圖表往往是研究人員要做的最后一件事,“可視化實(shí)際上只是錦上添花?!?/p>

結(jié)果,科學(xué)中充斥著不良的數(shù)據(jù)可視化效果,使讀者感到困惑,甚至可能誤導(dǎo)制造它們的科學(xué)家。

數(shù)據(jù)視覺(jué)效果不足會(huì)降低質(zhì)量,并阻礙科學(xué)研究的進(jìn)展。隨著越來(lái)越多的科學(xué)圖像進(jìn)入新聞和社交媒體(從氣候變化到疾病暴發(fā)的一切圖示),不良視覺(jué)效果有可能損害公眾對(duì)科學(xué)的理解。

隨著科學(xué)數(shù)據(jù)的數(shù)量和復(fù)雜性日益增加,這個(gè)問(wèn)題變得更加嚴(yán)重。這些數(shù)據(jù)的可視化,理解和共享它們比以往任何時(shí)候都更加重要。

然而,科學(xué)家很少接受可視化培訓(xùn)。新南威爾士大學(xué)的奧多諾休(O’Donoghue)是《2018年生物醫(yī)學(xué)數(shù)據(jù)年度回顧》中有關(guān)生物醫(yī)學(xué)數(shù)據(jù)可視化的論文的主要作者,他說(shuō):“社區(qū)尚未普遍意識(shí)到這確實(shí)是必要的?!?/p>

但是有進(jìn)步的跡象,在過(guò)去的十年中,至少召開(kāi)了兩次致力于科學(xué)數(shù)據(jù)可視化的年度會(huì)議。

《自然方法》(Nature Methods)雜志在2010年至2016年定期刊登有關(guān)創(chuàng)建更好的圖形和圖表的專欄文章?,然后將其改編為科學(xué)家向該雜志提交論文的指南。但是到目前為止,很少有科學(xué)家關(guān)注這個(gè)問(wèn)題。

改善科學(xué)可視化將需要更好地了解人腦如何看待世界的優(yōu)點(diǎn),缺點(diǎn)和偏見(jiàn)。

幸運(yùn)的是,研究已經(jīng)開(kāi)始揭示人們?nèi)绾伍喿x和錯(cuò)誤閱讀各種可視化圖像,以及哪種類型的圖表最有效,最容易破譯,應(yīng)用這些知識(shí)應(yīng)該可以更好地進(jìn)行科學(xué)的視覺(jué)交流。

猶他大學(xué)的計(jì)算機(jī)科學(xué)家Miriah Meyer說(shuō):“我們對(duì)有效的方法有很多實(shí)用的知識(shí)。”、 “有許多原則經(jīng)過(guò)時(shí)間的考驗(yàn),并一遍又一遍地證明是有效的?!?/p>

一、圖表選擇

人類視覺(jué)系統(tǒng)的發(fā)展是為了幫助我們?cè)谧匀皇澜缰猩婧桶l(fā)展,而不是閱讀圖表。

我們的大腦以可以幫助我們?cè)谟卸酒贩N中找到可食用植物,發(fā)現(xiàn)獵物并且在白天和黑夜中都能很好地看到自己的眼睛的方式來(lái)解釋。通過(guò)分析我們從眼睛獲得的信息來(lái)實(shí)現(xiàn)這些目的,我們的大腦使我們對(duì)世界有了量身定制的感知。

在1980年代初期,貝爾實(shí)驗(yàn)室的統(tǒng)計(jì)學(xué)家威廉·克利夫蘭(William Cleveland)和羅伯特·麥吉爾(Robert McGill),開(kāi)始研究人類感知的細(xì)節(jié)如何影響我們解密數(shù)據(jù)圖形顯示的能力,從而發(fā)現(xiàn)哪種圖表發(fā)揮了我們的優(yōu)勢(shì),以及我們?cè)谂c之抗?fàn)帯?/p>

克利夫蘭(Cleveland)和麥吉爾(McGill)在1984年發(fā)表在《美國(guó)統(tǒng)計(jì)協(xié)會(huì)雜志》(Journal of the American Statistics Association)上的開(kāi)創(chuàng)性論文中,根據(jù)人們閱讀內(nèi)容的便捷程度,對(duì)視覺(jué)元素進(jìn)行了排名。

人們?cè)诒鎰e某些類型的視覺(jué)效果上比其他特征更勝一籌,例如,兩條線的長(zhǎng)度或一條線的方向比灰色陰影或顏色的強(qiáng)度更容易分辨。研究表明,使用此列表頂部視覺(jué)元素的圖形比靠近底部的圖形更易于閱讀且更有效。

他們的實(shí)驗(yàn)表明,人們最擅長(zhǎng)基于條形或折線的長(zhǎng)度來(lái)閱讀圖表,例如在標(biāo)準(zhǔn)條形圖中。當(dāng)重要的是要準(zhǔn)確識(shí)別值之間的細(xì)微差別時(shí),這些可視化是最佳選擇。

研究參與者發(fā)現(xiàn)很難判斷方向,角度和面積的差異。使用體積,曲率或陰影來(lái)表示數(shù)據(jù)的圖形更加困難,最不有效的方法是色彩飽和度。

西雅圖大學(xué)的計(jì)算機(jī)科學(xué)家杰弗里·海爾(Jeffrey Heer)說(shuō):“當(dāng)聽(tīng)眾察覺(jué)微小差異時(shí),聽(tīng)眾察覺(jué)的能力將越來(lái)越差”。通常,最佳做法是使用列表中滿足每種數(shù)據(jù)類型需求的最高圖形元素。

例如:如果重要的是要表明一種特定疾病的致死性遠(yuǎn)大于其他疾病,那么使用圓圈大小代表死亡人數(shù)的圖形將非常有用。但是要強(qiáng)調(diào)致命性較低的疾病之間死亡人數(shù)差異的小得多,條形圖將更加有效。

2010年,Heer使用亞馬遜的Mechanical Turk眾包服務(wù)確認(rèn)了?克利夫蘭和麥吉爾的排名在現(xiàn)代數(shù)字環(huán)境中是正確的。

從那以后,Heer,O’Donoghue和其他人使用眾包來(lái)測(cè)試可視化的許多其他方面,以找出最有效的方法。O’Donoghue說(shuō):“在整個(gè)領(lǐng)域都具有強(qiáng)大的力量,并確實(shí)為它奠定了堅(jiān)實(shí)的工程基礎(chǔ)?!?/p>

二、有害的餡餅

克利夫蘭和麥吉爾(McGill)的圖形排名凸顯了為什么一些流行的數(shù)字不是很有效。一個(gè)很好的例子是廣受歡迎的餅圖,它使愛(ài)德華·塔夫特(Edward Tufte)等數(shù)據(jù)可視化專家不屑一顧。

Tufte在1983年頗具影響力的論文《定量信息的可視化顯示》中寫道:“唯一不及餅圖的設(shè)計(jì)就是其中的幾個(gè)?!?/p>

餅圖通常用于比較整個(gè)部分,這是一項(xiàng)具有認(rèn)知挑戰(zhàn)性的視覺(jué)任務(wù)。

讀者需要判斷餅圖的面積之間的差異,或者判斷圖表中心的角度之間的差異:兩種類型的估算比辨別條形圖上條形的長(zhǎng)度差異要困難得多。在許多情況下是更好的選擇。

餅圖最適合用來(lái)顯示各個(gè)部分與整體的關(guān)系。

在此圖中,餅形圖有效地顯示了每個(gè)經(jīng)濟(jì)部門對(duì)溫室氣體總排放量的貢獻(xiàn)大小,但是很難將各個(gè)部門進(jìn)行比較。條形圖允許輕松比較各扇區(qū),但無(wú)法傳達(dá)每個(gè)扇區(qū)與總數(shù)之間的關(guān)系。

餅圖之所以誘人,是因?yàn)樗鼈兺ǔ1葪l形圖更具吸引力,易于填充顏色并且易于制造。

但是它們很少是最佳選擇,只有在有限的情況下才可以接受。如果目標(biāo)是顯示零件的總和,或者比較零件與該整體(而不是彼此比較切片),則只要精度不重要,執(zhí)行良好的餅圖就足夠了。

例如:一個(gè)餅圖很好地描繪了每個(gè)經(jīng)濟(jì)部門對(duì)溫室氣體排放的貢獻(xiàn),表明大約一半來(lái)自電力和熱力生產(chǎn)以及農(nóng)業(yè),林業(yè)和其他土地利用。通常最受關(guān)注的交通運(yùn)輸占了很小的一部分。

在這種情況下,將六個(gè)條形圖并排放置并不能立即顯示出這些部分的總和為100%或每個(gè)條形圖占整體的比例。

在某些科學(xué)學(xué)科中,餅圖只是用于顯示特定類型數(shù)據(jù)的標(biāo)準(zhǔn)實(shí)踐。而且很難推翻傳統(tǒng)。

Wong說(shuō):“表觀遺傳學(xué)中的某些領(lǐng)域,我們必須顯示餅圖?!?Wong說(shuō),他與Broad Institute的生物醫(yī)學(xué)科學(xué)家合作創(chuàng)建了更好的可視化效果?!拔抑里瀳D的缺點(diǎn),但是它總是在每個(gè)出版物中都以餅圖的形式顯示出來(lái),因此人們堅(jiān)持這一觀點(diǎn)非常嚴(yán)格。”

在其他情況下,額外的工作需要人腦來(lái)使他們成為傳遞準(zhǔn)確信息或連貫故事的不良工具。

三、酒吧后面

盡管條形圖易于閱讀和理解,但這并不意味著它們始終是最佳選擇。在某些領(lǐng)域,例如心理學(xué)、醫(yī)學(xué)和生理學(xué),條形圖經(jīng)常會(huì)歪曲基礎(chǔ)數(shù)據(jù)并掩蓋重要的細(xì)節(jié)。

明尼蘇達(dá)州羅徹斯特市梅奧診所的生理學(xué)家Tracey Weissgerber說(shuō):“如果要可視化計(jì)數(shù)或比例,則應(yīng)使用條形圖?!彼芯垦芯康耐瓿煞绞胶蛨?bào)告方法?!暗菍?duì)于可視化連續(xù)數(shù)據(jù),它們并不是一種非常有效的策略?!?/p>

Weissgerber在2015年對(duì)頂級(jí)生理學(xué)期刊進(jìn)行了一項(xiàng)調(diào)查,發(fā)現(xiàn)約有85%的論文至少包含一張代表連續(xù)數(shù)據(jù)的條形圖,例如血壓或體溫的測(cè)量,每個(gè)樣品在相關(guān)范圍內(nèi)可以有任何值。

但是代表連續(xù)數(shù)據(jù)的條形圖可能無(wú)法顯示一些重要信息,例如每個(gè)條形圖代表多少個(gè)樣本以及條形圖內(nèi)是否有子組。

右邊的四組數(shù)據(jù)中的每一組都可以由左邊的同一條形圖準(zhǔn)確地表示,這說(shuō)明了條形圖如何掩蓋有關(guān)數(shù)據(jù)的重要細(xì)節(jié),可能會(huì)誤導(dǎo)讀者。

例如:魏斯伯格(Weissgerber)指出,妊娠并發(fā)癥先兆子癇可能源于母親的問(wèn)題或嬰兒或胎盤的問(wèn)題。但是在這些人群中,是通過(guò)不同途徑達(dá)到相同癥狀的患者亞組。

Weissgerber說(shuō):“我們的確專注于試圖理解和識(shí)別患有先兆子癇的不同亞型的女性?!?“而且問(wèn)題之一是,如果我們?cè)跅l形圖中顯示所有數(shù)據(jù),則條形圖中沒(méi)有子組?!?/p>

對(duì)于基本生物醫(yī)學(xué)中常見(jiàn)的小樣本量研究,條形圖尤其有問(wèn)題。條形圖沒(méi)有顯示樣本的大小,而離群值可能會(huì)對(duì)條形圖高度指示的平均值產(chǎn)生很大影響。

Weissgerber說(shuō):“挑戰(zhàn)之一是,在基礎(chǔ)生物醫(yī)學(xué)的許多領(lǐng)域,條形圖僅被接受為…我們?nèi)绾物@示連續(xù)數(shù)據(jù)?!?/p>

對(duì)于顯示連續(xù)數(shù)據(jù),許多類型的圖形要優(yōu)于條形圖。

散點(diǎn)圖(頂部)為讀者提供了有關(guān)數(shù)據(jù)的更多詳細(xì)信息,揭示了樣本數(shù)量以及是否存在離群值或聚類:箱形圖(中)非常適合顯示數(shù)據(jù)集的可變性,直方圖(底部)使讀者可以評(píng)估數(shù)據(jù)的分布。

對(duì)于小型連續(xù)數(shù)據(jù)集,有幾個(gè)很好的替代圖。

散點(diǎn)圖,箱形圖和直方圖都可以揭示數(shù)據(jù)的分布,但在魏斯格伯分析的論文中很少使用。為了幫助解決此問(wèn)題,她開(kāi)發(fā)了工具來(lái)創(chuàng)建簡(jiǎn)單的散點(diǎn)圖和各種交互式圖形。

四、廢墟的彩虹

色彩對(duì)于突出顯示數(shù)據(jù)的不同方面并為科學(xué)圖形增添生命是非常有效的,但這也是出錯(cuò)的最簡(jiǎn)單方法之一。人類對(duì)顏色的感知并不簡(jiǎn)單,大多數(shù)科學(xué)家在選擇顏色來(lái)代表其數(shù)據(jù)時(shí)并未考慮視覺(jué)系統(tǒng)的特殊性。

最常見(jiàn)的不良做法之一是使用彩虹色標(biāo),從地質(zhì)學(xué)到氣候?qū)W再到分子生物學(xué),研究人員傾向于在Roy G. Biv的幫助下繪制數(shù)據(jù)圖。但是彩虹調(diào)色板有幾個(gè)嚴(yán)重的缺點(diǎn)很少推薦。

Wong說(shuō),即使它是從自然光譜中得出的,彩虹中的顏色順序也不直觀。“您有點(diǎn)想,藍(lán)色比綠色大嗎?黃色比紅色大嗎?”

更大的問(wèn)題是人腦對(duì)彩虹的感知不均勻,人們從色調(diào)(例如紅色或藍(lán)色),飽和度(顏色的強(qiáng)度)和亮度(混入多少白色或黑色)方面看到顏色。

人類的大腦最依賴亮度來(lái)解釋形狀和深度,因此傾向于將最亮的顏色表示為峰值,將較暗的顏色表示為山谷。但是,彩虹中最亮的顏色是黃色,通常在刻度的中間某個(gè)地方可以看到,從而導(dǎo)致觀看者在錯(cuò)誤的位置看到高點(diǎn)。

使問(wèn)題更加復(fù)雜的是,某些顏色之間的過(guò)渡似乎是漸進(jìn)的,而其他變化似乎更為突然。

另一方面,基礎(chǔ)數(shù)據(jù)通常具有一致的變化率,與彩虹的不均勻性不匹配。英格蘭雷丁大學(xué)的氣候科學(xué)家埃德·霍金斯(Ed Hawkins)說(shuō):“您可以擁有一個(gè)不存在的感知邊界,也可以隱藏存在的邊界?!?甚至科學(xué)家在解釋自己的數(shù)據(jù)時(shí)也可能陷入這種幻想。

為了避免彩虹問(wèn)題,一些研究人員提出了基于數(shù)學(xué)的調(diào)色板,可以更好地將其顏色的感知變化與相應(yīng)數(shù)據(jù)的變化進(jìn)行匹配。其中一些較新的色標(biāo)特別適用于有紅綠色色盲的人,據(jù)估計(jì),這種疾病會(huì)影響約8%的男性(但僅影響女性的一小部分)。

盡管制圖師和霍金斯等少數(shù)科學(xué)家一直在反對(duì)彩虹,但數(shù)十年來(lái),它在科學(xué)文獻(xiàn)中仍然無(wú)處不在。

自從彩色印刷發(fā)明以來(lái),某些科學(xué)領(lǐng)域可能就一直在使用它。而且,由于許多科學(xué)家并不了解彩虹的問(wèn)題所在,因此他們認(rèn)為沒(méi)有理由違背傳統(tǒng)?;艚鹚拐f(shuō):“人們習(xí)慣使用它,所以他們喜歡它,對(duì)它感到自在?!?/p>

彩虹色標(biāo)是科學(xué)家用來(lái)創(chuàng)建可視化效果的許多軟件的默認(rèn)色,這也鼓勵(lì)了這種傾向。但是霍金斯和其他人一直在推動(dòng)軟件制造商改變默認(rèn)設(shè)置,并取得了一些成功。

2014年,MathWorks將MATLAB軟件程序的默認(rèn)設(shè)置更改為一種改進(jìn)的配色方案,稱為parula;在2015年,一位認(rèn)知科學(xué)家和一位數(shù)據(jù)科學(xué)家開(kāi)發(fā)了一種?新的默認(rèn)配色方案,稱為viridis,用于使用流行的Python編程語(yǔ)言進(jìn)行繪圖。

十二種軟件庫(kù)中已經(jīng)添加了一種新的?數(shù)學(xué)上衍生的色彩方案cividis,盡管這在所有軟件庫(kù)中都不是默認(rèn)的。

五、危險(xiǎn)熱圖

人類視覺(jué)系統(tǒng)中最有趣的怪癖之一(也是數(shù)據(jù)可視化中最棘手的怪癖之一)是,我們對(duì)顏色的感知可能會(huì)受??到附近其他顏色的影響。在某些情況下,效果非常顯著,導(dǎo)致各種視錯(cuò)覺(jué)。

每當(dāng)可視化將彼此相鄰的不同顏色或什至是相同顏色的陰影放置時(shí),它們都可以以意想不到的方式進(jìn)行交互。完全相同的顏色在被較暗的陰影包圍時(shí)看起來(lái)與在被較淺的陰影包圍時(shí)看起來(lái)完全不同,這種現(xiàn)象稱為同時(shí)對(duì)比度。

當(dāng)陰影跨過(guò)方格網(wǎng)格時(shí),棋盤格陰影錯(cuò)覺(jué)就是其中一個(gè)眾所周知的例子,它可以發(fā)揮大腦對(duì)顏色的解釋。

Wong說(shuō):“顏色相互作用的影響是一個(gè)巨大的問(wèn)題?!?在生命科學(xué)中,一個(gè)普遍的例子是熱圖,該熱圖通常用于揭示兩組數(shù)據(jù)之間的關(guān)系。

他說(shuō):“如果翻閱期刊,那么三分之一的數(shù)字就是熱圖?!?“這是一種非常流行的數(shù)據(jù)可視化形式,實(shí)際上在偏向科學(xué)數(shù)據(jù)?!?/p>

熱圖是一個(gè)二維矩陣,基本上是一個(gè)表或網(wǎng)格,它使用網(wǎng)格中每個(gè)正方形的顏色表示基礎(chǔ)數(shù)據(jù)的值。一種或多種色調(diào)的較淺和較深的陰影表示較低或較高的值。

熱圖在顯示基因活性數(shù)據(jù)方面特別受歡迎,可幫助研究人員確定在不同情況下或多或少活躍地產(chǎn)生蛋白質(zhì)(或其他分子)的基因模式。

此熱圖上的兩個(gè)加星號(hào)的正方形是相同的橙色陰影,表示在基因活性方面的值相同。但是相鄰方格的顏色不同意味著加星標(biāo)的方格看起來(lái)不一樣,這可能會(huì)產(chǎn)生誤解。

熱圖非常適合將大量數(shù)據(jù)打包到緊湊的顯示器中,但是將各種顏色的陰影緊挨在一起會(huì)觸發(fā)同時(shí)出現(xiàn)的對(duì)比度錯(cuò)覺(jué)。

例如:科學(xué)家比較網(wǎng)格中各個(gè)正方形的顏色很容易將兩個(gè)不同的橙色陰影誤解為相同,或者認(rèn)為兩個(gè)相同的陰影完全不同,這取決于周圍正方形的顏色。

Wong說(shuō):“在熱圖中,這是一個(gè)巨大的問(wèn)題,您需要依靠一堆彼此相鄰的彩色瓷磚?!?“這種無(wú)意識(shí)的偏見(jiàn)在每個(gè)熱圖上都非常普遍?!?/p>

對(duì)于基因活性數(shù)據(jù),綠色和紅色通常用于顯示哪些基因或多或少具有活性。

與由較深的綠色,紅色或黑色包圍的特定綠色相比,由較淺的綠色包圍的特定綠色外觀看起來(lái)非常不同;綠色陰影所代表的值是相同的,但是根據(jù)其相鄰的正方形,它會(huì)顯得更高或更低。

網(wǎng)格的一部分中出現(xiàn)一團(tuán)亮綠色的方塊,可能意味著該基因在一組緊密相關(guān)的亞種中具有很高的活性,例如細(xì)菌。

同時(shí),在網(wǎng)格的另一部分,一個(gè)暗綠色的方塊被黑色方塊包圍可能看起來(lái)很亮,這表明同一基因在無(wú)關(guān)的細(xì)菌物種中具有很高的活性,而實(shí)際上它只是弱活性的。

Wong說(shuō),緩解問(wèn)題的一種方法是在網(wǎng)格的各個(gè)部分之間引入一些空白,也許是將相關(guān)物種,樣本組或相關(guān)基因集分開(kāi)。

打破正方形將減少來(lái)自相鄰顏色的干擾,另一種解決方案是使用完全不同的顯示,例如使用線連接高活性基因的圖形,或代表隨著時(shí)間或在兩個(gè)實(shí)驗(yàn)狀態(tài)之間基因活性變化的一系列圖形。

六、消息混亂

確??梢暬粫?huì)歪曲數(shù)據(jù)或誤導(dǎo)讀者,這對(duì)于共享科學(xué)成果至關(guān)重要。但是,重要的是要考慮一個(gè)人物是否真的在引起人們對(duì)最相關(guān)信息的關(guān)注,而不是分散讀者的注意力。

例如:當(dāng)繪制為線圖或直方圖時(shí),許多數(shù)據(jù)集的分布將呈鐘形,大部分?jǐn)?shù)據(jù)位于中心附近。Wong說(shuō):“但是我們經(jīng)常關(guān)心尾巴上有什么。”?對(duì)于觀看者來(lái)說(shuō),“中間常常有這么大的舊東西不堪重負(fù)?!?/p>

解決方案可能是使用高度以外的其他方式來(lái)表示數(shù)據(jù)的分布,一個(gè)選項(xiàng)是條形碼圖,該圖將每個(gè)值顯示為一條線。在這種圖形上,更容易看到低濃度區(qū)域的細(xì)節(jié),這些細(xì)節(jié)往往在鐘形曲線上幾乎消失了。

鐘形曲線引起人們對(duì)大量數(shù)據(jù)分布的關(guān)注。但是有時(shí)候真正重要的是數(shù)據(jù)邊緣的內(nèi)容。在這種情況下,條形碼圖可能是更好的選擇。

上圖顯示細(xì)胞系對(duì)基因FOXA1的依賴性;?負(fù)-1參考線左側(cè)的那些需要該基因才能存活。這些細(xì)胞系很難在鐘形曲線上看到,但在條形碼上卻很突出。

精心應(yīng)用的顏色還可以增強(qiáng)和闡明圖形的信息。例如,在使用不同顏色標(biāo)識(shí)數(shù)據(jù)類別的散點(diǎn)圖上,最重要的信息應(yīng)由最突出的顏色表示。

制圖程序可能只是將紅色隨機(jī)分配給對(duì)照組,因?yàn)樗菙?shù)據(jù)的第一列,而對(duì)于發(fā)現(xiàn)至關(guān)重要的有趣突變體最終變成了灰色。

數(shù)據(jù)可視化記者Alberto Cairo在2013年的《功能藝術(shù)》中寫道:“純色在自然界中并不常見(jiàn),因此請(qǐng)限制它們以突出顯示圖形中重要的內(nèi)容?!?“將柔和的色調(diào)-灰色,淺藍(lán)色和綠色-用于其他所有顏色?!?/p>

除了彩虹和同步對(duì)比度之外,還有很多其他方法可以使顏色出現(xiàn)問(wèn)題。使用過(guò)多的顏色會(huì)分散可視化效果的主要信息。彼此之間太相似或與圖像的背景顏色太相似的顏色可能難以辨認(rèn)。

與文化期望背道而馳的顏色也會(huì)影響讀者對(duì)圖形的理解程度。

例如,在顯示地形的地圖上,人們期望植被是綠色的,干旱地區(qū)是棕色的,海拔更高的是白色,城市是灰色的,當(dāng)然水是藍(lán)色的。如果地圖沒(méi)有遵循這些公認(rèn)的配色方案,將很難閱讀。

想象一下美國(guó)的選舉地圖,其中民主地區(qū)顯示為紅色,共和黨地區(qū)顯示為藍(lán)色,或者條形圖以鮮艷而歡快的顏色顯示了不同的死亡原因,不和諧將使人們難以吸收他們的信息。

讀者在文化上定義了對(duì)不同顏色含義的期望,違反這種期望會(huì)使圖形,地圖和其他插圖更難以解讀,如美國(guó)這張變色的浮雕圖所示。

如果不需要顏色,則有時(shí)最安全的做法是堅(jiān)持使用灰色陰影。正如塔夫特(Tufte)在其1990年的《遠(yuǎn)景信息》(Envisioning Information)一書中所言,“避免災(zāi)難成為將色彩帶入信息的第一條原則:?首先,沒(méi)有傷害?!?/p>

七、想象未來(lái)

O’Donoghue說(shuō):許多數(shù)據(jù)可視化問(wèn)題仍然存在,是因?yàn)榭茖W(xué)家根本不了解它們,或者不相信更好的數(shù)字值得付出額外的努力。

他一直在努力通過(guò)通過(guò)啟動(dòng)和主持年度Vizbi會(huì)議來(lái)改變這種狀況,該會(huì)議專注于對(duì)生物科學(xué)進(jìn)行可視化,為科學(xué)家舉辦可視化研討會(huì),并整理文獻(xiàn)以獲取最佳實(shí)踐和不良實(shí)踐的證據(jù),這些均已匯編成他的2018年度評(píng)論論文。

他說(shuō):但是總的來(lái)說(shuō),這項(xiàng)努力還沒(méi)有獲得很大的動(dòng)力?!拔艺J(rèn)為我們還有很長(zhǎng)的路要走?!?/p>

缺乏認(rèn)識(shí)的原因之一是,大多數(shù)科學(xué)家沒(méi)有接受任何有關(guān)數(shù)據(jù)可視化的培訓(xùn)。

理科研究生很少需要它,而且大多數(shù)機(jī)構(gòu)都不提供基于科學(xué)可視化設(shè)計(jì)的課程。Weissgerber說(shuō),對(duì)于許多學(xué)生,尤其是生物醫(yī)學(xué)專業(yè)的學(xué)生來(lái)說(shuō),他們唯一接觸數(shù)據(jù)可視化的地方是針對(duì)他們的需求量身定制的統(tǒng)計(jì)課程。

在顯示數(shù)據(jù)的方式上,科學(xué)家也傾向于遵循慣例,這使不良做法長(zhǎng)期存在。

對(duì)抗先例之力的一種方法是,將更好的設(shè)計(jì)原則納入科學(xué)家用來(lái)繪制數(shù)據(jù)的工具中(例如,已經(jīng)從“彩虹”默認(rèn)設(shè)置切換到更具感知性的調(diào)色板的軟件工具)。

O’Donoghue說(shuō),大多數(shù)科學(xué)家都不會(huì)學(xué)習(xí)更好的可視化實(shí)踐,“但是他們將使用工具。如果這些工具具有更好的原理,那么默認(rèn)情況下,它們將[應(yīng)用那些]?!?/p>

他說(shuō),科學(xué)出版商也可以提供幫助?!拔艺J(rèn)為期刊可以通過(guò)制定標(biāo)準(zhǔn)來(lái)發(fā)揮作用。”?早期的科學(xué)家從經(jīng)驗(yàn)更豐富的同事和已發(fā)表的論文中汲取線索。

包括PLoS Biology,?ELife和?Nature Biomedical Engineering在內(nèi)的一些期刊已經(jīng)對(duì)Weissgerber的2015年條形圖研究做出了回應(yīng)。她說(shuō):“自論文發(fā)表以來(lái),許多期刊已經(jīng)改變了政策,禁止或不鼓勵(lì)將條形圖用于連續(xù)數(shù)據(jù),特別是對(duì)于小型數(shù)據(jù)集?!?/p>

隨著科學(xué)數(shù)據(jù)變得越來(lái)越復(fù)雜,科學(xué)家將需要繼續(xù)開(kāi)發(fā)新型的可視化文件來(lái)處理這種復(fù)雜性。

為了使這些可視化效果對(duì)科學(xué)家和公眾都有效,數(shù)據(jù)可視化設(shè)計(jì)人員將必須對(duì)人類的視覺(jué)處理進(jìn)行最佳研究,以便與大腦合作而不是與之對(duì)抗。

參考網(wǎng)站:Knowledge Magazine

 

本文由 @小陳同學(xué) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!