婷婷伊人久久大香线蕉AV,亚洲另类激情综合偷自拍图片

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

為什么科學(xué)家需要更好地進(jìn)行數(shù)據(jù)可視化

小陳同學(xué)

2020-10-20

0 評(píng)論 3900 瀏覽 7 收藏

30 分鐘

編輯導(dǎo)語(yǔ)：數(shù)據(jù)可視化，是數(shù)據(jù)科學(xué)家工作的重要組成部分。在項(xiàng)目的早期階段，科學(xué)家通常會(huì)進(jìn)行探索性數(shù)據(jù)分析，以獲取對(duì)數(shù)據(jù)的一些洞察；在項(xiàng)目結(jié)束時(shí)，能以清晰、簡(jiǎn)潔和引人注目的方式展示最終結(jié)果也非常重要，這樣才能讓你的非技術(shù)性客戶能夠理解你的意圖。

想象一本沒(méi)有圖像的科學(xué)教科書，沒(méi)有圖表、圖表、帶有箭頭和標(biāo)簽的插圖或圖表，科學(xué)將很難理解。

那是因?yàn)槿祟愄焐褪且曈X(jué)生物，人們以圖形形式吸收信息，而這些信息會(huì)以文字形式逃避。圖像對(duì)于各種敘事都是有效的，尤其是在故事復(fù)雜的情況下（如科學(xué)常常如此）。

科學(xué)的視覺(jué)效果對(duì)于分析數(shù)據(jù)，傳達(dá)實(shí)驗(yàn)結(jié)果甚至做出令人驚訝的發(fā)現(xiàn)至關(guān)重要。

麻省理工學(xué)院廣泛研究所的創(chuàng)意總監(jiān)Bang Wong說(shuō)：可視化可以揭示很難或不可能以其他任何方式找到的數(shù)據(jù)模式，趨勢(shì)和聯(lián)系?！袄L制數(shù)據(jù)可以使我們看到數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu)，而如果要查看表，則無(wú)法看到這些結(jié)構(gòu)?！?/p>

但是，很少有科學(xué)家會(huì)像在生成數(shù)據(jù)或撰寫數(shù)據(jù)時(shí)一樣，對(duì)視覺(jué)效果給予同等的關(guān)注。

數(shù)據(jù)可視化科學(xué)家SeánO’Donoghue說(shuō)：大多數(shù)科學(xué)出版物附帶的圖表往往是研究人員要做的最后一件事，“可視化實(shí)際上只是錦上添花?！?/p>

結(jié)果，科學(xué)中充斥著不良的數(shù)據(jù)可視化效果，使讀者感到困惑，甚至可能誤導(dǎo)制造它們的科學(xué)家。

數(shù)據(jù)視覺(jué)效果不足會(huì)降低質(zhì)量，并阻礙科學(xué)研究的進(jìn)展。隨著越來(lái)越多的科學(xué)圖像進(jìn)入新聞和社交媒體（從氣候變化到疾病暴發(fā)的一切圖示），不良視覺(jué)效果有可能損害公眾對(duì)科學(xué)的理解。

隨著科學(xué)數(shù)據(jù)的數(shù)量和復(fù)雜性日益增加，這個(gè)問(wèn)題變得更加嚴(yán)重。這些數(shù)據(jù)的可視化，理解和共享它們比以往任何時(shí)候都更加重要。

然而，科學(xué)家很少接受可視化培訓(xùn)。新南威爾士大學(xué)的奧多諾休（O’Donoghue）是《2018年生物醫(yī)學(xué)數(shù)據(jù)年度回顧》中有關(guān)生物醫(yī)學(xué)數(shù)據(jù)可視化的論文的主要作者，他說(shuō)：“社區(qū)尚未普遍意識(shí)到這確實(shí)是必要的?！?/p>

但是有進(jìn)步的跡象，在過(guò)去的十年中，至少召開(kāi)了兩次致力于科學(xué)數(shù)據(jù)可視化的年度會(huì)議。

《自然方法》（Nature Methods）雜志在2010年至2016年定期刊登有關(guān)創(chuàng)建更好的圖形和圖表的專欄文章?，然后將其改編為科學(xué)家向該雜志提交論文的指南。但是到目前為止，很少有科學(xué)家關(guān)注這個(gè)問(wèn)題。

改善科學(xué)可視化將需要更好地了解人腦如何看待世界的優(yōu)點(diǎn)，缺點(diǎn)和偏見(jiàn)。

幸運(yùn)的是，研究已經(jīng)開(kāi)始揭示人們?nèi)绾伍喿x和錯(cuò)誤閱讀各種可視化圖像，以及哪種類型的圖表最有效，最容易破譯，應(yīng)用這些知識(shí)應(yīng)該可以更好地進(jìn)行科學(xué)的視覺(jué)交流。

猶他大學(xué)的計(jì)算機(jī)科學(xué)家Miriah Meyer說(shuō)：“我們對(duì)有效的方法有很多實(shí)用的知識(shí)。”、 “有許多原則經(jīng)過(guò)時(shí)間的考驗(yàn)，并一遍又一遍地證明是有效的?！?/p>

一、圖表選擇

人類視覺(jué)系統(tǒng)的發(fā)展是為了幫助我們?cè)谧匀皇澜缰猩婧桶l(fā)展，而不是閱讀圖表。

我們的大腦以可以幫助我們?cè)谟卸酒贩N中找到可食用植物，發(fā)現(xiàn)獵物并且在白天和黑夜中都能很好地看到自己的眼睛的方式來(lái)解釋。通過(guò)分析我們從眼睛獲得的信息來(lái)實(shí)現(xiàn)這些目的，我們的大腦使我們對(duì)世界有了量身定制的感知。

在1980年代初期，貝爾實(shí)驗(yàn)室的統(tǒng)計(jì)學(xué)家威廉·克利夫蘭（William Cleveland）和羅伯特·麥吉爾（Robert McGill），開(kāi)始研究人類感知的細(xì)節(jié)如何影響我們解密數(shù)據(jù)圖形顯示的能力，從而發(fā)現(xiàn)哪種圖表發(fā)揮了我們的優(yōu)勢(shì)，以及我們?cè)谂c之抗?fàn)帯?/p>

克利夫蘭（Cleveland）和麥吉爾（McGill）在1984年發(fā)表在《美國(guó)統(tǒng)計(jì)協(xié)會(huì)雜志》（Journal of the American Statistics Association）上的開(kāi)創(chuàng)性論文中，根據(jù)人們閱讀內(nèi)容的便捷程度，對(duì)視覺(jué)元素進(jìn)行了排名。

人們?cè)诒鎰e某些類型的視覺(jué)效果上比其他特征更勝一籌，例如，兩條線的長(zhǎng)度或一條線的方向比灰色陰影或顏色的強(qiáng)度更容易分辨。研究表明，使用此列表頂部視覺(jué)元素的圖形比靠近底部的圖形更易于閱讀且更有效。

他們的實(shí)驗(yàn)表明，人們最擅長(zhǎng)基于條形或折線的長(zhǎng)度來(lái)閱讀圖表，例如在標(biāo)準(zhǔn)條形圖中。當(dāng)重要的是要準(zhǔn)確識(shí)別值之間的細(xì)微差別時(shí)，這些可視化是最佳選擇。

研究參與者發(fā)現(xiàn)很難判斷方向，角度和面積的差異。使用體積，曲率或陰影來(lái)表示數(shù)據(jù)的圖形更加困難，最不有效的方法是色彩飽和度。

西雅圖大學(xué)的計(jì)算機(jī)科學(xué)家杰弗里·海爾（Jeffrey Heer）說(shuō)：“當(dāng)聽(tīng)眾察覺(jué)微小差異時(shí)，聽(tīng)眾察覺(jué)的能力將越來(lái)越差”。通常，最佳做法是使用列表中滿足每種數(shù)據(jù)類型需求的最高圖形元素。

例如：如果重要的是要表明一種特定疾病的致死性遠(yuǎn)大于其他疾病，那么使用圓圈大小代表死亡人數(shù)的圖形將非常有用。但是要強(qiáng)調(diào)致命性較低的疾病之間死亡人數(shù)差異的小得多，條形圖將更加有效。

2010年，Heer使用亞馬遜的Mechanical Turk眾包服務(wù)確認(rèn)了?克利夫蘭和麥吉爾的排名在現(xiàn)代數(shù)字環(huán)境中是正確的。

從那以后，Heer，O’Donoghue和其他人使用眾包來(lái)測(cè)試可視化的許多其他方面，以找出最有效的方法。O’Donoghue說(shuō)：“在整個(gè)領(lǐng)域都具有強(qiáng)大的力量，并確實(shí)為它奠定了堅(jiān)實(shí)的工程基礎(chǔ)?！?/p>

二、有害的餡餅

克利夫蘭和麥吉爾（McGill）的圖形排名凸顯了為什么一些流行的數(shù)字不是很有效。一個(gè)很好的例子是廣受歡迎的餅圖，它使愛(ài)德華·塔夫特（Edward Tufte）等數(shù)據(jù)可視化專家不屑一顧。

Tufte在1983年頗具影響力的論文《定量信息的可視化顯示》中寫道：“唯一不及餅圖的設(shè)計(jì)就是其中的幾個(gè)?！?/p>

餅圖通常用于比較整個(gè)部分，這是一項(xiàng)具有認(rèn)知挑戰(zhàn)性的視覺(jué)任務(wù)。

讀者需要判斷餅圖的面積之間的差異，或者判斷圖表中心的角度之間的差異：兩種類型的估算比辨別條形圖上條形的長(zhǎng)度差異要困難得多。在許多情況下是更好的選擇。

餅圖最適合用來(lái)顯示各個(gè)部分與整體的關(guān)系。

在此圖中，餅形圖有效地顯示了每個(gè)經(jīng)濟(jì)部門對(duì)溫室氣體總排放量的貢獻(xiàn)大小，但是很難將各個(gè)部門進(jìn)行比較。條形圖允許輕松比較各扇區(qū)，但無(wú)法傳達(dá)每個(gè)扇區(qū)與總數(shù)之間的關(guān)系。

餅圖之所以誘人，是因?yàn)樗鼈兺ǔ１葪l形圖更具吸引力，易于填充顏色并且易于制造。

但是它們很少是最佳選擇，只有在有限的情況下才可以接受。如果目標(biāo)是顯示零件的總和，或者比較零件與該整體（而不是彼此比較切片），則只要精度不重要，執(zhí)行良好的餅圖就足夠了。

例如：一個(gè)餅圖很好地描繪了每個(gè)經(jīng)濟(jì)部門對(duì)溫室氣體排放的貢獻(xiàn)，表明大約一半來(lái)自電力和熱力生產(chǎn)以及農(nóng)業(yè)，林業(yè)和其他土地利用。通常最受關(guān)注的交通運(yùn)輸占了很小的一部分。

在這種情況下，將六個(gè)條形圖并排放置并不能立即顯示出這些部分的總和為100％或每個(gè)條形圖占整體的比例。

在某些科學(xué)學(xué)科中，餅圖只是用于顯示特定類型數(shù)據(jù)的標(biāo)準(zhǔn)實(shí)踐。而且很難推翻傳統(tǒng)。

Wong說(shuō)：“表觀遺傳學(xué)中的某些領(lǐng)域，我們必須顯示餅圖?！?Wong說(shuō)，他與Broad Institute的生物醫(yī)學(xué)科學(xué)家合作創(chuàng)建了更好的可視化效果?！拔抑里瀳D的缺點(diǎn)，但是它總是在每個(gè)出版物中都以餅圖的形式顯示出來(lái)，因此人們堅(jiān)持這一觀點(diǎn)非常嚴(yán)格。”

在其他情況下，額外的工作需要人腦來(lái)使他們成為傳遞準(zhǔn)確信息或連貫故事的不良工具。

三、酒吧后面

盡管條形圖易于閱讀和理解，但這并不意味著它們始終是最佳選擇。在某些領(lǐng)域，例如心理學(xué)、醫(yī)學(xué)和生理學(xué)，條形圖經(jīng)常會(huì)歪曲基礎(chǔ)數(shù)據(jù)并掩蓋重要的細(xì)節(jié)。

明尼蘇達(dá)州羅徹斯特市梅奧診所的生理學(xué)家Tracey Weissgerber說(shuō)：“如果要可視化計(jì)數(shù)或比例，則應(yīng)使用條形圖?！彼芯垦芯康耐瓿煞绞胶蛨?bào)告方法?！暗菍?duì)于可視化連續(xù)數(shù)據(jù)，它們并不是一種非常有效的策略?！?/p>

Weissgerber在2015年對(duì)頂級(jí)生理學(xué)期刊進(jìn)行了一項(xiàng)調(diào)查，發(fā)現(xiàn)約有85％的論文至少包含一張代表連續(xù)數(shù)據(jù)的條形圖，例如血壓或體溫的測(cè)量，每個(gè)樣品在相關(guān)范圍內(nèi)可以有任何值。

但是代表連續(xù)數(shù)據(jù)的條形圖可能無(wú)法顯示一些重要信息，例如每個(gè)條形圖代表多少個(gè)樣本以及條形圖內(nèi)是否有子組。

右邊的四組數(shù)據(jù)中的每一組都可以由左邊的同一條形圖準(zhǔn)確地表示，這說(shuō)明了條形圖如何掩蓋有關(guān)數(shù)據(jù)的重要細(xì)節(jié)，可能會(huì)誤導(dǎo)讀者。

例如：魏斯伯格（Weissgerber）指出，妊娠并發(fā)癥先兆子癇可能源于母親的問(wèn)題或嬰兒或胎盤的問(wèn)題。但是在這些人群中，是通過(guò)不同途徑達(dá)到相同癥狀的患者亞組。

Weissgerber說(shuō)：“我們的確專注于試圖理解和識(shí)別患有先兆子癇的不同亞型的女性?！?“而且問(wèn)題之一是，如果我們?cè)跅l形圖中顯示所有數(shù)據(jù)，則條形圖中沒(méi)有子組?！?/p>

對(duì)于基本生物醫(yī)學(xué)中常見(jiàn)的小樣本量研究，條形圖尤其有問(wèn)題。條形圖沒(méi)有顯示樣本的大小，而離群值可能會(huì)對(duì)條形圖高度指示的平均值產(chǎn)生很大影響。

Weissgerber說(shuō)：“挑戰(zhàn)之一是，在基礎(chǔ)生物醫(yī)學(xué)的許多領(lǐng)域，條形圖僅被接受為…我們?nèi)绾物@示連續(xù)數(shù)據(jù)?！?/p>

對(duì)于顯示連續(xù)數(shù)據(jù)，許多類型的圖形要優(yōu)于條形圖。

散點(diǎn)圖（頂部）為讀者提供了有關(guān)數(shù)據(jù)的更多詳細(xì)信息，揭示了樣本數(shù)量以及是否存在離群值或聚類：箱形圖（中）非常適合顯示數(shù)據(jù)集的可變性，直方圖（底部）使讀者可以評(píng)估數(shù)據(jù)的分布。

對(duì)于小型連續(xù)數(shù)據(jù)集，有幾個(gè)很好的替代圖。

散點(diǎn)圖，箱形圖和直方圖都可以揭示數(shù)據(jù)的分布，但在魏斯格伯分析的論文中很少使用。為了幫助解決此問(wèn)題，她開(kāi)發(fā)了工具來(lái)創(chuàng)建簡(jiǎn)單的散點(diǎn)圖和各種交互式圖形。

四、廢墟的彩虹

色彩對(duì)于突出顯示數(shù)據(jù)的不同方面并為科學(xué)圖形增添生命是非常有效的，但這也是出錯(cuò)的最簡(jiǎn)單方法之一。人類對(duì)顏色的感知并不簡(jiǎn)單，大多數(shù)科學(xué)家在選擇顏色來(lái)代表其數(shù)據(jù)時(shí)并未考慮視覺(jué)系統(tǒng)的特殊性。

最常見(jiàn)的不良做法之一是使用彩虹色標(biāo)，從地質(zhì)學(xué)到氣候?qū)W再到分子生物學(xué)，研究人員傾向于在Roy G. Biv的幫助下繪制數(shù)據(jù)圖。但是彩虹調(diào)色板有幾個(gè)嚴(yán)重的缺點(diǎn)很少推薦。

Wong說(shuō)，即使它是從自然光譜中得出的，彩虹中的顏色順序也不直觀。“您有點(diǎn)想，藍(lán)色比綠色大嗎？黃色比紅色大嗎？”

更大的問(wèn)題是人腦對(duì)彩虹的感知不均勻，人們從色調(diào)（例如紅色或藍(lán)色），飽和度（顏色的強(qiáng)度）和亮度（混入多少白色或黑色）方面看到顏色。

人類的大腦最依賴亮度來(lái)解釋形狀和深度，因此傾向于將最亮的顏色表示為峰值，將較暗的顏色表示為山谷。但是，彩虹中最亮的顏色是黃色，通常在刻度的中間某個(gè)地方可以看到，從而導(dǎo)致觀看者在錯(cuò)誤的位置看到高點(diǎn)。

使問(wèn)題更加復(fù)雜的是，某些顏色之間的過(guò)渡似乎是漸進(jìn)的，而其他變化似乎更為突然。

另一方面，基礎(chǔ)數(shù)據(jù)通常具有一致的變化率，與彩虹的不均勻性不匹配。英格蘭雷丁大學(xué)的氣候科學(xué)家埃德·霍金斯（Ed Hawkins）說(shuō)：“您可以擁有一個(gè)不存在的感知邊界，也可以隱藏存在的邊界?！?甚至科學(xué)家在解釋自己的數(shù)據(jù)時(shí)也可能陷入這種幻想。

為了避免彩虹問(wèn)題，一些研究人員提出了基于數(shù)學(xué)的調(diào)色板，可以更好地將其顏色的感知變化與相應(yīng)數(shù)據(jù)的變化進(jìn)行匹配。其中一些較新的色標(biāo)特別適用于有紅綠色色盲的人,據(jù)估計(jì)，這種疾病會(huì)影響約8％的男性（但僅影響女性的一小部分）。

盡管制圖師和霍金斯等少數(shù)科學(xué)家一直在反對(duì)彩虹，但數(shù)十年來(lái)，它在科學(xué)文獻(xiàn)中仍然無(wú)處不在。

自從彩色印刷發(fā)明以來(lái)，某些科學(xué)領(lǐng)域可能就一直在使用它。而且，由于許多科學(xué)家并不了解彩虹的問(wèn)題所在，因此他們認(rèn)為沒(méi)有理由違背傳統(tǒng)?；艚鹚拐f(shuō)：“人們習(xí)慣使用它，所以他們喜歡它，對(duì)它感到自在?！?/p>

彩虹色標(biāo)是科學(xué)家用來(lái)創(chuàng)建可視化效果的許多軟件的默認(rèn)色，這也鼓勵(lì)了這種傾向。但是霍金斯和其他人一直在推動(dòng)軟件制造商改變默認(rèn)設(shè)置，并取得了一些成功。

2014年，MathWorks將MATLAB軟件程序的默認(rèn)設(shè)置更改為一種改進(jìn)的配色方案，稱為parula；在2015年，一位認(rèn)知科學(xué)家和一位數(shù)據(jù)科學(xué)家開(kāi)發(fā)了一種?新的默認(rèn)配色方案，稱為viridis，用于使用流行的Python編程語(yǔ)言進(jìn)行繪圖。

十二種軟件庫(kù)中已經(jīng)添加了一種新的?數(shù)學(xué)上衍生的色彩方案cividis，盡管這在所有軟件庫(kù)中都不是默認(rèn)的。

五、危險(xiǎn)熱圖

人類視覺(jué)系統(tǒng)中最有趣的怪癖之一（也是數(shù)據(jù)可視化中最棘手的怪癖之一）是，我們對(duì)顏色的感知可能會(huì)受??到附近其他顏色的影響。在某些情況下，效果非常顯著，導(dǎo)致各種視錯(cuò)覺(jué)。

每當(dāng)可視化將彼此相鄰的不同顏色或什至是相同顏色的陰影放置時(shí)，它們都可以以意想不到的方式進(jìn)行交互。完全相同的顏色在被較暗的陰影包圍時(shí)看起來(lái)與在被較淺的陰影包圍時(shí)看起來(lái)完全不同，這種現(xiàn)象稱為同時(shí)對(duì)比度。

當(dāng)陰影跨過(guò)方格網(wǎng)格時(shí)，棋盤格陰影錯(cuò)覺(jué)就是其中一個(gè)眾所周知的例子，它可以發(fā)揮大腦對(duì)顏色的解釋。

Wong說(shuō)：“顏色相互作用的影響是一個(gè)巨大的問(wèn)題?！?在生命科學(xué)中，一個(gè)普遍的例子是熱圖，該熱圖通常用于揭示兩組數(shù)據(jù)之間的關(guān)系。

他說(shuō)：“如果翻閱期刊，那么三分之一的數(shù)字就是熱圖?！?“這是一種非常流行的數(shù)據(jù)可視化形式，實(shí)際上在偏向科學(xué)數(shù)據(jù)?！?/p>

熱圖是一個(gè)二維矩陣，基本上是一個(gè)表或網(wǎng)格，它使用網(wǎng)格中每個(gè)正方形的顏色表示基礎(chǔ)數(shù)據(jù)的值。一種或多種色調(diào)的較淺和較深的陰影表示較低或較高的值。

熱圖在顯示基因活性數(shù)據(jù)方面特別受歡迎，可幫助研究人員確定在不同情況下或多或少活躍地產(chǎn)生蛋白質(zhì)（或其他分子）的基因模式。

此熱圖上的兩個(gè)加星號(hào)的正方形是相同的橙色陰影，表示在基因活性方面的值相同。但是相鄰方格的顏色不同意味著加星標(biāo)的方格看起來(lái)不一樣，這可能會(huì)產(chǎn)生誤解。

熱圖非常適合將大量數(shù)據(jù)打包到緊湊的顯示器中，但是將各種顏色的陰影緊挨在一起會(huì)觸發(fā)同時(shí)出現(xiàn)的對(duì)比度錯(cuò)覺(jué)。

例如：科學(xué)家比較網(wǎng)格中各個(gè)正方形的顏色很容易將兩個(gè)不同的橙色陰影誤解為相同，或者認(rèn)為兩個(gè)相同的陰影完全不同，這取決于周圍正方形的顏色。

Wong說(shuō)：“在熱圖中，這是一個(gè)巨大的問(wèn)題，您需要依靠一堆彼此相鄰的彩色瓷磚?！?“這種無(wú)意識(shí)的偏見(jiàn)在每個(gè)熱圖上都非常普遍?！?/p>

對(duì)于基因活性數(shù)據(jù)，綠色和紅色通常用于顯示哪些基因或多或少具有活性。

與由較深的綠色，紅色或黑色包圍的特定綠色相比，由較淺的綠色包圍的特定綠色外觀看起來(lái)非常不同；綠色陰影所代表的值是相同的，但是根據(jù)其相鄰的正方形，它會(huì)顯得更高或更低。

網(wǎng)格的一部分中出現(xiàn)一團(tuán)亮綠色的方塊，可能意味著該基因在一組緊密相關(guān)的亞種中具有很高的活性，例如細(xì)菌。

同時(shí)，在網(wǎng)格的另一部分，一個(gè)暗綠色的方塊被黑色方塊包圍可能看起來(lái)很亮，這表明同一基因在無(wú)關(guān)的細(xì)菌物種中具有很高的活性，而實(shí)際上它只是弱活性的。

Wong說(shuō)，緩解問(wèn)題的一種方法是在網(wǎng)格的各個(gè)部分之間引入一些空白，也許是將相關(guān)物種，樣本組或相關(guān)基因集分開(kāi)。

打破正方形將減少來(lái)自相鄰顏色的干擾，另一種解決方案是使用完全不同的顯示，例如使用線連接高活性基因的圖形，或代表隨著時(shí)間或在兩個(gè)實(shí)驗(yàn)狀態(tài)之間基因活性變化的一系列圖形。

六、消息混亂

確?？梢暬粫?huì)歪曲數(shù)據(jù)或誤導(dǎo)讀者，這對(duì)于共享科學(xué)成果至關(guān)重要。但是，重要的是要考慮一個(gè)人物是否真的在引起人們對(duì)最相關(guān)信息的關(guān)注，而不是分散讀者的注意力。

例如：當(dāng)繪制為線圖或直方圖時(shí)，許多數(shù)據(jù)集的分布將呈鐘形，大部分?jǐn)?shù)據(jù)位于中心附近。Wong說(shuō)：“但是我們經(jīng)常關(guān)心尾巴上有什么。”?對(duì)于觀看者來(lái)說(shuō)，“中間常常有這么大的舊東西不堪重負(fù)?！?/p>

解決方案可能是使用高度以外的其他方式來(lái)表示數(shù)據(jù)的分布，一個(gè)選項(xiàng)是條形碼圖，該圖將每個(gè)值顯示為一條線。在這種圖形上，更容易看到低濃度區(qū)域的細(xì)節(jié)，這些細(xì)節(jié)往往在鐘形曲線上幾乎消失了。

鐘形曲線引起人們對(duì)大量數(shù)據(jù)分布的關(guān)注。但是有時(shí)候真正重要的是數(shù)據(jù)邊緣的內(nèi)容。在這種情況下，條形碼圖可能是更好的選擇。

上圖顯示細(xì)胞系對(duì)基因FOXA1的依賴性;?負(fù)-1參考線左側(cè)的那些需要該基因才能存活。這些細(xì)胞系很難在鐘形曲線上看到，但在條形碼上卻很突出。

精心應(yīng)用的顏色還可以增強(qiáng)和闡明圖形的信息。例如，在使用不同顏色標(biāo)識(shí)數(shù)據(jù)類別的散點(diǎn)圖上，最重要的信息應(yīng)由最突出的顏色表示。

制圖程序可能只是將紅色隨機(jī)分配給對(duì)照組，因?yàn)樗菙?shù)據(jù)的第一列，而對(duì)于發(fā)現(xiàn)至關(guān)重要的有趣突變體最終變成了灰色。

數(shù)據(jù)可視化記者Alberto Cairo在2013年的《功能藝術(shù)》中寫道：“純色在自然界中并不常見(jiàn)，因此請(qǐng)限制它們以突出顯示圖形中重要的內(nèi)容?！?“將柔和的色調(diào)-灰色，淺藍(lán)色和綠色-用于其他所有顏色?！?/p>

除了彩虹和同步對(duì)比度之外，還有很多其他方法可以使顏色出現(xiàn)問(wèn)題。使用過(guò)多的顏色會(huì)分散可視化效果的主要信息。彼此之間太相似或與圖像的背景顏色太相似的顏色可能難以辨認(rèn)。

與文化期望背道而馳的顏色也會(huì)影響讀者對(duì)圖形的理解程度。

例如，在顯示地形的地圖上，人們期望植被是綠色的，干旱地區(qū)是棕色的，海拔更高的是白色，城市是灰色的，當(dāng)然水是藍(lán)色的。如果地圖沒(méi)有遵循這些公認(rèn)的配色方案，將很難閱讀。

想象一下美國(guó)的選舉地圖，其中民主地區(qū)顯示為紅色，共和黨地區(qū)顯示為藍(lán)色，或者條形圖以鮮艷而歡快的顏色顯示了不同的死亡原因，不和諧將使人們難以吸收他們的信息。

讀者在文化上定義了對(duì)不同顏色含義的期望，違反這種期望會(huì)使圖形，地圖和其他插圖更難以解讀，如美國(guó)這張變色的浮雕圖所示。

如果不需要顏色，則有時(shí)最安全的做法是堅(jiān)持使用灰色陰影。正如塔夫特（Tufte）在其1990年的《遠(yuǎn)景信息》（Envisioning Information）一書中所言，“避免災(zāi)難成為將色彩帶入信息的第一條原則：?首先，沒(méi)有傷害?！?/p>

七、想象未來(lái)

O’Donoghue說(shuō)：許多數(shù)據(jù)可視化問(wèn)題仍然存在，是因?yàn)榭茖W(xué)家根本不了解它們，或者不相信更好的數(shù)字值得付出額外的努力。

他一直在努力通過(guò)通過(guò)啟動(dòng)和主持年度Vizbi會(huì)議來(lái)改變這種狀況，該會(huì)議專注于對(duì)生物科學(xué)進(jìn)行可視化，為科學(xué)家舉辦可視化研討會(huì)，并整理文獻(xiàn)以獲取最佳實(shí)踐和不良實(shí)踐的證據(jù)，這些均已匯編成他的2018年度評(píng)論論文。

他說(shuō)：但是總的來(lái)說(shuō)，這項(xiàng)努力還沒(méi)有獲得很大的動(dòng)力?！拔艺J(rèn)為我們還有很長(zhǎng)的路要走?！?/p>

缺乏認(rèn)識(shí)的原因之一是，大多數(shù)科學(xué)家沒(méi)有接受任何有關(guān)數(shù)據(jù)可視化的培訓(xùn)。

理科研究生很少需要它，而且大多數(shù)機(jī)構(gòu)都不提供基于科學(xué)可視化設(shè)計(jì)的課程。Weissgerber說(shuō)，對(duì)于許多學(xué)生，尤其是生物醫(yī)學(xué)專業(yè)的學(xué)生來(lái)說(shuō)，他們唯一接觸數(shù)據(jù)可視化的地方是針對(duì)他們的需求量身定制的統(tǒng)計(jì)課程。

在顯示數(shù)據(jù)的方式上，科學(xué)家也傾向于遵循慣例，這使不良做法長(zhǎng)期存在。

對(duì)抗先例之力的一種方法是，將更好的設(shè)計(jì)原則納入科學(xué)家用來(lái)繪制數(shù)據(jù)的工具中（例如，已經(jīng)從“彩虹”默認(rèn)設(shè)置切換到更具感知性的調(diào)色板的軟件工具）。

O’Donoghue說(shuō)，大多數(shù)科學(xué)家都不會(huì)學(xué)習(xí)更好的可視化實(shí)踐，“但是他們將使用工具。如果這些工具具有更好的原理，那么默認(rèn)情況下，它們將[應(yīng)用那些]?！?/p>

他說(shuō)，科學(xué)出版商也可以提供幫助?！拔艺J(rèn)為期刊可以通過(guò)制定標(biāo)準(zhǔn)來(lái)發(fā)揮作用。”?早期的科學(xué)家從經(jīng)驗(yàn)更豐富的同事和已發(fā)表的論文中汲取線索。

包括PLoS Biology，?ELife和?Nature Biomedical Engineering在內(nèi)的一些期刊已經(jīng)對(duì)Weissgerber的2015年條形圖研究做出了回應(yīng)。她說(shuō)：“自論文發(fā)表以來(lái)，許多期刊已經(jīng)改變了政策，禁止或不鼓勵(lì)將條形圖用于連續(xù)數(shù)據(jù)，特別是對(duì)于小型數(shù)據(jù)集?！?/p>

隨著科學(xué)數(shù)據(jù)變得越來(lái)越復(fù)雜，科學(xué)家將需要繼續(xù)開(kāi)發(fā)新型的可視化文件來(lái)處理這種復(fù)雜性。

為了使這些可視化效果對(duì)科學(xué)家和公眾都有效，數(shù)據(jù)可視化設(shè)計(jì)人員將必須對(duì)人類的視覺(jué)處理進(jìn)行最佳研究，以便與大腦合作而不是與之對(duì)抗。

參考網(wǎng)站：Knowledge Magazine

本文由 @小陳同學(xué) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載

題圖來(lái)自 unsplash，基于 CC0 協(xié)議

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App