【讀書(shū)筆記】數(shù)據(jù)分析學(xué)習(xí)總結(jié)(三):磨刀不誤砍柴工——數(shù)據(jù)理解
在這一篇中你將了解數(shù)據(jù)中字段、記錄和數(shù)據(jù)類型等概念,以及制作數(shù)據(jù)表的六點(diǎn)要求,個(gè)人覺(jué)得對(duì)初接觸數(shù)據(jù)的菜鳥(niǎo)我來(lái)說(shuō)比較重要。
?
一、理解數(shù)據(jù) ? ? 扎實(shí)的數(shù)據(jù)分析基本功不單是指揮使用數(shù)據(jù)分析工具,更重要的是對(duì)數(shù)據(jù)有深入認(rèn)識(shí)和解讀,對(duì)數(shù)據(jù)的理解是數(shù)據(jù)分析的一個(gè)重要前提。 ? ??以一張學(xué)生們最熟悉不過(guò)的成績(jī)表為例,介紹下數(shù)據(jù)都長(zhǎng)什么模樣。 1. 字段與記錄 ? ? 這樣的成績(jī)表從數(shù)據(jù)分析的角度來(lái)看,就是一個(gè)典型的數(shù)據(jù)庫(kù)。成績(jī)表最上面的“學(xué)號(hào)”“姓名”“性別”“總分”等被稱為字段,而每位同學(xué)的基本情況和成績(jī)就構(gòu)成了一條條的數(shù)據(jù)記錄。 ? ? 字段是事物或現(xiàn)象的某種特征,在統(tǒng)計(jì)學(xué)中稱為變量。 記錄是事物或現(xiàn)象某種特征的具體表現(xiàn),記錄也稱為數(shù)據(jù)或變量值。 2. 數(shù)據(jù)類型 ? ? 常見(jiàn)的數(shù)據(jù)類型主要有數(shù)字、文字、日期三類,其他的還有貨幣、時(shí)間等其他數(shù)據(jù)類型。 ? ? 如果你想知道到底有多少種數(shù)據(jù)類型,最簡(jiǎn)單的方法就是在Excel中任意選擇一個(gè)單元格,單擊鼠標(biāo)右鍵-設(shè)置單元格格式中可以查看所有數(shù)據(jù)類型,如圖所示: ? ? 這么多的數(shù)據(jù)類型,最終可以歸為兩大類:字符型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。兩種類型顧名思義,區(qū)分的重要依據(jù)為后者可以直接用算術(shù)方法進(jìn)行匯總和分析。 3. 數(shù)據(jù)表 ? ? 一張數(shù)據(jù)表的制作,可以側(cè)面反映出制作者的數(shù)據(jù)沉淀及應(yīng)用水平,數(shù)據(jù)表的設(shè)計(jì)是否合理,關(guān)系著后期數(shù)據(jù)分析的效率及深度。 ? ? 數(shù)據(jù)表設(shè)計(jì)的六點(diǎn)要求: 1)數(shù)據(jù)表由標(biāo)題行和數(shù)據(jù)部分組成; 2)第一行是表的列標(biāo)題(字段名),列標(biāo)題不能重復(fù); 3)第二行起是數(shù)據(jù)部分,數(shù)據(jù)部分的每一行數(shù)據(jù)稱為一個(gè)記錄,并且數(shù)據(jù)部分不允許出現(xiàn)空白行和空白列; 4)數(shù)據(jù)表中不能有合并單元格存在; 5)數(shù)據(jù)表與其他數(shù)據(jù)之間應(yīng)該留出至少一個(gè)空白行和一個(gè)空白列; 6)數(shù)據(jù)表需要以一維的形式存儲(chǔ),但是在實(shí)際操作中接觸的數(shù)據(jù)往往是以二維表格的形式存在的,此時(shí)應(yīng)將二維表轉(zhuǎn)化為一維表的形式存儲(chǔ)數(shù)據(jù); ? ? 對(duì)于以上數(shù)據(jù)表設(shè)計(jì)的幾點(diǎn)要求,本人有所體會(huì),我做的數(shù)據(jù)報(bào)表里有不少的合并單元格,基本都是為了滿足一時(shí)之需,沒(méi)有為后續(xù)數(shù)據(jù)分析做長(zhǎng)遠(yuǎn)考慮和規(guī)劃,還有就是在數(shù)據(jù)部分不要有空白行和空別列,這些都不是規(guī)范的數(shù)據(jù)表。 ? ??肯定會(huì)有人問(wèn)第六點(diǎn)中一維表和二維表是什么,先看下下面兩個(gè)表格應(yīng)該就能看出些區(qū)別,二維表如下圖所示: 我使用Excel的數(shù)據(jù)透視表功能將上面的二維表變?yōu)榱艘痪S表如下圖所示: ? ? 兩表的區(qū)別就在于,二維表的列標(biāo)簽是數(shù)據(jù):2006年、2007年、2008年;而一維表的列標(biāo)簽是字段:地點(diǎn)、年份、GDP,而且表中每個(gè)指標(biāo)就對(duì)應(yīng)一個(gè)取值。 ? ? 至于轉(zhuǎn)換方法,可參見(jiàn)網(wǎng)上各種講解,使用數(shù)據(jù)透視表功能即可,這里不便于配圖講解,若有問(wèn)題可聯(lián)系我。 ? ? 可能大家對(duì)于以上的數(shù)據(jù)表要求還很迷茫,不知道為什么要做到不能有合并單元格,不能有數(shù)據(jù)空白,要用一維表而非二維表存儲(chǔ),相信在后面處理數(shù)據(jù)時(shí)我們會(huì)得到答案。 ? ? 就先說(shuō)到這吧,其實(shí)沒(méi)說(shuō)完,但這種枯燥無(wú)味看似專業(yè)性較濃的東西寫(xiě)多了別人是看不下去的,等著用下微信平臺(tái)的數(shù)據(jù)分析新功能看看情況。 ? ? ?下一篇會(huì)講數(shù)據(jù)來(lái)源的內(nèi)容。 ?? ?本文系作者Junehi(微信公眾賬號(hào):Junehi?)授權(quán)發(fā)布,轉(zhuǎn)載請(qǐng)注明來(lái)源于人人都是產(chǎn)品經(jīng)理,并保留本文鏈接。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!