網(wǎng)站數(shù)據(jù)分析的一些問題(一)
從事數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)分析相關(guān)的工作也有段時(shí)間了,其實(shí)很多問題一直縈繞在腦中,有些甚至已經(jīng)困擾相當(dāng)長(zhǎng)的一段時(shí)間,自己也在不斷學(xué)習(xí)和工作的過程中尋找各種解決方案或者不斷優(yōu)化和替換之前的方案。這些問題從宏觀層面到細(xì)節(jié)層面,很多問題其實(shí)沒有絕對(duì)完美的解決方案,我們只能一步一步地摸索,不斷尋找更優(yōu)的方案以其讓問題能夠更好高效地得到解決,但每個(gè)人掌握的知識(shí)有限,所以無論怎么樣每個(gè)人對(duì)問題的看法都會(huì)存在局限性;同時(shí)因?yàn)槊總€(gè)人的知識(shí)背景和經(jīng)歷的差異性,對(duì)各種問題又會(huì)觸發(fā)各種不同的見解,所以通過集思廣益往往能夠得到讓人眼前一亮的結(jié)論。
先說說博客,無論怎么樣我的博客只是想做些記錄和總結(jié),只是表述一些個(gè)人的觀點(diǎn),我想每個(gè)人在學(xué)習(xí)工作中總會(huì)有所積累,有自己在專業(yè)領(lǐng)域的一些收獲,每個(gè)人公平地享有相同的時(shí)間,每個(gè)人學(xué)到的掌握的都是有限的,沒有孰強(qiáng)孰弱之分,差別只在于愿不愿意將其分享出來;博客中整理的內(nèi)容,可能有些人認(rèn)為不適合公開,畢竟有些東西還有些實(shí)用價(jià)值,但必須看到的是目前互聯(lián)網(wǎng)發(fā)展速度太快了,我之前發(fā)的文章等半年之后回去看就會(huì)發(fā)現(xiàn)當(dāng)時(shí)自己的想法并不成熟,如果在現(xiàn)階段可能不會(huì)完全按照上面的思路去實(shí)現(xiàn)了,知識(shí)的更新和積累讓我們不斷選擇更優(yōu)的方法,不斷改進(jìn)和升級(jí)自身的知識(shí)體系,更何況很多東西在一個(gè)業(yè)務(wù)體系下適用,到另外的體系下就不適用了,聰明的人不會(huì)完全照搬照抄原方法,而是尋找最合適的方法,或者使用更靈活變通的方式去使用方法,所以也不必?fù)?dān)心技能被“偷學(xué)”,因?yàn)橹粫?huì)模仿的人不知道怎么用好這些方法,而足夠聰明的人到哪里都能學(xué)到適合自己的方法,在這個(gè)信息膨脹的環(huán)境下無法阻止他們的“偷學(xué)”。
其實(shí)博客最大的收獲還是通過博客認(rèn)識(shí)了很多朋友,尤其是網(wǎng)站分析領(lǐng)域的,相當(dāng)一部分也有自己的博客,大家互相交流學(xué)到了很多東西,有些東西是互補(bǔ)并相互促進(jìn)的,這些朋友都是樂意分享自己想法的人,每個(gè)人都有各自領(lǐng)域的專業(yè)和強(qiáng)項(xiàng),這樣反而使我聽到和學(xué)到了很多耳目一新的東西,受益匪淺。所以如果你有時(shí)間寫寫博客,那么得到的收獲絕對(duì)要比你覺得可能會(huì)失去的多得多。
既然我在博客里面已經(jīng)寫了很多,所以這里想換一個(gè)角色,我想通過幾篇文章把之前遇到的諸多問題羅列出來,希望大家能夠不吝提出自己的看法和解決方案。其實(shí)我更希望在博客的評(píng)論中看到更多不同的看法或者通過文章的思路擴(kuò)展衍生出在其他方向上有價(jià)值的應(yīng)用。另外,知乎真的是一個(gè)非常棒的知識(shí)分享和學(xué)習(xí)的平臺(tái),潛藏了很多的大牛,我會(huì)把整理的每個(gè)問題都貼到知乎上面,這樣可以收集到更多牛人的看法,希望大家在知乎上有認(rèn)識(shí)相關(guān)領(lǐng)域的大牛的可以積極地進(jìn)行邀請(qǐng)。
這篇是第一篇,想重點(diǎn)羅列一些跟網(wǎng)站數(shù)據(jù)分析行業(yè)和數(shù)據(jù)分析師相關(guān)的問題。
Q1、 你因何會(huì)選擇網(wǎng)站分析或互聯(lián)網(wǎng)數(shù)據(jù)分析這個(gè)行業(yè),你認(rèn)為這個(gè)行業(yè)的價(jià)值何在,發(fā)展前景如何?(知乎)
我的答案:互聯(lián)網(wǎng)是一個(gè)陽光行業(yè),而數(shù)據(jù)分析本身又是一個(gè)非常有意思的工作,很多時(shí)候,它就像是一個(gè)偵探從細(xì)枝末節(jié)的線索中尋找那個(gè)唯一的真相,如果你喜歡這種探秘的感覺,那么你同樣會(huì)喜歡上網(wǎng)站數(shù)據(jù)分析這個(gè)行業(yè)。
其實(shí)我之前在《網(wǎng)站分析的應(yīng)用和價(jià)值》這篇文章中介紹過網(wǎng)站數(shù)據(jù)分析的價(jià)值(這里不引用鏈接了,大家可以搜一下),簡(jiǎn)單地說就是“系統(tǒng)地幫助網(wǎng)站實(shí)現(xiàn)更加高效的運(yùn)營(yíng)”。
互聯(lián)網(wǎng)數(shù)據(jù)量的快速膨脹,急需對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)化的處理和分析,以便快速地發(fā)現(xiàn)信息,轉(zhuǎn)化價(jià)值,所以就目前來看,無論是國(guó)外的發(fā)展趨勢(shì),還是國(guó)內(nèi)對(duì)這個(gè)行業(yè)的需求都是快速增長(zhǎng)的,發(fā)展前景是比較樂觀的。
Q2、 作為網(wǎng)站的數(shù)據(jù)分析師,你完成的最有成就感的事情是什么,感到最糾結(jié)的事情又是什么?(知乎)
我的答案:最有成就感的事情就是用數(shù)據(jù)實(shí)現(xiàn)價(jià)值,無論是通過數(shù)據(jù)排查問題進(jìn)而解決問題,還是通過數(shù)據(jù)分析應(yīng)用優(yōu)化網(wǎng)站產(chǎn)品,其實(shí)都是創(chuàng)造價(jià)值的過程。
最糾結(jié)的事情其實(shí)不是整日需要維護(hù)和驗(yàn)證數(shù)據(jù)的一致性、準(zhǔn)確性,數(shù)據(jù)時(shí)常會(huì)存在諸多細(xì)節(jié)上的問題,因?yàn)檫@些基本是必然存在的,無論在哪個(gè)公司,網(wǎng)站從事何種業(yè)務(wù),技術(shù)或者數(shù)據(jù)的環(huán)境如何,數(shù)據(jù)的問題還是無所不在,而保證數(shù)據(jù)質(zhì)量本身就是數(shù)據(jù)分析師最基礎(chǔ)的工作,也是開展分析的前提和基礎(chǔ)。
我最糾結(jié)的還是在于數(shù)據(jù)的需求和應(yīng)用,如果與數(shù)據(jù)的需求方在數(shù)據(jù)的理解上達(dá)不成一致,那么很多數(shù)據(jù)需求就會(huì)存在反復(fù)的調(diào)整變動(dòng),期間就會(huì)做很多重復(fù)的工作或者無用功,甚至有些時(shí)候數(shù)據(jù)分析師大費(fèi)周章地提取的一份數(shù)據(jù)在需求方那里只是用幾秒鐘掃視一遍,沒有產(chǎn)生任何的價(jià)值,這也是令數(shù)據(jù)分析師最傷感的事情。所以數(shù)據(jù)分析始終要從獲取最終insight的角度出發(fā),如果數(shù)據(jù)需求中無法說明獲取數(shù)據(jù)是為了試圖得出何種insight,那么這個(gè)需求基本就沒有實(shí)現(xiàn)的必要了。
Q3、 作為網(wǎng)站的數(shù)據(jù)分析師,你日常工作中最常做的是什么,需要與哪些同事交流,一般會(huì)用到哪些工具?(知乎)
我的答案:數(shù)據(jù)分析師的日常工作很簡(jiǎn)單,就是數(shù)據(jù)處理和觀察報(bào)表,而且這兩塊工作會(huì)占用每天的大部分時(shí)間。如果每天能夠準(zhǔn)時(shí)提供準(zhǔn)確的報(bào)表,及時(shí)地反饋數(shù)據(jù)異常,那么你已經(jīng)是一個(gè)合格的數(shù)據(jù)分析師了。
數(shù)據(jù)分析師要接觸的部門會(huì)比較多,可以是任何有數(shù)據(jù)需求的部門,運(yùn)營(yíng)、產(chǎn)品、市場(chǎng)、銷售、客服……甚至是各層級(jí)的BOSS。
同樣,數(shù)據(jù)分析師日常使用的工具其實(shí)也非常簡(jiǎn)單,估計(jì)在90%的時(shí)間都在使用數(shù)據(jù)庫(kù)的SQL、Excel或者PPT,當(dāng)然視每個(gè)公司的情況會(huì)有差異。所以如果你聽到某位數(shù)據(jù)分析師說他天天在研究什么什么樣的高級(jí)分析方法或者高深的數(shù)據(jù)算法,天天在使用R、SPSS、SAS,那么不排除有裝X的嫌疑。
Q4、 在你剛剛步入網(wǎng)站數(shù)據(jù)分析的工作,或者你曾經(jīng)新到一個(gè)公司或者網(wǎng)站從事數(shù)據(jù)分析師的工作,你是如何著手開始你的新工作的,你覺得你需要了解哪些東西,會(huì)從哪些方面優(yōu)先開始學(xué)習(xí)?(知乎)
我的答案:“業(yè)務(wù) => 網(wǎng)站或產(chǎn)品 => 數(shù)據(jù)處理流程 => 指標(biāo)和報(bào)表”,我的基本流程就是這樣的,當(dāng)然這個(gè)也不絕對(duì)是前后的順序,可以是同時(shí)結(jié)合著看的。
數(shù)據(jù)分析的重點(diǎn)不在于數(shù)據(jù)而在于分析,分析針對(duì)的是業(yè)務(wù),所以業(yè)務(wù)是首要了解的東西,就像一個(gè)人做事情,首先要明確的是要做的是什么事情;然后是網(wǎng)站或產(chǎn)品,它是實(shí)現(xiàn)業(yè)務(wù)的媒介,就像是做事情時(shí)使用的工作或方法;數(shù)據(jù)的處理流程包括了數(shù)據(jù)的獲取、處理和存儲(chǔ)模型,它是記錄信息,可以看做是日記,記錄了一個(gè)人做事情的整個(gè)流程;指標(biāo)和報(bào)表就是為了將一個(gè)人做事情的整個(gè)流程復(fù)述出來,把握重點(diǎn)同時(shí)又不失關(guān)鍵細(xì)節(jié),所以必須要了解指標(biāo)的統(tǒng)計(jì)規(guī)則和報(bào)表的展現(xiàn)方式,以便更好地突顯重點(diǎn),了解省略的細(xì)節(jié),讓復(fù)述貼近事實(shí)。
很明顯,當(dāng)你了解了這個(gè)人在做什么事情之后再去閱讀這個(gè)人在做事情時(shí)記錄的信息或聽取復(fù)述要遠(yuǎn)比你直接通過復(fù)述內(nèi)容或者閱讀記錄信息來猜測(cè)這個(gè)人在做什么事情來得高效得多。
作者:?joegh (《網(wǎng)站分析實(shí)戰(zhàn)》作者)
來源:?《網(wǎng)站數(shù)據(jù)分析的一些問題1》
- 目前還沒評(píng)論,等你發(fā)揮!