夢想與前行:一名數(shù)據(jù)人的自白(上)
離上次寫文已過去五年,回想起那會最開心的事就是在微博上跟同行百舸爭流,恰大數(shù)據(jù)正熱,年少氣盛,懷揣憧憬,樂此不疲。然而,任何一個概念的發(fā)展都是經(jīng)歷了從興起,到炒作,再到回落的循環(huán),能否再次崛起,得看“財報業(yè)績”的檢驗—數(shù)據(jù)的價值是被高估還是低估。在踐行數(shù)據(jù)價值的這條道路上,每個數(shù)據(jù)人都在用自己的方式積極備考,所以覺得有必要再來寫點什么,向各位同仁展開我的考卷,不為他,只為對數(shù)據(jù)的夢想與情懷。
這篇文章的動因——分享一下個人的數(shù)據(jù)從業(yè)歷程,有些主觀,但不失真實,拋磚引玉,期待交流。
前段時間看微博話題討論有些迷茫,有些已經(jīng)被同行確認無疑的觀點竟被反復強調(diào),比如”數(shù)據(jù)挖掘/分析要懂業(yè)務”、”產(chǎn)品是數(shù)據(jù)價值變現(xiàn)的一條有效渠道”,觀點沒錯,但聽多了的感覺就好比一些健康養(yǎng)生專家在闡述吃飯對于健康的重要性,有些會質(zhì)疑自己的認識,難道別人一直都不是在吃飯?還是說難道自己一直是個另類?
任何觀點與認識都是來自個體的經(jīng)歷,經(jīng)歷是前因,觀點是后果,后果不重要,了解前因才是關鍵,只有知道前因,才能更好的對觀點 進行學習、轉化與吸收。
一、不懂商業(yè),技術就僅僅只是技術
正如微博名“@數(shù)據(jù)挖掘_PHP”所示,在沒進入數(shù)據(jù)行業(yè)之前,我是一名標準的PHPer,在一家公關公司從事營銷傳播的技術支持工作。
有一次項目是網(wǎng)站 建設,在進行類目規(guī)劃時,發(fā)現(xiàn)竟然還有數(shù)據(jù)監(jiān)測和咨詢公司,不明覺厲:數(shù)據(jù)監(jiān)測?咨詢?西服領帶?空中飛人?哇~高端大氣上檔次!
從那以后,開始對數(shù)據(jù)公司的關注。
一個月后進入到一家輿情咨詢公司A,開始了數(shù)據(jù)之旅。
需要提及的是:
在公關公司我的認識是:不懂商業(yè),技術就僅僅只是技術。
商業(yè)是什么?商業(yè)是別人有某種愿意付費交換的需求,如果只停留在后端,你永遠聆聽不到這種需求,再大的金礦此刻也只是一朵浮云。
有一個深刻的經(jīng)歷:
當時為了豐富網(wǎng)站,需要采集百度內(nèi)容,不停的拼接模擬關鍵詞結果URL,無意發(fā)現(xiàn)可以更改搜索框的下拉聯(lián)想——然后就沒有然后了,僅是知道這么個事而已。
后來在與客戶閑聊的過程中得知,他們一直在付費尋找這種操作方式,通過改變下拉聯(lián)想來增大品牌曝光(變相廣告)或者減小品牌曝光(危機處理)。
從這個例子來看,技術的高深與價值的大小不是正比關系,需求是技術轉變?yōu)閮r值的催化劑。
試想下如果沒有聽到這個需求,這個信息可能就駐留在我的腦海,直至遺忘。
當然,在技術人眼里,這件事確實沒啥可傲嬌的技術難度。作為一名程序員,為了所謂的性能、封裝、代碼潔癖,在技術海洋里深鉆,或許可以成為 一代大牛,同時也會被大公司綁架——畢竟不是所有IT公司都有大流量并發(fā)的。這種帶有上吊性色彩的自我感動,使得碼農(nóng)一邊在拼命各種學習,然后一邊在吶喊“難道我的未來就是coding么?不,我不要這樣!”
二、不懂包裝,數(shù)據(jù)就僅僅只是數(shù)據(jù)
在A公司主要負責輿情數(shù)據(jù)的采集工作,通過關鍵詞的定制匯集各大網(wǎng)站的信息進行匯總、統(tǒng)計,進而提供給分析師撰寫報告。說的直白點,通過網(wǎng)絡上的公開信息,進行搜集、整理、二次包裝出新的內(nèi)容閱讀物并進行售賣,一套商業(yè)流程結束。
也就是說:在輿情產(chǎn)品的生產(chǎn)體系里,原材料是免費的,產(chǎn)品是付費的,如何提高籌碼就是中間的搜集、整理環(huán)節(jié)。
于是便學會了商業(yè)包裝、學會了產(chǎn)品設計、知道了方法論。
- 商業(yè)包裝:從源數(shù)據(jù)到售賣產(chǎn)品,中間還有很多步驟;如何讓報告更充實,顯得對得起它的標價,商務流程、外觀美化、話語話術起碼得專業(yè);
- 產(chǎn)品設計:數(shù)據(jù)是公開的,用戶是感性的。不同的用戶群有不同的認知與使用習慣,得像市場小販一樣,看人給菜,原料就那么點數(shù),需要變出不同的組合維度,以供饗享;
- 方法論:不是隨隨便便在搜索引擎上搜到幾篇企業(yè)的負面信息就得提醒企業(yè)去做危機預警的,預警的多了就不叫預警,一定得有方法、有科學依據(jù),同時還得給出具體的危機公關建議;
就這樣,按照碼農(nóng)的自我畫像:一天不coding,蛋蛋碎到疼,時間長了,就有些不安。
同時自認為對輿情的商業(yè)了解比較深刻:
- 輿情監(jiān)測只能告訴你有病,無法做到我有藥
- 如果體檢能掙1份錢,治療能掙6份錢,國人更喜歡有病求醫(yī),常態(tài)體檢是達官貴人(上市公司)的寵物,體檢與治療不能一起抓,否則公正性受質(zhì)疑
- 輿情監(jiān)測不是技術派的玩物,商業(yè)環(huán)節(jié)是主要瓶頸。隨后去了一家第三方互聯(lián)網(wǎng)數(shù)據(jù)服務公司B,負責網(wǎng)站分析產(chǎn)品的開發(fā)和設計。
三、不懂執(zhí)行,策略就僅僅只是策略
網(wǎng)站數(shù)據(jù)不同于輿情數(shù)據(jù),在原材料獲取上有一定的競爭優(yōu)勢:
通過在各大媒體網(wǎng)站上的JS布碼,收集到用戶的網(wǎng)站瀏覽數(shù)據(jù),從而進行網(wǎng)站分析產(chǎn)品、營銷策略、流量認證、網(wǎng)站優(yōu)化、廣告效果等業(yè)務產(chǎn)品輸出。
在這里,編碼能力得到進一步提高——以前是用PHP進行web開發(fā),這里是用PHP+shell+AWK 進行日志文件的統(tǒng)計計算;數(shù)據(jù)更大了,對性能要求也更高了。
更重要的是:我的知識體系里又多了一個分支——網(wǎng)站數(shù)據(jù)。
由于性格上的某些緣故,同時還被安排了產(chǎn)品經(jīng)理和售前的工作任務,直接對接客戶了解需求、設計指標、規(guī)劃產(chǎn)品。
其中,個人最有成就感的是負責某網(wǎng)站的音視頻評估項目。
指標不多:
- 有效播放次數(shù)(播放時間超過3分鐘的為一次有效播放)
- 播放時長
- 獨立IP數(shù)
- 獨立用戶數(shù)和來源
- 時間維度分為刻、時、日、周、月
考核對象為節(jié)目、欄目和分發(fā)渠道。
網(wǎng)站下分多個欄目,每個欄目有自制內(nèi)容節(jié)目,這些內(nèi)容節(jié)目在網(wǎng)站上有直播、點播和視頻播放三種分發(fā)渠道,在手機APP上也有分發(fā)渠道,該項目就是通過收集這些節(jié)目在分發(fā)渠道上的用戶行為反饋數(shù)據(jù),來給網(wǎng)站考核欄目組、各欄目組考核節(jié)目組使用。
這里有幾個難點:
- 播放時間超過3分鐘的為一次有效播放,因此需要改寫收碼JS,在播放狀態(tài)時每一分鐘回傳一次心跳數(shù)據(jù),用來判斷播放時間是否超過3分鐘;
- 數(shù)據(jù)可以累加,大范圍=小范圍之和,某欄目的某月有效播放次數(shù)等于該月該欄目下的所有節(jié)目在各分發(fā)渠道的有效播放次數(shù)之和;
- 臨界值處理,如果某個有效播放跨時間臨界值了,9:58-10:02,播放時長4分鐘,算做一次有效播放,但在時報里,9點時段的播放時長為兩分鐘,10點時段的播放時長也為兩分鐘,各自都不計為有效播放次數(shù);
- 移動終端的回傳碼定制;
畢竟考核涉及到利益,因此在指標計算以及數(shù)據(jù)的公平性上要求更加嚴格;數(shù)據(jù)上的多1少1,影響的是客戶對數(shù)據(jù)公正上的存疑,容不得半點馬虎,每月最頭疼的事就是檢查各種維度的交叉對比,看看是否一致。
這個項目教會了我對數(shù)據(jù)的敬畏。
類似的項目做多了,困擾也來了。
按理說數(shù)據(jù)產(chǎn)品是要跟客戶做價值交換的,客戶購買炒股軟件是想要掙錢的、購買網(wǎng)站分析產(chǎn)品是想提高(購買)轉化的,但是邏輯不通,如果真能達到目的那數(shù)據(jù)公司還賣產(chǎn)品做什么?直接做電商就是嘍。
包括最近一些線下交流,不少同行也同樣為此困惑:自己辛勤付出的分析報告到底能為公司/客戶帶來多少的價值收益?內(nèi)心自我認可,可現(xiàn)實無法評估,只能繼續(xù)重復。
我的感受:數(shù)據(jù)分析是指將隱沒在數(shù)據(jù)中的信息,進行集中、清洗、提煉并發(fā)現(xiàn)策略的過程,產(chǎn)出是策略,策略是否有效,需要檢驗,在給出策略的同時給出執(zhí)行建議過程,并協(xié)商好按照這樣的執(zhí)行過程最后達到什么狀態(tài)則意為策略有效。有了這樣的生產(chǎn)和檢驗流程,數(shù)據(jù)究竟是不是馬后炮也就顯而易見了。
不懂執(zhí)行,策略就僅僅只是策略。
也許有人會問:如果分析人員比執(zhí)行人員更懂執(zhí)行,還需要分析人員干嘛?
我這里有個比較掃興的看法:數(shù)據(jù)分析本非難事,實質(zhì)是思維邏輯方法,理想的情況下是應當被融入到產(chǎn)品、運營、開發(fā)、財務、老總等一系列職業(yè)角色之內(nèi),只是因為數(shù)據(jù)收集、整理比較費時費力,那就招一個人負責數(shù)據(jù)收集和整理吧,邊緣與博弈,于是就發(fā)展到現(xiàn)在這樣一個尷尬的局面。
四、不懂人文,機器就僅僅只是機器
現(xiàn)在,我在一家微博數(shù)據(jù)創(chuàng)業(yè)公司,拿網(wǎng)站數(shù)據(jù)、輿情數(shù)據(jù)和微博數(shù)據(jù)做下對比,如果說輿情數(shù)據(jù)側重信息,網(wǎng)站數(shù)據(jù)側重用戶(行為),微博數(shù)據(jù)則是信息與用戶的統(tǒng)一體。
更重要的是:這里的分析維度偏重社科人文。
舉個例子:
網(wǎng)站數(shù)據(jù)是以用戶的瀏覽行為來定義cookie的興趣;微博數(shù)據(jù)則是以用戶的關注對象、微博內(nèi)容、互動行為來定義興趣。微博用戶關注了什么人,看到了什么內(nèi)容,因此發(fā)了一條怎樣的感慨,被他的小伙伴們進行互動影響又變成了怎樣的認識,他關注的人為何發(fā)布這樣的信息?是否也經(jīng)歷了這樣的影響過程?
這,絕不是簡單的線性思考方式,更多了一些復雜人性的味道。
不懂人文,機器就僅僅只是機器。
社交網(wǎng)絡還有很多答案沒有解決,包括分析維度和產(chǎn)品模式,也這是因為此,憑添了許多探索與樂趣。
五、總結
回顧一下:
我的數(shù)據(jù)從業(yè)歷程是從輿情咨詢公司切入,那里有稍微學術點的指標體系和方法論;然后在數(shù)據(jù)服務公司提升,那里有落地的技術實現(xiàn)方法;最后在微博數(shù)據(jù)創(chuàng)業(yè)公司回爐,將之前的知識體系進行應用和整合;一直靠近商業(yè)交易環(huán)節(jié),所以更能深刻體會業(yè)務和產(chǎn)品對于數(shù)據(jù)變現(xiàn)的重要性。
大數(shù)據(jù)變化的只是數(shù)據(jù)的存儲和技術處理環(huán)節(jié),對于商業(yè),最終比拼的還是產(chǎn)品創(chuàng)新和商務運營能力,如何讓數(shù)據(jù)實打實的產(chǎn)生價值,簡單粗暴回饋商業(yè),愿與各位一同探索,迎接數(shù)據(jù)行業(yè)真正的春天。
就在快收尾的時候,看到Q群有人分享了這樣 一句話:
“人生是一場艱難的考試,很多人沒考好是因為他們一直在抄別人的答案,卻沒注意到每個人的卷子都不一樣…
本文的目的就是展開我的考卷,也期待您的考卷!
相關閱讀
本文由 @老七 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載
題圖來自 Unsplash ,基于 CC0 協(xié)議
不懂是我比較困,還是什么,沒看懂 ??