大數據時代的新玩法
【導讀】數據究竟是什么?大數據未來將走向何妨?美好的大數據理想與現實之間還有多少距離?目前實踐了些什么?遇到哪些困難?這些問題值得我們去思考。以下為阿里巴巴數據委員會聯合阿里研究院《阿里商業評論》,舉辦的一場大數據思想沙龍中,10位專家的精彩觀點精編。
我們要非常注意企業所處的狀態,包括企業狀態和數據狀態。一個企業處在不同的狀態之下,對于數據的關注點是不同的。例如,目前的阿里巴巴,業務量大,數據多而雜,所以我特別希望從數據里產生出它的價值。而對于數據比較小一點的公司,由于還沒有這么多數據,所以短期內不用擔心這個問題。
記得馬總曾說過:凡是已知某種關系,運用這個關系數據計算一個東西出來,或者找出一個規律出來,這不是大數據;凡是不知道某種關系,但是剛剛找到這種關系,并且運用這種關系能產生出額外價值的時候,這就是大數據。而如果這種大數據已經找到了,它逐漸也就不是大數據了,你要再尋找跨界的其他的數據出來。當能讓這個數據產生新的價值的時候,就又找到了大數據。
目前,很多公司的BI好像還沒到大數據的階段,而只是找到應用數據的一個方法而已。所以,當已經有海量數據,在這個海量數據中心里面尋找一些有價值的東西出來,這可能是大數據。
大數據讓問題更加簡單,也面臨考驗
過去,很多機構數據不夠廣度,所以要用很復雜的算法才能得出想要的結論。
今天,如果數據廣度足夠,很多時候就根本沒有必要復雜計算了。例如,以前有人通過復雜的達人模型算法得出某用戶是牛仔褲達人,但如果能夠拿到他的微博數據,那么其實很容易就可以得出該結論的。
所以,以前的數據挖掘跟今天的數據挖掘將有很大差別的。也就是說,當一家公司的使命是將來想做一個大數據公司的話,可能要準備一些一手數據。當然,公司的收購策略,或者數據戰略,不是一般的產品人能去影響的。但是,當數據的材料可以影響到沒有這么復雜的算法還能實現業務,你就可以這樣去做。
從“用”和“養”的觀點來講,目前很多公司已經走在“養”的路上。例如,我們說高德是一家數據公司,因為它非常注重數據的“養”。
很多公司高管會問:你拿著大數據,你能不能從數據里面進行拔高,把數據抽出來,真正找出問題?能不能從數據中直接告訴我今天到底發生了什么問題?能不能比我具有豐富經驗的小二厲害?否則,老是講數據很厲害,我感受不到。
這其實代表了業務方的期望。
其實,現階段,很多事情大數據還是做不到,在很多地方還是不能經得起考驗,所以,在很多人心目中,大數據可能還沒到那回事。我們需要正視。
轉型革新不僅是大數據,還有分析師
凡是BI人員,肯定是很精通數據業務的。所以當做數據挖掘或很多其他數據工作的時候,他肯定會比其他人做的更好。
當一個公司轉型做數據業務時,分析師是一個非常容易轉型成成功的business man的。例如,以往BI人員很怕臨時需求,但是我發現一線分析師經過了這些鍛煉,已經成為全能型人才:他能夠從底層數據提取,到中間層數據挖掘,一直到最終解決問題全部完成。目前有一些人覺得分析師是不是已經落后了?其實,分析師成為公司未來商業應用最好的補充。
現在是轉型過程一個非常重要的點,因此僅僅懂得做分析師是不夠的,我們業內最需要的是數據中間人。他要知道數據架構到底要解決什么問題。他要告訴產品經理,我們需要什么樣的自動化產品幫到我們業務方,我們需要什么樣的模型。所以,他其實是一個很高級的商業架構師,并不是一個很高級的技術架構師。
我剛進支付寶的時候,當時分析師都走光了,那個時候發現所有東西要重新開始。第一想到是“白米飯”(注:不可或缺的工作)?!鞍酌罪垺辈荒芙鉀Q,其他部門都會說你們在搞什么?所以開始從“白米飯”開始一級一級的建立自己BI。我覺得BI團隊的建立有一條時間線,我們淘寶是先“用”,從“用”再開展到“更多的用”,幾個階段的作用是很不一樣的。所以,每家公司的數據部門都要思考:什么是你的白米飯?
同時,不管哪一個數據公司,有一些是數據分析師必須要做的事。例如:BI的總監和領導人一定要在管理層一起開會??梢圆徽f話,但是一定要進去了解公司管理的理念和思路。否則這個BI部門就廢掉了,這是我自己感受最深的一點。
未來的BI部門以及數據產品原則,看阿里怎么做
前一段,我們將阿里巴巴的BI部門改名為數據技術與產品部。整個部門不叫BI部門了,但仍有一個BI二級部門存在。
未來,我想象中的BI部門可能會走向這個方向:它像一個無人看管的汽車,沒有具體的小二負責,但可以走出正確的道路。當然,這不是在所有場景都能夠實現,而是要先選擇一些好的場景來實現。在這個場景中,數據、模型能像汽車一樣自己走出來。
目前,淘寶BI數據已經嘗試走向這條路了,未來怎么樣可以做到像沒有駕駛員的汽車一樣自己找到出路,仍需要不斷實踐。
而對于做數字產品,阿里巴巴則有以下一些原則:
首先,這是一個單純的商業行為;
第二,它不影響到用戶的隱私;
第三,它不能影響到其他的用戶。(因此,如果該產品能夠幫到一家,但對另外商戶影響大了,就不能做。要保證在互惠互利的前提之下再看方案怎么樣。)
此外,還有一個要求:當數據產生交叉的時候,數據必須要放在我們這里。最近,阿里與很多創新性公司展開了合作,例如一些保險公司很快將數據放進來進行實驗。它可以先不全量放進來,而是放一些數據進來,看數據交叉之后能不能產生效果,如果效果很好,再考慮下一步。采取小步快跑的商業思路。
來源:i天下網商
- 目前還沒評論,等你發揮!