互聯(lián)網(wǎng)人群畫像和你所不知道的真相(二)
如何準(zhǔn)確把握用戶行為,制定精準(zhǔn)的用戶畫像,關(guān)鍵在于獲取用戶行為的相關(guān)數(shù)據(jù),其中的獲取方式移動端與Web端方法不一。
前一回(前一回內(nèi)容請見這里:互聯(lián)網(wǎng)人群畫像和你所不知道的真相(一))我們講了互聯(lián)網(wǎng)人群畫像的構(gòu)成要素的結(jié)構(gòu)、PC端用戶唯一身份識別的理想狀況和真正的現(xiàn)實,在這一回中,我們開始講Mobile端用戶和跨終端(跨屏)的唯一身份識別問題,同樣是理想和現(xiàn)實并存的故事.
Mobile端的唯一身份標(biāo)識
Mobile上的唯一身份標(biāo)識看起來比PC上要好,因為誰也不能輕易干掉自己手機的IMEI號碼,也沒有幾個人知道怎么樣在蘋果手機中清除IDFA。所以在mobile端的唯一身份標(biāo)識應(yīng)該既簡單又美好。
但其實不然。
Mobile環(huán)境的復(fù)雜度比PC有過之而無不及。首先,mobile上用戶對網(wǎng)站和APP的使用大約各站半壁江山。光這一點就比PC痛苦萬分了。但是,為了讓你更能夠了解mobile上到底發(fā)生了什么,我們先假設(shè)兩種最簡單的情況:mobile上只有網(wǎng)站的情況和mobile上支持APP的情況。
假如這個世界上所有的mobile都只支持網(wǎng)站,而不支持APP,那么我們可以基本上把mobile當(dāng)做PC,用cookie來解決這個問題。不過,就算到了mobile上,cookie本身的短板還是一切照舊。不過,你會說,mobile上不是有IMEI或IDFA號碼嗎?難道不能彌補cookie的短板嗎?可惜的是,mobile上的網(wǎng)站對人的唯一身份標(biāo)識不能用這些跟手機捆綁的識別號碼——無論對網(wǎng)站做何種技術(shù)改造,都不能讓網(wǎng)站獲得這些ID。所以,如果mobile只支持網(wǎng)站,那么你可以認(rèn)為它就跟前面講的PC的情況沒太多差別。
假設(shè)這個世界上所有的mobile都支持APP呢?那會是另外一種景象。前面講過,APP不能用cookie,但APP的追蹤卻可以用IMEI或者IDFA等。不過,它們會好用嗎?
先看IMEI,IMEI一定準(zhǔn)確嗎?如果這個世界上不存在水貨機、翻新機,而全部是經(jīng)過工信部認(rèn)證批準(zhǔn)的通信設(shè)備的話,那么IMEI是最靠譜的。但我們在中國,水貨泛濫,翻新機也很多,這些來路不明的手機的IMEI就有可能是人為修改的。所以很多手機共用一個IMEI號碼,或IMEI號碼都是0的情況就很多了。這種情況造成IMEI的唯一身份的識別率未必高于cookie。另外,IMEI是機器硬件的編碼,這些硬件編碼都涉及到硬件安全性和隱私問題,因此使用它們不能明目張膽。
替代IMEI的方案是一個被稱為OpenUDID,這是被各廣告平臺廣泛使用的開源方案,但隨著AppStore開始拒絕接受使用UDID的應(yīng)用,導(dǎo)致OpenUDID無法被不同應(yīng)用共享相同的值,注定了上面提到的這些ID們不得不退出歷史的舞臺。
需要提醒的一點是,IMEI這種跟手機硬件綁定的識別符,只能在安卓手機上起效,蘋果手機iOS系統(tǒng)通通把它們封鎖了,作為唯一身份標(biāo)識是沒指望了,除非是越獄后的iPhone。
不過蘋果沒有把所有的路都堵絕,它關(guān)閉了所有的門,但是“良心發(fā)現(xiàn)”(事實上是不得已而為之)開了一個小窗,這個小窗就是IDFA。IDFA是蘋果手機獨有的用戶唯一身份標(biāo)識ID。這個東西能夠?qū)崿F(xiàn)對APP上用戶的唯一標(biāo)識。我們有救了嗎?
好一點,但是只能用于識別自己開發(fā)的APP的唯一用戶,別人開發(fā)的APP用戶的IDFA,你就完全沒法知道了。因為IDFA不像前面講的第三方cookie,可以由一個廣告公司所掌握,而IDFA是完全被蘋果公司掌握的。進(jìn)行人群畫像的時候,對于用戶唯一身份標(biāo)識的服務(wù)商幾乎都不是APP開發(fā)商,而幾乎全部是第三方(廣告公司或者第三方數(shù)據(jù)公司),因此只能通過跟眾多APP開發(fā)商合作才能獲得多個APP中同一個用戶的IDFA,也才能給同一個用戶進(jìn)行畫像。這基本上不是技術(shù)問題,而是純商業(yè)問題了。商業(yè)問題的難度在于,跟一家兩家合作容易,但是跟一百家兩百家合作,而且還是“與虎謀皮”(拿別人這么機密的數(shù)據(jù)信息),難度太大了。畢竟你不是BAT這樣在市場支配地位的廠商。
所以,對用戶進(jìn)行畫像,安卓手機要好于蘋果手機,原因就在于蘋果的封閉性,第三方的生存空間很窄小。
上面這些都還不是最麻煩的問題。
工程師們告訴我,移動端最大的麻煩是終端的極端多樣性,硬件、操作系統(tǒng)、軟件等等,全部是碎片化的,而利用了各種不同的人的標(biāo)識手段,相互之間也沒法互通互聯(lián),所以,移動端的唯一身份識真的很難。
可是,這還只是在我們假設(shè)的最簡單的兩種情況下!
現(xiàn)實世界中,mobile既支持網(wǎng)站,又支持APP,同一個人基本上都既會用mobile,又會用APP,我們能夠?qū)崿F(xiàn)跨mobile和APP的唯一用戶識別,并在這個基礎(chǔ)上做人群畫像嗎?
技術(shù)方法目前沒辦法。雖然有一些變通的方法,比如設(shè)置一個APP和網(wǎng)站通用的ID系統(tǒng),或者需要同一個用戶先用APP,然后又用網(wǎng)站才能實現(xiàn)一個功能什么的,但這些變通的方法只能在很小的局部范圍內(nèi)使用,完全不是通用解決方法。這離我們需要的人群畫像的對所有網(wǎng)民的唯一身份標(biāo)識還相距甚遠(yuǎn)。
所以,移動端同樣不存在準(zhǔn)確的唯一身份標(biāo)識,這意味著我們并不擁有全局性的上帝視角,無法記錄任一用戶使用mobile上的全部網(wǎng)站和APP的相關(guān)信息,或者退一步,不說全部,想知道大部分網(wǎng)站和APP的相關(guān)信息都很難獲得。甚至,即使是僅僅想知道這些網(wǎng)站的URL和APP的名字都不那么可能。
跨設(shè)備的唯一身份識別
終于講到了跨設(shè)備的唯一身份識別,估計你已經(jīng)等不及了。這個領(lǐng)域可是曾經(jīng)被熱炒過一陣,但用在人群畫像中似乎并沒有聽聞什么案例,后來似乎有些“不了了之”。原因何在?
原來,既然在一個mobile設(shè)備內(nèi),想要實現(xiàn)一個人在同一個設(shè)備上跨APP和網(wǎng)站的識別都沒有全局性的通用解決方案,那么一個人使用多個設(shè)備就更沒有全局解決方案了。你早上用手機、中午用PC、晚上用iPad訪問互聯(lián)網(wǎng),然后讓一個廣告商(或者一個第三方服務(wù)商)知道是同一個人在使用這些設(shè)備,難,真是太難了。
部分互聯(lián)網(wǎng)服務(wù)提供商(過去它們常常是一些媒體)具有跨設(shè)備唯一身份識別能力,比如,它們擁有強賬號體系。所謂強賬號體系,是指無論你在PC上還是手機上使用它們的服務(wù)或內(nèi)容的時候,都需要登錄自己的賬號。這意味著它們“先天”就能知道你是同一個人。
另外還有一些服務(wù)商,它們可以通過判斷不同設(shè)備經(jīng)常同時出現(xiàn)在某一個IP號段的現(xiàn)象來判斷這些設(shè)備是不是屬于同一個人。這個方法很可行,因為無論是APP還是網(wǎng)站,獲取設(shè)備所處的IP的難度并不大,這樣就可以在沒有強賬號體系的情況下,判斷這些設(shè)備是否屬于同一個人了。如果算法得到,數(shù)據(jù)也充分,這種方法的識別率隨時間流逝,可以變得相當(dāng)精準(zhǔn)。當(dāng)然,我指的相當(dāng)精準(zhǔn)是能夠有超過30%的識別率,80%以上,利用這種方法基本上不太可能。
如果沒有強賬號,也沒有技術(shù)方法,那么最后一種跨設(shè)備的唯一身份識別就是通過一些營銷手段來實現(xiàn)。比如,要在手機上掃碼(比如獲得優(yōu)惠券),然后在PC上實現(xiàn)某個功能什么的(比如完成購物)。這聽起來夠折騰的,但是確實比完全沒轍強。當(dāng)然,這種跨設(shè)備的唯一身份識別的范圍那就是極小極小了,因此不具備人群畫像所需要具備的普遍性。
但問題在于,如果你希望得到某個人(或者是某群人)的畫像,你不太可能只依靠某一個互聯(lián)網(wǎng)服務(wù)提供商就能完成。因為這個人(或者這群人)的互聯(lián)網(wǎng)使用行為一定不會囿于這一個服務(wù)提供商的范圍內(nèi),而是遍際于互聯(lián)網(wǎng)的各處——他們一會兒用百度搜索點什么,一會兒用騰訊QQ聊聊天,一會兒用淘寶買點東西——沒有任何第三方可以同時獲得同一個用戶在不同設(shè)備上使用各種互聯(lián)網(wǎng)服務(wù)的數(shù)據(jù)。即使可能,難度也極端巨大。
所以,我們希望的用全網(wǎng)用戶數(shù)據(jù)來給人群畫像那根本不可能,所有的人群畫像,都只能基于局部的數(shù)據(jù)。而實現(xiàn)跨設(shè)備識別唯一身份,除了少數(shù)服務(wù)商之外,基本上都只能停留在口頭上。這跟數(shù)據(jù)處理能力,或者什么大數(shù)據(jù)毛線關(guān)系都沒有,再牛逼的數(shù)據(jù)能力也沒用,這就是現(xiàn)實世界的事實。
好了,下面我自己總結(jié)了一下PC和Mobile端各種用戶身份識別方式的優(yōu)缺點,并不定量,所以僅大家參考:
各種方式識別唯一身份的優(yōu)點:
各種方式識別唯一身份的缺點:
via:chinawebanalytics
作者:宋星
來源:http://www.36dsj.com/archives/44559
本文來源于人人都是產(chǎn)品經(jīng)理合作媒體@36大數(shù)據(jù),作者@宋星
看來大數(shù)據(jù)被很多人的鼓吹的很玄了