在做用戶研究時,大數據+小數據=?
在大數據時代,大數據能夠描繪出所有用戶的清晰輪廓,但是小數據依然有著自己的優勢。那么,在調研時能將兩者結合起來,會產生怎樣的效果呢?
在崇尚大數據的時代,調研所代表的小數據研究似乎正被逐漸替代,曾經拿著用戶調研報告以為洞悉了一切的人們,慢慢認識到用戶所答并非所想,而少數用戶的聲音也很容易引出錯誤的方向。
幸好有了大數據,讓我們的視野更寬廣,我們構想著一切可能,希望能用大數據描繪出所有用戶的清晰輪廓,那么事實又是怎樣?傳統調研真的一無是處了么?如果能將大數據和調研結合起來,又能碰撞出怎樣的火花?
大數據真的無所不能嗎?
1.?大數據所向披靡
千人千面、個性化推薦、用戶行為偏好、用戶生命周期跟蹤、購物預測、精準廣告,暫且不提大數據在其他領域的應用,僅僅就用戶的研究而言,大數據可謂所向披靡,只要用戶在平臺上有足夠多的動作,就會產生足夠多的數據,這些數據碎片通過各種拼湊組合,就能描繪出用戶各個維度的畫像,從而能夠支持到更多的應用。
以個性化推薦為例,早期的豆瓣基于協同過濾的算法,通過用戶看過的電影數據,為其推薦相似的電影(商品協同過濾),或者基于用戶多維度特征的相似性,為其推薦相似用戶看過的其他電影(用戶協同過濾)。
隨著機器學習技術的成熟,數據處理能力的發展,推薦系統也在不斷迭代,比如像今日頭條,可以基于內容的切詞、內容標簽、圖片及視頻流編碼、用戶實時瀏覽行為等成千上萬種數據項作為特征,以龐大的用戶數據作為訓練樣本,建立超大規模的模型,從而實現更精準的推薦。
大數據的量級越來越大,似乎藏著挖不盡的寶藏,只要數據維度足夠豐富,數據處理能力夠強,機器學習的技術足夠完善,未來大數據的應用就會更加廣泛和成熟。
2.?大數據的無能為力
尤瓦爾·赫拉利在《今日簡史》中預測:2050年我們將迎來數據霸權的時代,無論是醫療領域、娛樂行業還是汽車領域,到處都是人工智能的身影,算法可以預測一切,算法可以自己迭代,算法可以替代我們進行決策。
尤瓦爾·赫拉利的預測并非沒有道理,人工智能在逐漸黑盒化,機器在自主學習,我們卻不知道它做出決策的原因,因此當機器把一個結果攤在你面前時,你是否會本能地懷疑。
于是,我們開始糾結另一個概念,叫“可解釋性”,無論是基于大數據統計,還是基于機器學習算法,我們得到的都是一個結果,就算用戶行為路徑,也只是用戶的行為結果,通過大數據似乎無法解釋用戶的心理決策過程。
大數據仿佛是一個高維度的生物,機器學習是人類嘗試運用其超能力的手段,站在大數據的視角來看,能解決你們的問題不就可以了。為什么還需要我來解釋,就算把我的能力投射到低維空間,你們也仍然無法理解,而人們內心世界,恕我無能為力,我暫時也不能理解。
大數據擅長的是理性分析,而人類的決策過程中往往摻雜著直覺與感性,所以當涉及到用戶深層的感知與動機時,大數據便顯得有些捉襟見肘。目前,大數據的應對方法是通過貼標簽將用戶進行標識,但僅有行為標簽還遠遠不夠,如何提取出感性標簽是一直困擾著大數據的難題。
用戶調研真的不靠譜嗎?
1.?調研的不靠譜事跡
說起調研失敗的案例,最有名的要數可口可樂當年的口味測試。
20世紀70年代,受百事可樂的沖擊,一直位于霸主地位的可口可樂感到了極大的威脅,于是在十多個城市展開了消費者調研,調研的目的主要是了解消費者對于口味的感知,比如“如果可口可樂口味更甜一些,你是否會喜歡”,“如果可口可樂有新口味,你是否會嘗試”等等。
調研的結果一致證明,消費者愿意嘗試更柔和,味道更甜的可口可樂,于是,決策層果斷進行了口味更改,推出了全新的可口可樂。新口味上市前,可口可樂還進行了一輪盲測,盲測結果同樣顯示,消費者更喜歡新口味的可口可樂。
這一調研結果提升了決策層的信心,新口味可口可樂全面上市,廣告鋪天蓋地而來。然而,結果卻大失所望,消費者在嘗試完新口味之后,不但沒有繼續購買,反而憤怒地向可口可樂公司寄來投訴信,聲稱“放棄原配方是放棄了美國精神”。
最后,可口可樂公司不得不再次恢復沿用了100年的傳統配方,而這一次巨大的新品投入最終換來的卻是一場烏龍。
這次調研的失敗,某種程度上也是調研自身的缺陷,那就是調研只能研究一個點,而無法看到面。可口可樂一開始就研究錯了方向,以致南轅北轍,因為可口可樂的消費者最關注的是品牌文化,而并非口味。
除了研究方向的誤導性以外,調研還有著場景的局限性,在某個場景下調研得出的結論可能較為特殊,最終會引導出錯誤的決策。
比如:在20世紀末,北華飲業就曾調研過消費者對于涼茶的接受度,最終發現,60%的中國消費者不能接受涼茶。于是乎,公司腦補出消費者不能接受涼茶的各種原因,比如:中國人可能更習慣于喝熱茶,或者是中國人不喝隔夜茶等等。
但事實是,當時調研的時間正好是冬天,消費者哈著氣走到調研的地方,用冰冷的雙手拿起涼茶一飲而盡,在這種場景下,消費者的感受自然會受到極大的影響,而這錯誤的研究結果最終也使得該公司錯過了涼茶爆發的風口。
2.?調研無法被代替
無數的公司都掉入過調研的陷阱,但不得不承認,也有很多公司通過調研挖掘出了用戶的真實需求,從而指導公司做出了正確的決策。
前面講到,大數據只能呈現出結果,而這一結果是如何產生的不得而知。調研在用戶深層特性和動機的研究上仍有著一技之長,這能很好地對大數據的結果進行補充解釋。
此外,對于新生事物而言,比如:一個新產品或是新概念,沒有任何歷史數據可追溯,大數據也只能站在相似的周邊數據上迂回前行,卻無法直擊要害,這個時候,調研就有了其用武之地。
傳統調研雖有其局限性,但調研方法本身其實沒有什么問題,最難的是如何有效地進行調研,從而繞開各種陷阱。
以下列舉了幾個常見的調研雷區,請務必避而遠之:
- 題目具有暗示性,比如“這款產品很多人都喜歡,你喜歡嗎?”
- 題目具有主觀性,比如“你為什么不關注時事政治”,對于這類問題,用戶可能不會回答真實的想法。
- 題目難以理解,超出用戶的認知,用戶可能會亂答。
- 題目太多,或是開篇的問題太難,用戶會失去耐心,除非是線下調查且獎品非常豐厚。
- 只在一個地點或一個時間點進行調研,可能會重蹈北華飲業涼茶調研的覆轍。
總而言之,不管是問卷還是深訪,調研的過程都要循序漸進,由淺入深,且盡量讓用戶回憶真實的場景,描述當時的感受,而不是直接問他。
三、大數據+小數據=?
不難發現,大數據和小數據各有所長,而且他們剛好能形成能力上的互補,如果他們合力而為,是否會像賽亞人合體一樣,戰斗力報表?
1.?大數據讓小數據變大
大數據的優勢在于數據量大,那么通過大數據可以提供大量的用戶樣本。不僅如此,還可以基于此次研究的目的,篩選出符合需求的用戶,實現精準的用戶定向。
有了大數據,再也不用擔心樣本量不夠,回復率太低了,而且最關鍵的是,成本可以得到有效的壓縮。
這是大數據與小數據結合的第一步,如果最終的目的是要實現大小數據協同,那么就有必要針對線上平臺的用戶進行調研,這樣才能保證用戶線上大數據和調研小數據的一致性。
2.?大數據讓小數據變小
大數據的作用不僅限于找到用戶,其作用還在于初識用戶。
傳統調研在開始之前,都會先選定調研的城市,還有調研配額,比如:男女比例、用戶年齡比例等等,以保證研究的結果具有普適性,避免調研結果出現偏差。
不過不管是城市還是配額,一般都是研究人員拍腦袋定的,比如男女各半,一線二線各5個城市。而了解用戶的分布對大數據而言不是輕而易舉么?
因此我們可以先通過大數據了解一下平臺用戶的地域及年齡分布,然后再分層抽樣進行調研。
除此以外,從前面可口可樂的教訓中,我們知道了調研在方向上可能存在的誤導性。那么,大數據正好也能彌補這一點,在調研之前,可以先通過大數據對用戶進行初步的分析,了解用戶的行為偏好。
比如:可以通過用戶決策樹了解用戶在瀏覽或購買時最關注的產品屬性排序,如果用戶最關注可樂口味的話,我們再針對口味進行調研。
所以,除了能讓小數據量級變大以外,大數據還可以讓小數據的研究范圍變小,瞄準正確的方向,聚焦于探尋大數據結果出現的原因。
3.?小數據讓大數據變小
調研的優勢在于更深入、更細致,因此調研小數據可以讓大數據的研究顆粒度變得更小。
大數據對于用戶的研究可能僅限于部分數據維度,而且這些數據維度一般比較粗,譬如:用戶的性別、年齡、可能從事的職業、購買力、內容偏好等等,而調研所研究的范圍可以更小更細,更深入地輔助大數據了解用戶。
而且,小數據聚焦于用戶個體,我們可以通過深訪了解用戶的生活場景、特征偏好,這有利于我們直觀地描繪出這個人的形象。
下次演示報告時,我們可以說:“產品經理小王一天的生活是,早上10點來到公司,先沖泡一杯咖啡,然后元氣滿滿地投入一天的工作…”而不僅僅是,“有30%的用戶會在早上上班的時候喝咖啡”。
對于聽眾而言,加上用戶自身的描述能更加清晰直觀,且比數字更富有感染力,這也算是利用“可得性偏見”的一種報告演示技巧。
此外,大數據中的用戶標簽多是通過算法模型判斷得出的,不能保證100%的準確性,而調研所獲取的小數據基本都是真實的。因此,小數據還能對大數據的標簽進行反向驗證,使得標簽的誤差變得更小。
4.?小數據讓大數據變大
在上述三種情況下,大小數據都是各司其職,分步協作,先由大數據進行初步分析,再由小數據負責補充研究,似乎都沒有實現真正的“合體”。
那么如何才能由小數據最終落回到大數據,形成閉環,實現真正的“合體”呢?
下面為大家提供一個思考方向,目前通過爬蟲很難抓取到關于對品牌形象描述的詞,而市面上有很多負責品牌調研的公司,他們主要的工作就是研究品牌的價值、品牌形象和品牌健康度等等。那么,通過調研獲取的用戶對于品牌形象的認知,是否可以應用到大數據中呢?
例如:針對服飾而言,我們可以收集各個品牌的品牌形象詞,于是我們可以建立起一套品牌形象詞詞庫,之后我們對詞進行歸類編碼或是通過因子分析進行降維處理,從而得到了n個詞,比如:小資情調、成熟穩重、青春活力等等。
接著,我們再把這n個詞作為標簽打到各個品牌上,比如A品牌的標簽有四個,分別是:小資情調、成熟穩重、青春活力、簡約有設計感;B品牌可能有三個標簽,分別是青春活力、酷炫有型、色彩繽紛,各個品牌標簽都是并列關系,不分先后。
以此方法,每個品牌都有了自己的標簽,那么通過用戶與各個品牌的交互行為(瀏覽、關注、購買等),我們可以建立一套算法將品牌標簽打到用戶身上。這樣,我們便可以知道用戶對于服飾的品牌風格偏好。
當用戶有了標簽之后,我們可以反過來再把用戶的標簽打到品牌身上,這樣一來,我們可以識別出各個品牌下,不同形象詞標簽的重要性,同時還可能會有新的形象詞標簽被打到品牌上。
此外,我們還可以通過對某個產品的用戶標簽進行計算,從而將用戶的標簽打到每一個產品上,實現標簽的細化。
由于涉及部分機密,在此不做詳述??傊ㄟ^類似的方法,小數據的結果也可以被應用到大數據中,將大數據的標簽庫擴大,實現標簽的拓展。
四、結語
大數據時代的到來,并不意味著小數據時代的結束,大數據與小數據是對立的,但終將也是統一的。
- 對于小數據而言,大數據帶來的是一場革命,是一次否定之否定的曲折式上升機會,唯有借其真氣,才能沖開任督。
- 對于大數據而言,小數據提供的是內力的積淀,吸其精華,方能九天攬月。
作者:Mr.墨嘰,公眾號:墨嘰說數據產品
本文由 @Mr.墨嘰? 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
有啟發
謝謝??,一起交流學習~