不懂數理和編程,如何運用免費的大數據工具獲得行業洞察?

8 評論 34905 瀏覽 254 收藏 26 分鐘

當我們想要創業卻對市場行情不甚了解,該如何迅速了解市場行情,以便我們能更好的切入市場?本文作者介紹了一種零成本用大數據獲悉市場行情的方法,對你想要了解市場行情非常有幫助。

最近一個朋友想創業,做母嬰方面的項目,之前沒做過該類項目,有了幾個備選項目,分別是產后恢復、嬰兒游泳、月子餐和月子會所,這些他都覺得不錯,所以就有點選擇恐懼癥,想知道做哪個case有搞頭。因此,讓我幫忙分析分析一下哪個方向比較好。

其實,仔細分析朋友提出的這個問題,我瞬間聯想到許多:

  1. 哪個方向的發展趨勢/市場前景良好?
  2. 這個方向有哪些規律性的東西值得注意?
  3. 這個市場的目標用戶的特征、屬性怎樣?
  4. 與相關方向的關聯性怎樣?(同屬母嬰行業,相關性強的話可以進行資源整合和置換)
  5. 這個方向的目標用戶關注什么?

這幾個問題,歸結到2點,就是市場行情和用戶畫像。如今是互聯網時代,凡事都講求“大數據”,強調“用數據說話“,觀察相關數據的變化情況并進行分析和邏輯推理,能大體判斷出創業的趨勢是否已經到來,或者創業時機是否已過去。

說到這里,其實可以用到一個工具—某度旗下的某度指數(最近它太坑了,引起了公憤,不想給它做免費廣告,但又要用它,請諒解我這種矛盾的心情。。。)

言歸正傳,接下來,我會用朋友提到的四個關鍵詞作為case,對百度指數這個大數據工具的應用進行一個較為詳細的講解。首先,先稍微科普下百度指數方面的相關知識:

一、關于百度指數的基本知識

(一)什么是百度指數?

為什么是百度指數,而不是搜狗指數、360指數或谷歌指數呢?原因在于,前兩者的搜索引擎使用的人太少了,谷歌指數,更確切是說是谷歌趨勢,由于眾所周知的原因用不了,而且翻墻后還是英文。。。百度作為國人使用頻率最高的搜索引擎,它的指數還是能很大程度上反映網名的搜索情況和需求。

從百度指數中,我們可以了解到:

  • 某個關鍵詞在百度的搜索規模有多大;
  • 一段時間內的漲跌態勢以及相關的新聞輿論變化;
  • 關注這些詞的網民是什么樣的,分布在哪里,同時還搜了哪些相關的詞。

(二)包含哪些部分?

百度指數的主要功能模塊有:

  • 基于單個詞的趨勢研究(包含整體趨勢、PC趨勢還有移動趨勢),間接反映關鍵詞對應細分市場的整體趨勢
  • 需求圖譜、輿情管家、搜索相關詞
  • 人群畫像(地域分布、人群屬性、性別屬性)

(三)能干啥?

概括來講,百度指數能解決如下3個問題:

  • 問題1:相關關鍵詞搜索在百度搜索中的比例大約是多少,發展趨勢是如何的?
  • 問題2:目標人群搜索興趣分布是怎樣的
  • 問題3:一個熱門領域的興起及發展速度,比如跨境電商行業

具體來講,百度指數在如下方面可以對個人和企業的決策起到一定的幫助。

1、對于個人:

  • 置業時機
  • 報考學校
  • 入職企業的發展趨勢
  • 約會

2、對于企業

  • 競品追蹤
  • 受眾分析
  • 傳播效果

需要聲明的一點是,百度指數是相對靠譜的,基于以下原因:

  1. 百度指數基本反映了關鍵詞被搜索的頻繁度,但應該是經過加權過濾算法處理的,所以不是直接的搜索次數;
  2. 兩個百度指數之間是可以對比的,也就是相對差別是可信的;
  3. 百度指數可以作假,不止一次出現過刷百度指數的情況,如果有這方面的懷疑,可以結合其他數據驗證;
  4. 人群屬性的分布誤差更大,比如家長和小孩共用一臺電腦的情況,但仍然是那句話:相對值是可信的。

好了,馬上上干貨,滿滿的干貨:

二、哪個方向的發展趨勢/市場前景良好?

學會用 “數據”、特別是 “數據變化率” 來判斷行業/細分市場趨勢的創業者,而不是憑借感覺,或人云亦云者,比那些不懂得用數據及數據的變化率提前解碼 “趨勢” 的競爭者要高出幾十倍的創業成功概率!

打開百度指數頁面,分別輸入“產后恢復”、“嬰兒游泳”、“月子餐”、“月子會所”,這幾個關鍵詞,并用逗號隔開,鍵入之后的結果如圖1、圖2所示。

圖片1

圖1? 幾個搜索關鍵詞的百度搜索指數概況

圖片2

圖2??幾個搜索關鍵詞的百度搜索指數趨勢

從圖1可以了解到幾個重要的指標,這些關鍵詞在近7天和近30天的搜索指數概況(整體搜索指數和移動搜索指數),整體的環比情況(是本期統計數據與上期比較,例如2014年7月份與2014年6月份相比較)和同比情況(與歷史同時期比較,例如2014年7月份與2013年7月份相比),以及移動搜索方面的環比和同比,后者對于移動互聯網時代來說,具有很強的參考性。

圖2中反映了近五年(2011~至今)的各個關鍵詞的搜索指數的歷史變化情況,以曲線的形式呈現,間接反映了這幾個關鍵詞所代表的細分領域近5年大體上的市場需求及熱度變化趨勢。在VUCA時代(寶潔公司首席運營官Robert McDonald借用一個軍事術語來描述這一新的商業世界格局,即volatility,易變性;uncertainty,不確定性;complexity,復雜性;ambiguity,模糊性),五年的時間足以在宏觀上反映一個行業或細分市場的生命周期。其中,呈現的曲線需要從2個方面進行分析,即整體趨勢和局部的波動,整體趨勢反映了關鍵詞所代表的細分領域的行業發展趨勢,而波動就比較復雜了,既有突發的,也有規律性的因素存在,這個緊接著我會講到。

結合圖1和圖2來看,這幾個關鍵詞所代表的母嬰行業細分領域都呈現上升的勢頭,表明它們所從屬的整個母嬰市場的前景良好,寶爸寶媽們對于哺育嬰童,調理身心方面的市場需求一直存在且不斷擴大?!霸伦硬汀睙o疑是這幾個關鍵詞中整體和移動搜索指數最高的一個,這間接反映出“月子餐”這個母嬰細分市場的目標人群搜索次數較多,間接反映出這個方向的市場需求較旺盛,而且它的整體同比上升97%,也就是時隔一年,市場需求增長了近一倍!而且它的移動搜索指數較去年同期增長近一倍,表明它的移動互聯網屬性較強(在了解或尋找該類產品時,用戶更傾向于移動端)。

三、這個方向有哪些規律性的東西值得注意?

分析了這四個關鍵詞所代表細分市場在“年”這個跨度上所反映的整體趨勢, 這是宏觀上的分析。然而,在移動互聯網時代的創業,是基于數據變化研究的知識技術密集性創業,需要我們進行更細致、更微觀一些的分析,不僅要從以 “月”、以 “季度” 為單位觀察數據變化,更要學會以 “周” 為時段單位觀察數據變化并積極探究其中的規律或問題,為創業行動前積累大量精確有益的知識。

導出2011/1/1至2016/6/16期間的百度指數源數據,見圖3的原始數據。將該原始數據處理下,在“日期”和指數之間再添加一列,輸入函數“=WEEKNUM(A2,1)”( 括弧里第二個數字1,說明一周開始于星期日,如果數字為2,則說明一周開始于星期一),形成“周數”這一列,且將“日期”一列的格式改成只顯示“年”,如圖4所示:

圖片3

圖3 百度指數導出的搜索指數的原始數據

圖片4

圖4 經加工后的搜索指數數據

因數據量太大,僅以“嬰兒游泳”這個關鍵詞舉例,再對上表數據進行整理,得到如圖5所示的周搜索指數的熱力圖表格,其中每周的周搜索指數是當周7天搜索指數的算術平均值,表格根據數值的從大到小的變化,對應的顏色也由暖色到冷色,可以很直觀的從縱向(每年的周搜索指數變化情況)和橫向分析(不同年份各周的同比搜索指數變化情況)近5年周搜索指數的情況。

圖片5

圖5 “嬰兒游泳”近5年周情況搜索指數熱力圖

如果該圖仍不明顯,可以將每一年的數據做成曲線(見圖6),可以看出大概的周期性趨勢:

圖片6

圖6 “嬰兒游泳”近5年周情況搜索指數折線圖

從上圖明顯可以看出,每年的第18周到第40周,即4月末到10月初,下半年,是嬰兒游泳的旺季,這時候寶爸寶媽想讓孩子體驗游泳的意愿更強烈(雖然科學上講,夏季游泳對于寶寶的抵抗力提高不了多少,并不是最適宜的季節,氣溫溫差變化大,在此時多游泳能鍛煉寶寶對溫度的適應力,從而增加抵抗力,是最優的選擇,但是顧客是上帝,他們要來我們只得奉陪到底咯),商家可以在臨近這個時期前做好承載的準備。在此之前和在此之后則是淡季,生意會相對冷清一些。

總結并補充一下,造成搜索指數波動的原因可以分為以下幾種原因:

1、時間方面的因素

包括季節,周末及節假日。比如百度指數搜索“4399”,就呈明顯的按星期的周期波動(周末及節假日高,工作日低),這是用戶分布和使用習慣的體現;再舉受個季節性因素影響的例子(見圖7),“羽絨服”在百度指數上的變化情況,很明顯是秋冬季處于上揚態勢,夏季處于低谷狀態。

圖片7

圖7? “羽絨服”2011~2016(6月份)的百度指數變化趨勢

此外,還有優酷的例子,優酷的百度指數,基本是每周六拉出一個高峰,因為周六是互聯網人群看視頻的聚集時間,但是這個規律在春節期間被徹底打破。

2、品宣和廣告

地鐵/公交廣告、戶外廣告以及流媒體上的廣告,對于百度指數的影響非常大,能夠在短時間內迅速帶動其關注度的大幅提升。 比如,《太極俠》這部電影,雖然是基努.里維斯主演的,號稱具有濃厚中國風的“大片”,靠廣告效應吸引了公眾的大量關注,搜索指數上映前一段時間猛漲,但根據后續的觀影反應,以及百度指數的“華山式”驟降,它毫無疑問是一部爛片。.

3、現象級事件

網絡時代,爆紅的現象越來越頻繁,每年至少有個幾遭:有鳳姐、葉良辰這樣的草根英雄,也有各種正規軍的IP內容,如瑯琊榜、歡樂頌,友誼的小船說翻就翻等。

4、舞弊

創業公司也知道投資人越來越依賴于百度指數來做投資決策,于是有人就開始刷百度指數。

四、這個市場的目標用戶的特征、屬性怎樣?

在百度指數人群畫像里,可以看到3個描述目標用戶人口統計學特征的指標,地域分布、年齡分布和性別分布。

(一)地域分布

百度指數的地域分布由大到小分為3個層級,即區域、省份和城市,圖8是“產后恢復”所反映細分領域的目標用戶地域分布情況,由此可以看出,華東總體的搜索該關鍵詞的人數較多,間接反映該區域的用戶對“產后恢復”這方面的需求較旺盛,但從省份來看,廣東在這方面的需求量最大,其次是江蘇和浙江;從城市層面來講,北京又居于首位,廣、滬居次席。

圖片8

圖8 “產后修復”目標用戶分布(按區域、省份和城市)

圖9反映出目標用戶的年齡主要集中在20~39歲這個區間,對應的是青年和中年女性群體,且以30-39歲的大齡人群居多,結合上圖目標人群的分布情況(主要分布于一線沿海城市),再聯想到晚婚晚育人群多出現在高學歷高收入的白領精英階層。但性別分布不太符合常理,絕大部分是男性群體。不過,我們可以這樣理解,存在寶爸和寶媽共用一臺電腦的情況,或產后階段寶媽接觸電子設備的時間不多,寶爸會按寶媽的需求進行搜索,所以性別屬性的分布誤差會大一些,但這點不影響我們對目標群體的判斷。

圖片9

圖9 百度指數 “產后修復”目標用戶的年齡分布和性別分布

當然,為了保險起見,可以結合參考價值小一些的360指數作一定補充(見圖10、圖11).在360指數中,關于人群定位,也就是描述目標用戶人群生活習慣、喜好的部分,我們可以看到搜索“產后恢復”的人群里大都是喜愛看影視劇的粉絲、愛好體育健身者,以及購物達人。

圖片10

圖10 360指數“產后修復”目標用戶的年齡分布和性別分布

圖片11

圖11 360指數“產后修復”目標用戶的年齡分布和性別分布

通過上面信息間的相互補充和印證,加上我們日常的認知,可以得到目標用戶的人群畫像,見圖12,這些信息對于后期編撰營銷軟文和投放廣告渠道很有幫助。

圖片13

圖12 ?經綜合分析得出的關于產后恢復目標人群的用戶畫像

五、與相關方向的關聯性怎樣?

通過這些關鍵詞的日期&搜索指數源數據,可以分析一下它們之間的關聯度,看其中某個業務是否可以在后期進行延伸,或是和其他商家進行資源整合/置換。在excel中,運用CORREL函數求出這四個關鍵詞的相關系數,可以得出它們兩兩之間的相關密切程度,進行相關性分析(見圖13)??梢钥闯?,嬰兒游泳與其他幾項的關聯性不強,產后恢復、月子餐和月子會所兩兩之間的關聯性較強,它們之間可以采取客源共享、優惠聯盟的合作方式。

圖片14

? 圖13 四個關鍵詞的相關矩陣

六、這個方向的目標用戶關注什么?

需求圖譜提供了中心詞搜索的需求分布信息,通過它可以了解到網民對信息的聚焦點和產品服務的痛點。比如“產后恢復”的熱門需求詞包括“產后同房”、“產后如何保持好身材”、“瑜伽”、“身材”、“減肥”等,這說明目標用戶在搜索“產后恢復”前后的相關關注主要體現在這些方面(見圖14)。值得注意的是,通過滑動底部的月份控件,我們可以看到不同月份關于“產后恢復”的相關詞搜索情況,這里選取的是四月份和六月份的情況。

接著我們進行橫向分析和縱向分析:橫向分析,越接近中心深藍色的“產后恢復”說明搜索詞出現的次數越多,可見目標用戶對于“產后同房”、“產后如何保持好身材”、“瑜伽”、“身材”、“減肥”這些話題很感興趣,可見搜索這些關鍵詞的人對于產后恢復方面的常識了解甚少,這是經營該方向需要注意的地方。越遠背景色越淺,說明需求者對于這些詞需求越弱;縱向分析,黃色圈全部都是近期被搜索次數逐漸增長的搜索詞,反之,綠色的詞搜索的人越來越少,圖14中的“瑜伽”在四月份搜索的人較多,但在六月搜索急劇減少;“減肥”這一關鍵詞則相反。

圖片15

?圖14 “產后修復”目標用戶的需求圖譜(4月份和6月份)

圖片16

圖15“產后修復”相關詞分類—來源檢索詞和搜索指數

圖片17

圖16“產后修復”相關詞分類—去向檢索詞和上升最快搜索指數

圖17顯示的是“產后恢復”的新聞監測部分,我們需要去偽存真,去除掉明顯跟行業無關的信息,如A(廣告)、CFGHJ(娛樂新聞),廣告、娛樂新聞和歧義信息都需要排除掉,它們對于挖掘“產后恢復”這一細分市場的需求價值不高。

圖片18

圖17“產后修復”的輿情監測和媒體報道

圖片19

圖18 百度知道上關于“產后修復”的相關問題

圖14到圖18部分需要結合起來看,相互補充和相互印證,需求圖譜中反映的與中心詞“產后恢復”有關的相關詞,我們只看這些詞還無法得到詳細、準確的信息,比如“(產后)同房”,通過百度知道的問題部分,我們了解到目標用戶想搜索的其實是“產后恢復較慢,到42天惡露才排干凈,多久可過XX生活呢?”和“妻子作了剖宮產后恢復順利的情況下多少天后可以行XX?”

綜合上述分析,搜索“產后恢復”這一關鍵詞的人群對產后身材方面的知識(如產后能否XX、如何恢復身材、產后飲食禁忌等)較匱乏,需要經營者能夠對其給予有益的指導,在產后恢復方面擁有較強的專業度。同時,這些搜索相關詞也可以作為網名優化數字營銷活動方案的風向標。

結語

定性分析有時比定量分析重要,分析數據背后的實質比分析數據要重要。

為什么要看百度指數?因為在某一特定時間內,的確能看得出來用戶對某一個關鍵詞的關注程度,來看看這個關鍵詞、產品、網站是不是有一定的(傳播)效果。

在使用百度指數的同時,也要結合其他數據分享平臺,如360指數、阿里指數、百度搜索風云榜和谷歌趨勢(Google Trends)來進行補充和印證,綜合參考,從而得到更全面、更準確的市場信息。

百度指數的用途不限于我上面講到的,它還可以用來進行兩個同行/競品的百度指數比較;(如同程和攜程),以及同一品牌在活動推廣之前和活動推廣之后的指數差異。

用好百度指數的關鍵在于能了解足夠多的關于關鍵詞的行業相關背景知識,探究數據起伏波動的原因,以及對數據足夠敏感,見微知著,一葉知秋。

#專欄作家#

蘇格蘭折耳喵,微信公眾號:運營喵是怎樣煉成的,人人都是產品經理專欄作家,數據分析愛好者,擅長數據分析和可視化表達,喜歡研究各種跟數據相關的東東。

本文由 @蘇格蘭折耳喵 原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 非常棒,工具運用和思維邏輯表述清晰明了

    來自浙江 回復
  2. 非常棒~最近接觸到百度指數,不清楚各個數據反映出什么,怎么看,今天看到這篇文章,真是醍醐灌頂,非常感謝作者

    來自廣東 回復
  3. 不錯,分析思路清晰

    來自北京 回復
  4. 很棒 !看了感覺 對 數據了解 更進一步

    來自浙江 回復
  5. 大學問`..已收藏。

    來自廣東 回復
  6. 百度指數源數據怎么導出的?求教~~

    來自北京 回復
    1. 很早之前是可以導出的,現在只能去某寶上買了。。。

      來自上海 回復
  7. ??

    來自上海 回復