數據分析案例:《這!就是街舞》VS《熱血街舞團》,誰會是街舞第一網綜?
旨在打造中國街舞界的《中國有嘻哈》的兩檔網綜節目《熱血街舞團》和《這!就是街舞》已經連接熱播將近一月,引發了街舞圈內圈外許多關注,也代表著愛奇藝與優酷之間的劇烈的街舞battle劇烈。作為舞蹈熱愛者的筆者,社交圈子里關于這兩檔節目的話題一直是源源不絕,而兩檔節目誰優誰劣也是一個被一直討論的話題。所以,筆者打算采集網上的數據,來對這兩檔節目的熱度,話題性,賣點甚至口碑等各個維度來一場全方位battle。
注意:采集數據截止于2018年4月1號。
Round 1:誰更火?
上半場:平臺自身數據
如何判斷兩個節目誰更火?一般最直接的方法就是從節目的播放量來判斷。截至3月底,《熱血街舞團》播出三集,《這!就是街舞》播出6集,從兩檔節目所屬的視頻平臺上所截取播放數據來源如下圖所示:
數據對比顯示,無論是總播放數還是每集平均播放數,《熱血街舞團》都遠遠高于《這!就是街舞》。數據顯示,《熱血街舞團》顯然更為火爆。
但是,在《熱血街舞團》剛開播未多久,就曾被眼尖的網友爆出播放數據涉嫌作假。
考慮到上述原因,兼且點擊量等數據存在很大的操作空間,所以筆者對視頻平臺本身的數據不予采用。Round one上半場成績作廢,下半場繼續battle。
下半場:第三方監測數據
基于上半場中平臺自身數據不可靠,筆者決定采用第三方監測平臺的數據來判斷兩檔節目的熱度。采用數據的平臺有以下三個:百度搜索指數,微信指數,新浪微輿情。
(1)百度搜索指數
采用百度指數的數據,是基于用戶的搜索行為而作了解。在3月2日至3月31日接近一個月的時間里,百度的搜索指數顯示,對《這!就是街舞》的搜索需求一直大于《熱血街舞團》,即便在《熱血街舞團》上線后也是如此。一般而言,用戶在百度上搜索網綜節目是為了指向網綜節目的觀看地址。所以筆者猜測,在兩檔街舞節目中,用戶更傾向于觀看《這!就是街舞》。
(2)微信指數
采用微信指數的數據,是基于用戶的在社交網絡的社交話題而作了解,探尋社交網絡中兩檔節目的熱度差別。微信指數顯示,在微信社交網絡中,在3月前半,《這!就是街舞》的話題熱度明顯高于《熱血街舞團》;但是3月中旬,《熱血街舞團》上線后,話題熱度一直飄升;到了3月下旬,雖然兩檔節目的話題熱度相差不大,但是《熱血街舞團》顯然更有話題性。
(3)新浪微輿情
采用新浪微輿情的數據,是基于媒體宣傳的維度去了解。在3月份的數據中,B端平臺(如網站,論壇,媒體etc.)輸出的關于兩檔節目的信息,在各類別媒體上的宣傳數量都是大致持平的。這表明,《這!就是街舞》和《熱血街舞團》在輿論公關上的影響力是大致持平的,傳播影響力相當。
綜上所述,通過第三方監測平臺的數據,《這!就是街舞》和《熱血街舞團》兩檔在網絡上的情況可以歸納為這三點:
- 兩者傳播影響力相當;
- 用戶更傾向于觀看《這!就是街舞》;
- 《熱血街舞團》在社交網絡上更有話題性。
在Round 1 誰更火這個維度,兩檔節目實力相當,打平。
Round 2:節目評價
在Round 1中,兩檔節目在熱度上實力相當,并不能以決出誰是第一。所以筆者決定從節目下的評論下手,評論是觀眾與節目之間最直觀的聯系,能夠用來評估觀眾傾向,節目賣點,甚至節目質量。筆者采用八爪魚采集器對兩檔節目的評論進行爬蟲采集。爬蟲原始數據的截選如下圖所示:
對采集到的評論以下述幾點得思路來進行預處理:
- 處理方式為關鍵詞歸納,對評論文本中出現的人名關鍵詞進行歸納,總結影響力。
- 導師/隊長一般有多個昵稱(例:羅志祥,小豬,亞洲舞王,羅隊長),所以采用的是關鍵字多次排除篩選的方法。
- 在評論中多次出現名字的選手,會進入歸納名單。
- 愛奇藝的評論區存在投票類型的評論,投票型評論因為沒有實際留言,所以這類評論會與實際留言類分開處理,然后再統計總數。
預處理后數據如下:
《這!就是街舞》情況:
(1)?首先從圖一的第一集中,關于四位隊長的評論占比達70.63%,明顯可以判斷出《這!就是街舞》在初期的引流來源主要是隊長的個人粉絲;其中,易烊千璽占比超50%,當之無愧的超級流量小生。
對以上數據圖表化,如下:
(2)?從上兩圖可以看出,隨著集數的增長,隊長的影響力逐漸降低,而隊員的影響力開始增長;數據表明,雖然觀眾大多開始是因為明星效應吸引而來,但是后續逐漸被隊員的表現吸引,開始支持不同的隊員。
(3)?第六集的數據出現反向趨勢,筆者推測是因為收集數據時第六集才剛上線,及時觀看的群體以較為空閑的學生群體為主,該群體與明星粉絲大幅度重合,所以導致出現反向趨勢。待時間沉淀后,數據應該會重回常規曲線。
《熱血街舞團》情況:
(1)?從上圖的數據顯示,鹿晗等明星召集人在《熱血街舞團》上線之初,吸引流量的能力還是不錯;但是后續明顯開始表現疲軟。
(2)?Dancer隊員中,在《熱血街舞團》表現出眾,并在觀眾中有話題性的不多;其中肖杰在第二,第三期話題性劇增,明顯在這兩期中表現出色。
對兩檔節目的評論的大概情況總結過后,將從以下幾個維度來各自battle。
評論數
從兩檔節目的評論數來對比,截至3月份,《這!就是街舞》前6集平均每集評論約1.2w,而《熱血街舞團》前3集平均每集評論只有3K+;結合本文Round 1上半場中的《熱血街舞團》播放數遠超《這!就是街舞》,筆者認為會有以下兩個原因:
- 愛奇藝的《熱血街舞團》播放數據造假;
- 《熱血街舞團》節目質量不及《這!就是街舞》,觀眾觀看后并沒有意愿輸出評價。
節目賣點
一般而言,作為選秀類型的真人秀節目,除了自帶流量的導師/隊長們,選手們也是節目的一個重要賣點。因為具有話題性,有人氣的選手既是節目質量的表現,又能為節目持續帶來流量;像曾經的《中國有嘻哈》,就有一大票的人氣選手PGone,Gai,歐陽靖,TT,Bridge,孫八一,艾夫杰尼,jony j,小青龍…,甚至在節目后期,選手們帶來的流量要遠遠高于導師。而目前對比《這!就是街舞》和《熱血街舞團》,筆者以這兩檔節目的評論話題性作了歸納,制作了詞頻詞云圖,對比如下:
上述兩詞云圖中,《這!就是街舞》除了影響力較大的隊長們外,也包含了一大批人氣開始增長的選手;而《熱血街舞團》除了導師們外,選手中目前僅有肖杰有者較大人氣。兩相對比,從節目賣點以及選手底蘊來看,《這!就是街舞》要比《熱血街舞團》更多更豐富。
節目口碑
評價節目質量,觀眾的口碑也是很直接的一個判斷標準。為了避免各自節目的死忠粉的評價對判斷的影響,筆者采集了節目評論區對另一檔節目的評論;即《這!就是街舞》評論區中,觀眾對《熱血街舞團》的評論和《熱血街舞團》評論區中,觀眾對《這!就是街舞》的評論。
《這!就是街舞》:
《熱血街舞團》:
對比上圖節選的觀眾評價,很明顯可以看到,無論《熱血街舞團》還是《這!就是街舞》的評論區,觀眾對另一檔的評價竟然出奇的一致,都是在diss《熱血街舞團》。從觀眾評價來判斷節目質量,結果還是《這!就是街舞》更勝一籌。
綜上,在Round 2的三個維度的比較中,都是《這!就是街舞》占有優勢。Round 2勝者為《這!就是街舞》。
Round 3:豆瓣評分
除了以上筆者自身所采集的數據外,筆者還決定采用其他平臺的評分來作為佐證。豆瓣作為觀眾自發評分的平臺,數據相對可信。
目前豆瓣上的評價,《這!就是街舞》和《熱血街舞團》的評價人數相近,數據有可比性。而幾乎相似的打分人數,《熱血街舞團》卻比《這!就是街舞》低了2.2分,兩檔節目的質量差異非常明顯。
總結
以上3輪數據battle中,《這!就是街舞》兩勝一平;倘若《熱血街舞團》后續節目表現沒有大變化,筆者認為《這!就是街舞》已經可以稱得上是街舞圈第一的網絡綜藝節目。
另外,筆者也另有收獲:作數據分析時,表層的數據并不足以說明很多現象,要對數據深入挖掘,并依靠人腦作出分析,才能得到數據的深層意義。如有數據分析上的問題,還望各位讀者多多指教,給予斧正。
參考數據:
1.數據來源:愛奇藝,優酷,豆瓣,百度搜索指數,微信指數,新浪微輿情
2.工具:八爪魚采集器,EXCEL,PPT
本文由 @Vinci 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來源于網絡
起點學院專門為0基礎的0-2歲互聯網人開設了《15天入門互聯網數據分析》班級哦~課程由數據思維+真實案例+實操相結合,提升你的數據分析能力!戳此了解>>http://996.pm/YNG4e
沒有目標的分析是無效分析,第一綜藝是對誰來說,對用戶還是對廣告商還是對項目方自己,側重點都會有所不同。
為什么有人喜歡在分享或者演講的時候喜歡用一個英語單詞來描述?是因為擔心信息不夠亮眼,故意營造自我內心充實滿足感。覺得加幾個英文或其他流行語詞語充實內容本質上的空虛。
厲害厲害??!
非常好的數據分析!
我是《這就是街舞》的死忠粉,從筆者的分析里,我明白了自己為何就是喜歡《這就是街舞》比《熱血街舞團》多,筆者的分析非??煽坑羞壿嫞⑶夜P者使用的分析工具等都非常好用,是深度好文,感謝筆者,我專門登錄來告訴你,太棒了!
?? ?? 哈哈哈,謝謝