淘寶平臺(tái)廣告點(diǎn)擊數(shù)據(jù)分析報(bào)告
在廣告展示數(shù)一定的條件下,點(diǎn)擊率的高低就是決定一個(gè)廣告能否被更多人看到的因素。 文章主要分析就針對“點(diǎn)擊率”這一因素進(jìn)行分析,與大家分享。
一、分析背景及目的
數(shù)據(jù)源:Ad Display/Click Data on Taobao.com 這是一份淘寶平臺(tái)的廣告展示/點(diǎn)擊數(shù)據(jù),本次分析需要從這些數(shù)據(jù)中發(fā)現(xiàn)某些規(guī)律或者異常,進(jìn)而給運(yùn)營團(tuán)隊(duì)提出建議 評價(jià)一個(gè)廣告效果的指標(biāo)就是廣告的點(diǎn)擊人數(shù),可以反映一個(gè)廣告有多少人愿意點(diǎn)擊查看廣告的內(nèi)容,只有廣告被點(diǎn)擊,后續(xù)轉(zhuǎn)化為購買行為才會(huì)發(fā)生。
把廣告的點(diǎn)擊人數(shù)指標(biāo)拆分: 廣告點(diǎn)擊人數(shù)=廣告展示數(shù) x 點(diǎn)擊率?,而廣告展示數(shù)又由廣告商品的價(jià)格、類別影響;不同人群對不同類別商品有著不同的喜好,從而影響廣告的點(diǎn)擊率。
在廣告展示數(shù)一定的條件下,點(diǎn)擊率的高低就是決定一個(gè)廣告能否被更多人看到的因素。 因此本次分析就針對【點(diǎn)擊率】這一因素進(jìn)行分析。
二、分析思路
從“廣告”和“用戶”兩個(gè)角度進(jìn)行分析:
1. 廣告角度
- 分析不同廣告的商品價(jià)格對點(diǎn)擊率的影響
- 分析哪些類別的廣告點(diǎn)擊率更高,哪些類別的點(diǎn)擊率低
2. 用戶角度
- 分析性別和廣告點(diǎn)擊率有什么關(guān)系
- 結(jié)合聚類分析與RFM模型分析用戶群體對廣告點(diǎn)擊率有什么關(guān)系
三、分析過程
1. 數(shù)據(jù)清洗
(1)數(shù)據(jù)概覽
原始的數(shù)據(jù)集中包括三類數(shù)據(jù),具體數(shù)據(jù)對應(yīng)屬性如下:
為了方便分析,抽取其中的部分字段作為分析。 從raw_sample數(shù)據(jù)集中抽?。河脩鬒D、廣告ID、是否點(diǎn)擊 從ad_feature數(shù)據(jù)集中抽?。簭V告ID、類目ID、廣告商品價(jià)格 從user_profile數(shù)據(jù)集中抽?。河脩鬒D、年齡層、性別、購物層次
(2)數(shù)據(jù)組合
將三張數(shù)據(jù)表,組合到一張表中
a=raw_sample.merge(right=ad_feature,on='ad_id',how='left') b=a.merge(right=user_profile,on='user_id',how='left')
得到一張記錄了用戶-廣告信息表
(3)缺失值處理
1)源數(shù)據(jù)中還有許多的缺失值,將性別和年齡層字段中為空值的記錄刪去
2)查看數(shù)據(jù)中的異常值,并將異常值刪去 查看廣告商品價(jià)格字段的屬性值范圍:
發(fā)現(xiàn)最大值為100000000.0元,價(jià)格過大,屬于異常值,刪去 再次查看價(jià)格字段的屬性值范圍:
還是存在數(shù)據(jù)值過大的異常值 為了方便分析對價(jià)格字段進(jìn)行切分,選取更貼近日常生活的價(jià)格在1000元以內(nèi)的廣告記錄進(jìn)行分析 切片之后仍保留了751570條記錄
(4)數(shù)據(jù)字段整合
對于廣告商品價(jià)格字段,每個(gè)廣告的商品都有各自的價(jià)格,根據(jù)價(jià)格字段不便于進(jìn)行統(tǒng)計(jì)。新增一個(gè)字段“price_class”代表價(jià)格的區(qū)間。
(0-價(jià)格在0-100元、1-100-200元、2-200-300元…)
2. 結(jié)合圖表分析
(1)分析不同廣告商品價(jià)格對點(diǎn)擊率的影響
①將廣告商品價(jià)格分類
將廣告按價(jià)格分為100元以下、200元以下、300元以下等10類,并計(jì)算不同價(jià)格區(qū)間中廣告的點(diǎn)擊率情況。
從圖中發(fā)現(xiàn),所有價(jià)格區(qū)間商品的點(diǎn)擊率都在5%左右,其中廣告商品價(jià)格在100元以下的廣告點(diǎn)擊率最高,為5.92%; 看到價(jià)格較低的廣告商品點(diǎn)擊率更高,我們一般認(rèn)為是對價(jià)格敏感的淺層用戶(免費(fèi)用戶)在這方面的點(diǎn)擊率更高,而擁有一定消費(fèi)行為和消費(fèi)意識的中層、深層用戶(付費(fèi)用戶)則更在意購物時(shí)的體驗(yàn)以及商品的質(zhì)量。 為了驗(yàn)證以上說法,我們先假設(shè)100元以內(nèi)的廣告商品主要的點(diǎn)擊對象是淺層用戶,再通過數(shù)據(jù)驗(yàn)證。
② 分析100元以內(nèi)廣告商品點(diǎn)擊率的用戶組成
查看點(diǎn)擊了100元以內(nèi)的廣告商品的用戶的用戶組成
從用戶分布可以看出,在點(diǎn)擊了100元以內(nèi)廣告商品的用戶中,深度用戶的比例更高,占比81.6%,而淺層用戶的占比則相對少很多。這推翻了我們原來的假設(shè)。
小結(jié):
- 17年5月6日至17年5月12日這8天里的廣告點(diǎn)擊率理想,但由于缺乏去年同期、今年上月的數(shù)據(jù),不足以判斷5%左右的廣告點(diǎn)擊率是否是一個(gè)正常水平,有待更多數(shù)據(jù)驗(yàn)證。
- 低價(jià)廣告商品點(diǎn)擊率更高,且點(diǎn)擊用戶中絕大多數(shù)是深度用戶。建議:可以把這個(gè)數(shù)據(jù)反應(yīng)給廣告投放部門,在這個(gè)區(qū)域優(yōu)先投放廣告,既可以對淺層用戶進(jìn)行流量變現(xiàn)又能讓廣告讓更多具有消費(fèi)意愿的中、深層用戶看見。
(2)分析哪些類別的廣告點(diǎn)擊率更高,哪些類別的點(diǎn)擊率低
由于廣告的類別數(shù)量眾多,大部分類別的廣告只有1-2次的展示,數(shù)據(jù)樣本太小,因此選取展示數(shù)量最多的7個(gè)類別進(jìn)行分析。
① 找出展示數(shù)、點(diǎn)擊數(shù)、點(diǎn)擊率最高的廣告類別
可以看出類別6261廣告的展示數(shù)、點(diǎn)擊數(shù)、點(diǎn)擊率均為最高,而類別4385廣告的展示數(shù)雖然有10000+,但是點(diǎn)擊數(shù)、點(diǎn)擊率卻是最低的。
② 分析類別4385廣告效果最差的原因:
a.先按【廣告商品價(jià)格】來分析
計(jì)算沒有被點(diǎn)擊的類別4385廣告的商品的平均價(jià)格
而點(diǎn)擊了類別4385廣告的商品的平均價(jià)格為:
兩者平均價(jià)格都在200-300區(qū)間、差異不大。結(jié)合分析(1),價(jià)格區(qū)間在200-300的廣告商品點(diǎn)擊率平均是在5.29%,而類別4385則只有3.61%。 這說明:廣告商品價(jià)格不是影響類別4385廣告點(diǎn)擊率的因素
b.再按【性別】來分析
先來看看類別4385被哪些用戶看到了
可以看出,類別4385的廣告,主要是被推薦給了男性用戶,而男性用戶對這類商品的興趣大于女性。 并且女性對這類商品的廣告興趣不高,點(diǎn)擊率只有2.75%,是造成類別4385廣告點(diǎn)擊率低的主要原因。
c.最后按【用戶年齡】來分析
來看看不同年齡段、不同性別的用戶點(diǎn)擊率有什么差異
(年齡字段含義:0:10歲以下、1:10-20歲、2:20-30歲、3:30-40歲、4:40-50歲、5:50-60歲、6:60歲以上)
從統(tǒng)計(jì)的數(shù)據(jù)可以看出,類別4385廣告的商品主要點(diǎn)擊群體是30歲以上男性用戶,尤其是60歲以上男性興趣最高,而女性用戶對這類廣告商品興趣低。 結(jié)合a、b的分析,受30歲以上男性歡迎、價(jià)格在200-300的商品,推測是西裝、皮鞋類或者煙酒類又或者是家用電器類商品
③ 小結(jié)
- 類別6261廣告效果最好,有最高的點(diǎn)擊率、展示數(shù)和點(diǎn)擊人數(shù)。可以加大對該類別廣告的資源投入,擴(kuò)大廣告推廣效果。
- 類別4385廣告點(diǎn)擊率的原因是,這類商品對女性用戶而言興趣不大,女性用戶點(diǎn)擊率低,導(dǎo)致了整體的點(diǎn)擊率低??梢栽谠搹V告的廣告詞中加入“父親、爺爺”等宣傳詞,引導(dǎo)女性消費(fèi)者將該類別商品作為一種禮物送給男性用戶,從而提高點(diǎn)擊率
- 類別4385的主要受眾群體是30歲以上男性,為了提高點(diǎn)擊率可以重點(diǎn)推薦給30歲以上男性用戶。對于該類別廣告商品的受眾,可以適當(dāng)增加產(chǎn)品折扣、降低商品價(jià)格,吸引點(diǎn)擊廣告的用戶轉(zhuǎn)換成購買用戶
(3)分析性別和廣告點(diǎn)擊率有什么關(guān)系
① 計(jì)算男女人數(shù)比例
男女比例約為:1:1.6
② 計(jì)算男女各自的點(diǎn)擊數(shù)
男女廣告點(diǎn)擊數(shù)的比例約為:1:1.7 因此,總體上女性的點(diǎn)擊數(shù)要多于男性,但兩者的點(diǎn)擊率基本一致。
③ 比較各類別廣告點(diǎn)擊率-男女差異
可以看出,大部分類別中,女性的廣告點(diǎn)擊數(shù)都要明顯大于男性的點(diǎn)擊人數(shù)。 只有類別4385、類別4505,這兩個(gè)類別的廣告,男性的點(diǎn)擊人數(shù)要超過女性的點(diǎn)擊人數(shù)。 男女之間的主要差異是由類型6261的廣告造成的,女性的點(diǎn)擊數(shù)大約是男性的4倍。
④ 小結(jié)
- 總體上看,女性的廣告點(diǎn)擊人數(shù)明顯大于男性,但兩者的點(diǎn)擊率卻是差不多的。
- 類別4385、4505廣告,男性的點(diǎn)擊人數(shù)要多于女性。這類廣告可能是男士服飾、汽車、煙酒這類商品
(4)分析用戶群體對廣告點(diǎn)擊率有什么關(guān)系
不同的用戶群體之間用戶價(jià)值與消費(fèi)習(xí)慣具有一定的差異,對于不同用戶群體的廣告投放的策略也不同。通過分析不同用戶群體對廣告點(diǎn)擊率有什么關(guān)系,來制定不同的投放策略。
這里的分析通過K-Means算法來對用戶進(jìn)行聚類,并基于RFM模型來對用戶價(jià)值進(jìn)行劃分。
①用K-Means算法對用戶進(jìn)行聚類
這里選取用戶的購物層次、廣告點(diǎn)擊率、瀏覽廣告的商品平均價(jià)格,這3個(gè)指標(biāo)來作為判斷用戶價(jià)值的標(biāo)準(zhǔn)
- 用戶的購物層次——體現(xiàn)用戶在平臺(tái)上的持續(xù)購物深度
- 廣告點(diǎn)擊率——體現(xiàn)用戶對廣告的接受程度
- 瀏覽廣告的商品平均價(jià)格——體現(xiàn)用戶通過廣告推廣能帶來的潛在收益
對用戶進(jìn)行聚類分析:
這里將所有用戶分成5類,來代表用戶價(jià)值的高低。
注:三個(gè)特征在聚類時(shí)都進(jìn)行了特征的標(biāo)準(zhǔn)化
從不同群體的特征分布可以得出:
- 群體5在點(diǎn)擊率方面最大
- 群體2在瀏覽廣告的商品平均價(jià)格最大
- 所有群體的用戶在購物層次上基本沒有差異
因此,我們可以出:群體5對廣告的接受程度最高,非常愿意點(diǎn)擊廣告。群體2更喜好高價(jià)格的商品,對購買高價(jià)商品抱有極大興趣。
② 用RFM模型對用戶進(jìn)行劃分
根據(jù)用戶在購物深度、點(diǎn)擊率、觀看廣告商品的平均價(jià)格3個(gè)維度的表現(xiàn),將用戶劃分為5類客戶。
1)重要保持用戶
- 這類用戶有著高點(diǎn)擊率,有更大的可能將用戶的點(diǎn)擊率轉(zhuǎn)換為實(shí)際的購買行為。并且喜歡在平臺(tái)上進(jìn)行購物,是最理想的客戶。
- 應(yīng)優(yōu)先將廣告資源投放給他們身上,維持這類客戶的點(diǎn)擊率
2)重要發(fā)展用戶
- 這類用戶點(diǎn)擊率中等、也喜歡在平臺(tái)上進(jìn)行購物,并且對廣告商品的價(jià)格適中。具有很大的發(fā)展?jié)摿?/li>
- 應(yīng)加強(qiáng)與這類用戶的聯(lián)系,培養(yǎng)其點(diǎn)擊廣告的習(xí)慣,使他們成為高點(diǎn)擊率的用戶
3)重要挽留用戶
- 這類用戶點(diǎn)擊率偏低,但是其瀏覽的廣告商品的價(jià)格很高,對該類用戶進(jìn)行挽回,能提高廣告轉(zhuǎn)化為實(shí)際購買行為的價(jià)值
- 應(yīng)加強(qiáng)與這類用戶的互動(dòng),延長這類用戶的生命周期
4)一般用戶
- 這類用戶點(diǎn)擊率低,瀏覽廣告的商品價(jià)格適中。這類用戶沒有點(diǎn)擊廣告的習(xí)慣,偶爾點(diǎn)擊廣告的商品價(jià)格也不高
- 應(yīng)嘗試投放多種類型的廣告給這類用戶,觀察是否能找到用戶感興趣的廣告商品類型,進(jìn)而提高點(diǎn)擊率。
5)低價(jià)值用戶
- 這類用戶點(diǎn)擊率低,瀏覽廣告商品價(jià)格低,屬于平臺(tái)的免費(fèi)用戶,用戶價(jià)值較低
根據(jù)聚類結(jié)果,對應(yīng)上述五類客戶類型,進(jìn)行匹配,得到客戶群體的價(jià)值排名:
根據(jù)結(jié)果,我們可以發(fā)現(xiàn)5類用戶的分布如圖所示:
可以看出:最有價(jià)值的3類用戶占比約為20%。這20%的用戶必然貢獻(xiàn)了廣告點(diǎn)擊率的絕大部分,平臺(tái)如果希望廣告效果好,就需要投入資源服務(wù)好這部分用戶 一般用戶、低價(jià)值用戶仍為平臺(tái)用戶的主體,對于這類用戶需要通過運(yùn)營/營銷策略,提高他們的活躍度/點(diǎn)擊率,爭取將他們轉(zhuǎn)換成重要的用戶。
③ 小結(jié)
- 重要用戶占比20%,對于群體1、2、5里的用戶,應(yīng)針對用戶特點(diǎn),定向推送廣告,在高點(diǎn)擊率的同時(shí),爭取進(jìn)一步提高廣告的轉(zhuǎn)化率,將點(diǎn)擊落實(shí)為購買。
- 其他用戶占比80%,對于群體3、4的用戶,應(yīng)推送多種類型的廣告給這類用戶,尋找用戶對哪類廣告的商品更感興趣,并可以通過相應(yīng)促銷活動(dòng),提高其活躍度和廣告點(diǎn)擊率,爭取將這類用戶轉(zhuǎn)換為重要用戶
四、結(jié)論和建議
把上述的分析過程中的小結(jié)正例出來,得到分析結(jié)論,并綜合所有的結(jié)論提出建議:
后記
由于沒有深入接觸過廣告的業(yè)務(wù),對于數(shù)據(jù)分析的邏輯還有待完善,本次分析也只針對了點(diǎn)擊率這一個(gè)維度分析、拆分。而評價(jià)一個(gè)廣告的推廣效果的指標(biāo)是有多個(gè)維度去分析的,需要更深的業(yè)務(wù)見解才能分析好。
后續(xù)會(huì)繼續(xù)努力的,帶來更多不同業(yè)務(wù)下的數(shù)據(jù)分析思路見解。
本文由 @Rambo goal 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
您好,您做的這個(gè)數(shù)據(jù)分析用的phython做的還是其他的Hadoop或者spark呀
你好,請問代碼可以分享一下嗎?最近正在學(xué)習(xí)python數(shù)據(jù)分析這方面。謝謝。1832687462@qq.com
您好,能把您的代碼給我一份嗎,學(xué)習(xí)一下,謝謝您,891253255@qq.com
數(shù)據(jù)集鏈接:https://tianchi.aliyun.com/dataset/dataDetail?dataId=56
感謝分享~
想請教下購物深度怎么理解??