什么是TGI指數?
TGI是英文Target Group Index的縮寫,直譯為“目標群體指數”,即我們觀察的這部分群體,是否更多(或更少)分布在該維度上。本文作者對TGI指數進行了分析,一起來看一下吧。
某出行平臺曾經發布過一份數據分析報告,指出“凱迪拉克車主最愛去洗浴中心”,一時引來多方熱議。
我們今天討論的TGI概念,就與這個小故事有關。凱迪拉克車主是不是“更愛去洗浴中心”呢?這個問題,等我們了解了TGI之后再討論。
一、TGI是什么?
TGI是英文Target Group Index的縮寫,直譯為“目標群體指數”。計算方法非常簡單:
TGI = [目標群體中具有某一特征 的群體所占比例/總體中具有相同特征的群體所占比例]*100
在前司上班那會,我們在給客戶(廣告主)提供的消費者洞察分析報告中,頻繁的使用這個概念,以至于我們總監曾經專門組織過一次討論:該怎么更科學、更簡單地向客戶介紹TGI是什么,以及怎么理解它。
在向客戶解讀我的消費者報告時,我將TGI稱為目標群體的傾向性指數。即,我們觀察的這部分群體,是否更多(或更少)分布在該維度上。
舉個簡單的例子。我在讀大學時,我們專業的男女比為1:3,即女生所占比例為75%。顯然,這是一個讓其他理工科專業男生十分羨慕的男女比,因為我們同級3000多人中,女生占比約為50%。
在這種情況下,我們專業女生性別TGI = 75%/50%*100 = 150。而TGI大于100,則說明我們專業中女生占比更高。
但是大家再考慮一種狀況:如果我們專業歸屬在女校之中(假設我們專業比較特殊,允許招收男生),那么大家還會覺得我們專業的女生更多嗎?
顯然不會。因為錨定的群體中,女生占比接近100%(因為還有我們幾個男生在,分子略小于分母),而我們專業中的女生比例只有75%,少于大盤。
讓我們回到一開始的小故事中。如果60%凱迪拉克車主都愛去洗浴中心,而整個豪車群體只有30%的車主愛去,那么凱迪拉克車主在“愛去洗浴中心”的TGI指數為60%/30%*100=200,遠高于100,那么可以說凱迪拉克車主“更”愛去。
需要注意的是:如果只看60%這一單一的數字,我們無法是無法“更愛去”這個結論的,頂多說他們“愛去”。如果中國車主60%去洗浴中心,那么凱迪拉克車主并未表現出明顯的偏好性,只是符合一般規律而已。
所以,我們不能孤立地看待一個數據,它只是一個冷冰冰的數字而已。我們必須將它帶入到具體的情景當中,我們才能判斷這個數字是高還是低、是大還是小。
其中我們可以帶入的場景之一就是它所屬的群體里,即它的一個超集之中。
二、大數定律與品牌的同質人群假設
我們上初中時就知道:當擲硬幣的次數越多,正面出現的概率越來越趨近于0.5。
將大數定律延伸到我們的人群畫像中也類似、我們觀察的某個群體數量越多,其在某個特征的分布,應該越來越趨近于整體大盤的分布水平。
考慮到大眾汽車銷量很高,并且在中國汽車市場上有較大的保有量,我們可以假設大眾車主的男女比例、省份分布,跟中國4.39億汽車車主的男女比例、省份分布應該是類似的。即,子集在某個維度上的分布,應該與大盤相同。
但是,我們經常會發現,子集在某個維度上的分布,比大盤要高或者低。那到底是什么因素導致的呢?
實際上,我們市場營銷理論的基石是“同質人假說”——某個品牌的目標消費者(Target Audience),是一群有著相似年齡、性別、地域、消費能力、價值觀的群體。比如,很多品牌官網上可能會明確介紹:我們品牌和產品,主要面向25-30歲的白領女性,她們居住在一線和新一線,追求新鮮的事物,等等。
同質人假設有其合理性:一方面品牌可以更明確找到符合其特征的目標消費者,可以有針對性地開發特定產品,并利用特定媒體渠道進行廣告觸達,即品牌更希望找到某一類人;另外一方面,從消費者的視角看,可以通過這些品牌定位和理念,來快速找到適合自己的產品和品牌,即某一類人也會找到適合自己的品牌。
同質性假說造成的結果則是某個相似群體在某個品牌下的高度聚集。比如提到奔馳車主,我們就覺得這是一個有錢人的群體。
所以,如果我們觀察的群體,在某個維度上的分布,跟大盤相比出現了較大的異常(過高/過低),我們可以假設是品牌造成的這種差異(畢竟在真實社會中,要準確計算某個因素的解釋力非常困難),而這往往可以評估品牌建立的有效性。
比如品牌A希望吸引25-30歲的一線白領女性,通過CRM數據分析發現:該品牌符合這些條件的消費者占比是20%,比例與大盤中符合上述條件的人群占比一樣。我們可以認為品牌形象并未成功建立;換句話說,即使品牌什么都不做,來消費者的中白領女性比例跟現在也沒什么差別。
我們在分析數據的時候,遇到TGI指數過高或者過低的維度,往往是一個突破口,我們可以在這個維度上繼續深挖。
三、咖啡與混淆變量
我是一個咖啡成癮者,每天午覺起來比都要來一杯咖啡,所以格外關注咖啡對健康的影響。事實上,咖啡對健康的研究經常見之于媒體。
一份研究表明:
研究結果表明,喝咖啡的人平均每天要喝兩杯咖啡,包括脫咖啡因咖啡或速溶咖啡或研磨咖啡。他們患慢性肝病的風險比不喝咖啡的人低21%,患慢性肝病或脂肪肝的風險低20%。他們死于慢性肝病的可能性也降低了49%。
有趣的是,也有一些研究表明:“與完全不喝咖啡的人比較,一天喝1~5杯咖啡的人患心肌梗死的概率高1.34倍?!?/p>
作為咖啡愛好者,我當然說服自己相信第一個研究的結論。
可是為什么這些研究的結論竟然會如此大相徑庭,甚至截然相反呢?
我對此的解釋是“混淆變量”。
第一份研究使用的數據是英國的Biobank 英國生物樣本庫。根據《維基百科》的介紹:該生物樣本庫始于2006年,對40~69 年齡段的500,000 名志愿者的各項生理指標持續進行觀測;抽樣人群主要來自生物樣本庫研究中心周邊10-20英里范圍內的居民,“以城市人口居多”。
然而,年齡與經濟水平也會直接影響“肝病”。因為也存在這樣一種可能性:收入越高的人,越有可能每天消費咖啡;同時,他們也能享受到更好的醫療服務,獲得科學的飲食和鍛煉建議,這些因素可能也會影響慢性疾病的發病。因此,高咖啡消費與低慢性疾病發病率的相關,可能也只是一種簡單的相關表象,背后的共同推手是“高收入”。
而認為咖啡有害的研究中,除了咖啡導致心肌梗死這一種因果解釋之外,我們也可以假設:需要經常熬夜加班這一變量,是讓二者存在相關的共同推手——由于需要經常熬夜加班,才會需要大量咖啡因的攝入來保持清醒;與此同時,熬夜加班也加大了心肌梗死的風險。
這就是背后的“混淆變量”,簡單來說:Z導致了X,Z也導致了Y;乍看起來,X、Y存在因果或者相關,因為它們經常相伴相生。
而這跟TGI又有什么關系呢?
如果你看到一個數據:未患脂肪肝的人群中,70%的人都是咖啡愛好者,TGI指數是170;而患有脂肪肝的人,35%是咖啡愛好者,TGI指數是85。
這是否意味著喝咖啡能減少得脂肪肝的可能性呢?
通過上面混淆變量的分析,你會堅定地否定這一想法。
TGI指數也只是一個數字,我們可以通過過高或者過低的TGI去尋求進一步的人群的洞察,但是不意味著這個維度就能對群體的形成具有解釋力。
專欄作家
簡寫2019,人人都是產品經理專欄作家。理性派,思考本質問題。堅定地用數據和結構化解決一切問題。
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
某個群體的特質并不代表這一類群體,總體的選擇范圍不同,得出的結果也就不同
學到了,某個群體的用戶特征并不代表這一類群體。
學到了,通過各種定義指數確實能夠在一定范圍內對用戶行為做出判斷和研究,但也并不是全部,指數不能完全性依賴。