數(shù)據(jù)分析基礎(chǔ)思維之:對(duì)比思維
對(duì)比是最基本的數(shù)據(jù)分析方法,要講數(shù)據(jù)分析思維,這個(gè)最基礎(chǔ)的方法是肯定繞不開(kāi)的。不過(guò)現(xiàn)在的文章提到對(duì)比思維,很多都是淺嘗輒止,很少看到有人把對(duì)比思維講的更加深入,導(dǎo)致很多數(shù)據(jù)分析初學(xué)者對(duì)于對(duì)比思維的理解非常片面。本篇文章作者通過(guò)對(duì)穆勒五法的詳細(xì)闡述,帶大家深入了解了對(duì)比思維,一起來(lái)看看!
說(shuō)到對(duì)比思維,基本就是以下這種狀態(tài):
本月目標(biāo)100萬(wàn),業(yè)務(wù)現(xiàn)狀是80萬(wàn),通過(guò)這兩者的對(duì)比得出目前沒(méi)有達(dá)到目標(biāo),距離目標(biāo)還有20萬(wàn),完成率80%。
好一點(diǎn)的再加一些同比環(huán)比的數(shù)據(jù),一個(gè)所謂的對(duì)比分析就算完成了。
如果對(duì)比思維是這么簡(jiǎn)單的話,有必要存在數(shù)據(jù)分析師這個(gè)崗位嗎?估計(jì)現(xiàn)在的數(shù)據(jù)分析師都得失業(yè)了吧?
業(yè)務(wù)人員學(xué)會(huì)這種方法只需要5秒鐘,還有數(shù)據(jù)分析師什么事兒啊。
上述案例只能算是對(duì)比方法中最簡(jiǎn)單的一種方法——比大小。所做的工作只是將數(shù)據(jù)轉(zhuǎn)化成結(jié)論,也就是從80萬(wàn)這個(gè)數(shù)據(jù),變成“未達(dá)到目標(biāo)”這樣一個(gè)結(jié)論。
雖然相比數(shù)據(jù),結(jié)論要更容易被人記住和理解,但是“比大小”很難得出一些更深層次的信息。
那對(duì)比思維除了“比大小”,還有哪些更高級(jí)的方法?
我今天就帶大家探尋一下對(duì)比思維到底是怎么回事。
在模塊一底層思維的文章中,我介紹了邏輯思維。而邏輯思維最基礎(chǔ)的是歸納法。在之前的文章里,我只是簡(jiǎn)單的介紹了一下歸納法,今天我們介紹一種更系統(tǒng)的歸納方法——穆勒五法。
穆勒五法是英國(guó)哲學(xué)家穆勒關(guān)于確定現(xiàn)象因果聯(lián)系的五種歸納方法,分別是求同法、求異法、共用法、共變法、剩余法。
如果能深入理解穆勒五法,基本上也就算熟練掌握對(duì)比思維了。
一、求同法,比相同
1960年,英國(guó)某農(nóng)場(chǎng)十萬(wàn)只火雞和小鴨吃了發(fā)霉的花生,在幾個(gè)月內(nèi)得癌癥死了。
后來(lái),用這種花生喂羊、貓、鴿子等動(dòng)物,又發(fā)生了同樣的結(jié)果。1963年,有人又用發(fā)了霉的花生喂大白鼠、魚和雪貂,也都紛紛得癌而死,上述各種動(dòng)物患癌癥的前提條件中,對(duì)象、時(shí)間、環(huán)境都不同,唯一相同的就是吃了發(fā)霉的花生。
于是,人們推斷:吃了發(fā)霉的花生可能是這些動(dòng)物得癌死亡的原因。
后來(lái)通過(guò)化驗(yàn)證明,發(fā)霉的花生內(nèi)含黃曲霉素,黃曲霉素是致癌物質(zhì)。
以上分析方法就是“求同”。
求同法的思路是,如果各個(gè)不同場(chǎng)合除一個(gè)條件相同外,其他條件都不同,那么,這個(gè)相同條件就是某被研究現(xiàn)象的原因。
可用下列公式表示:
場(chǎng)合1, 相關(guān)情況A,B,C, 被研究對(duì)象,a;
場(chǎng)合2, 相關(guān)情況A,D,E, 被研究對(duì)象,a;
場(chǎng)合3, 相關(guān)情況A,F(xiàn),G, 被研究對(duì)象,a;
上述三種場(chǎng)合中,都出現(xiàn)了a現(xiàn)象。而不同場(chǎng)合下都有A條件,所以可以認(rèn)為A條件是a現(xiàn)象的原因。
廣告內(nèi)容分析經(jīng)常會(huì)用這種方法。運(yùn)營(yíng)投放了那么多廣告,自然想知道那些效果比較好的廣告到底有什么特點(diǎn)。
我們可以從投放時(shí)間、廣告內(nèi)容、活動(dòng)形式等等不同的角度去深入分析這些廣告情況。比如分析的情況是這樣的:
廣告1 早上投放 關(guān)鍵字:降價(jià) 活動(dòng)形式:裂變拼團(tuán)
廣告2 下午投放 關(guān)鍵字:免費(fèi) 活動(dòng)形式:裂變拼團(tuán)
廣告3 晚上投放 關(guān)鍵字:限時(shí) 活動(dòng)形式:裂變拼團(tuán)
廣告4 下午投放 關(guān)鍵字:限時(shí) 活動(dòng)形式:裂變拼團(tuán)
價(jià)格轉(zhuǎn)化率比較好的廣告,簡(jiǎn)單分拆了三個(gè)條件,發(fā)現(xiàn)這幾個(gè)廣告的共同點(diǎn)是活動(dòng)形式都是裂變拼團(tuán)。所以拼團(tuán)裂變的方式對(duì)于廣告轉(zhuǎn)化率有著比較好的提升效果,所以之后的營(yíng)銷活動(dòng)可以考慮多以裂變拼團(tuán)的方式進(jìn)行。
求異法,比不同
做化學(xué)試驗(yàn)的時(shí)候,人們發(fā)現(xiàn),氯酸鉀加熱會(huì)產(chǎn)生氧氣,但速度很慢。而一旦加入少量的二氧化錳,就會(huì)快速產(chǎn)生大量的氧氣。
這兩組試驗(yàn),唯一的區(qū)別在于是否放入少量二氧化錳。所以得出結(jié)論:二氧化錳是氧氣快速放出的原因。
這種找出差異的方法被稱為求異法。
求異法的思路是,比較某現(xiàn)象出現(xiàn)的場(chǎng)合和不出現(xiàn)的場(chǎng)合,如果這兩個(gè)場(chǎng)合除一點(diǎn)不同外,其他情況都相同,那么這個(gè)不同點(diǎn)就是這個(gè)現(xiàn)象的原因。
求異法可用下列公式表示:
場(chǎng)合1, 相關(guān)情況A,B,C, 出現(xiàn)被研究對(duì)象a
場(chǎng)合2, 相關(guān)情況 B,C, 不出現(xiàn)被研究對(duì)象a
所以,情況A與現(xiàn)象a之間具有因果關(guān)系。
上述兩種場(chǎng)合中,場(chǎng)合1出現(xiàn)了a現(xiàn)象,場(chǎng)合2沒(méi)有出現(xiàn)。觀察他們各自的條件,發(fā)現(xiàn),場(chǎng)合1有ABC三個(gè)條件,而場(chǎng)合2只有BC,所以可以認(rèn)為是A條件導(dǎo)致了a現(xiàn)象。
現(xiàn)實(shí)環(huán)境下,想要找到只有一個(gè)條件不同而其他條件完全相同的業(yè)務(wù)場(chǎng)景幾乎是不可能的。
因此求異法的應(yīng)用一般都要借助于AB測(cè)試。
AB測(cè)試可以控制對(duì)照組和實(shí)驗(yàn)組的條件,比如投放了兩組廣告,除了廣告文案不同,其他完全相同。如果一個(gè)用了“限時(shí)折扣”,另一個(gè)用了“專屬優(yōu)惠”,而最終轉(zhuǎn)化率如果存在明顯差異,那么廣告文案就是轉(zhuǎn)化率差異的原因。
共用法,先比相同,再比不同
曾有一位聯(lián)合國(guó)的官員被派駐越南,他的任務(wù)是提高越南兒童的營(yíng)養(yǎng)健康水平。
下飛機(jī)后,他發(fā)現(xiàn)自己既沒(méi)有辦公室也沒(méi)有經(jīng)費(fèi),甚至連當(dāng)?shù)氐恼Z(yǔ)言都不懂,可謂沒(méi)有任何資源。
苦思冥想后,這位官員想到了一個(gè)辦法。
因?yàn)樯砀呤菭I(yíng)養(yǎng)水平的一個(gè)重要標(biāo)志,除了特殊情況,一般個(gè)子高的孩子營(yíng)養(yǎng)水平都會(huì)比個(gè)子矮的要好一些。
于是他先從越南各地各階層中通過(guò)測(cè)量身高挑選出了一批高個(gè)兒的孩子,然后排除其中家庭條件優(yōu)越的,僅留下了家庭條件一般、身高卻比同齡兒童高出的孩子,這些孩子作為正面樣本。
在家庭環(huán)境相當(dāng)?shù)那闆r下,他們的家庭是怎樣做到的呢?為了找出其中的原因,這位官員讓這些孩子帶他去觀察他們各自家庭的飲食情況。
經(jīng)過(guò)大量走訪,這位官員發(fā)現(xiàn)這些孩子的共同點(diǎn)是:每天都吃四頓飯,他們的家人經(jīng)常會(huì)抓一些小蝦米做菜,還會(huì)在米飯里加入紫薯葉熬出的汁液。這些都是當(dāng)?shù)乜梢岳玫淖匀毁Y源,并不會(huì)提高家庭的日常開(kāi)支,且容易推廣復(fù)制。而那些個(gè)子比較矮的孩子則沒(méi)有這些特點(diǎn)。
這位官員總結(jié)出了這種飲食方式可以提高營(yíng)養(yǎng)水平,于是,便將這種飲食方式推廣到越南全境。就這樣,他在沒(méi)有任何資源的情況下,將越南兒童的營(yíng)養(yǎng)水平整體提升了整整20年。
這里用到的方法就是共用法,也稱求同求異共用法。
運(yùn)用共用法包括三個(gè)步驟:
第一步,把被考察現(xiàn)象出現(xiàn)的正面場(chǎng)合加以比較,發(fā)現(xiàn)只有一個(gè)共同的情況,由此根據(jù)求同法確定A和a有因果聯(lián)系;
第二步,把被研究現(xiàn)象不出現(xiàn)的反面場(chǎng)合加以比較,發(fā)現(xiàn)A情況不出現(xiàn)是唯一共同的,由此又根據(jù)求同法確定A的不存在與a的不存在有因果聯(lián)系;
第三步,比較正反兩組場(chǎng)合,發(fā)現(xiàn)有A就有a,無(wú)A就無(wú)a,由此根據(jù)求異法得出結(jié)論:A和a有因果聯(lián)系。
上述案例的邏輯過(guò)程是:
先用求同法從高個(gè)兒孩子的飲食中尋找飲食的共同點(diǎn)。然后用求同法發(fā)現(xiàn)矮個(gè)子孩子中沒(méi)有該飲食特點(diǎn)。
最后用求異法對(duì)比兩組的情況。最后得出結(jié)論。
共用法的目的是找出因果關(guān)系,不過(guò)現(xiàn)實(shí)環(huán)境下找到因果關(guān)系比較困難,或者說(shuō)容易找到的因果關(guān)系業(yè)務(wù)人員自己就可以找到。
所以分析到深層的結(jié)論我們一般都用相關(guān)關(guān)系替代因果關(guān)系。
只分析相關(guān)關(guān)系的話,共用法的步驟會(huì)適當(dāng)精簡(jiǎn)。
不追求“有A就有a,無(wú)A就無(wú)a”的結(jié)果,只追求“有A則a更明顯,無(wú)A則a不明顯”。
比如之前提到的廣告分析案例,廣告由于因素太多,過(guò)于復(fù)雜,是很難找到因果關(guān)系的,一般找到與轉(zhuǎn)化率強(qiáng)相關(guān)的因素即可。
- 如果用共用法來(lái)分析廣告,首先需要找出正例和反例,一般是用高轉(zhuǎn)化和低轉(zhuǎn)化的廣告做正負(fù)樣本。
- 然后用求同法對(duì)正樣本進(jìn)行求同,找出普遍存在的一些因素,比如關(guān)鍵字帶有“限時(shí)”。
- 再用求同法對(duì)負(fù)樣本進(jìn)行求同,找出負(fù)樣本是否普遍不存在“限時(shí)”的關(guān)鍵字。
- 最后比較正負(fù)樣本,發(fā)現(xiàn)帶有“限時(shí)”關(guān)鍵字的轉(zhuǎn)化率普遍高,沒(méi)有“限時(shí)”關(guān)鍵字的廣告轉(zhuǎn)化率普遍低。因此得出結(jié)論:“限時(shí)”關(guān)鍵字對(duì)于廣告轉(zhuǎn)化率有提升作用。
共用法相比求同法和求異法,應(yīng)用范圍更廣,很多數(shù)據(jù)分析都會(huì)用到共用法。不過(guò)共用法只能說(shuō)是在求同法、求異法的基礎(chǔ)上,進(jìn)一步提高了結(jié)論的可靠程度,共用法的結(jié)論未必完全正確。
使用時(shí)應(yīng)注意:當(dāng)正事例組和負(fù)事例組的組成場(chǎng)合越多,結(jié)論的可靠性程度越高;對(duì)于負(fù)事例組的各個(gè)場(chǎng)合,應(yīng)選擇與正事例組較為相似的來(lái)進(jìn)行比較(盡量做AB測(cè)試)。
另外要注意共用法的步驟包含兩次求同,一次求異。最后一步的求異過(guò)程大多數(shù)人會(huì)思考,但是在表達(dá)時(shí)候不說(shuō)清楚,還是建議大家表述完整。
共變法,比變化
同樣的一塊地,其他情況都相同,只有肥料的數(shù)量增加了,結(jié)果發(fā)現(xiàn)水稻的產(chǎn)量也在不斷提高。由此我們可以得出多施肥是水稻增產(chǎn)的原因。
這種分析方法就是共變法。
共變法的思路是:在其他條件不變的情況下,如果某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生相應(yīng)變化,那么,前一現(xiàn)象就是后一現(xiàn)象的原因。
共變法可用公式表示如下:
場(chǎng)合1, 相關(guān)情況A1,B,C, 出現(xiàn)被研究對(duì)象a1
場(chǎng)合2, 相關(guān)情況A2,B,C, 不出現(xiàn)被研究對(duì)象a2
場(chǎng)合3, 相關(guān)情況A3,B,C, 不出現(xiàn)被研究對(duì)象a3
所以 A是a的原因
數(shù)據(jù)分析方法中和共變法最像的是相關(guān)分析。
相關(guān)分析,簡(jiǎn)單地說(shuō),就是衡量?jī)蓚€(gè)數(shù)值型變量的相關(guān)性,以及計(jì)算相關(guān)程度的大小。
如果是肥料數(shù)量和水稻產(chǎn)量之間的關(guān)系,通過(guò)相關(guān)分析,可以得出他們之間存在強(qiáng)相關(guān)關(guān)系,以及相關(guān)系數(shù),估算出投入的肥料可以帶來(lái)多少水稻產(chǎn)量。
相關(guān)分析應(yīng)用在現(xiàn)實(shí)的業(yè)務(wù)場(chǎng)景里,就是廣告投放量與銷量之間的相關(guān)關(guān)系、核心功能使用率與留存率的相關(guān)關(guān)系等等諸如此類。
這需要一些相關(guān)分析的知識(shí),比如回歸、相關(guān)系數(shù)、偏相關(guān)等概念,具體這里不做展開(kāi)。
不過(guò)現(xiàn)實(shí)的業(yè)務(wù)場(chǎng)景下,很難做到只有一個(gè)因素發(fā)生不同程度的變化。想要增加結(jié)論的可靠性,要么增加樣本量,要么還是老老實(shí)實(shí)做AB測(cè)試吧。
剩余法,比剩余
有一次居里夫人和她的丈夫?yàn)榱伺逡慌鸀r青鈾礦樣品中是否含有值得提煉的鈾,對(duì)其含鈾量進(jìn)行了測(cè)定。
令他們驚訝的是,有幾塊樣品的放射性甚至比純鈾的還要大。這就意味著,在這些瀝青鈾礦中一定含有別的放射性元素。同時(shí),這些未知的放射性元素只能是非常少量的,因?yàn)橛闷胀ǖ幕瘜W(xué)分析法不能測(cè)出它們來(lái)。
量小放射性又那樣強(qiáng),說(shuō)明該元素的放射性要遠(yuǎn)遠(yuǎn)高于鈾。1898年7月,他們終于分離出放射性比鈾強(qiáng)400倍的釙。
該元素的發(fā)現(xiàn),應(yīng)用的就是剩余法。
剩余法的思路是:已知一個(gè)復(fù)合的被研究對(duì)象是由一個(gè)復(fù)合原因引起的,如果這個(gè)現(xiàn)象的一部分是復(fù)合原因中的一部分的結(jié)果,那么這個(gè)復(fù)合現(xiàn)象的剩余部分就是復(fù)合原因中剩余部分的結(jié)果。
剩余法的公式表示如下:
由a、b、c、d構(gòu)成的復(fù)合現(xiàn)象是復(fù)合原因(A、B、C、D)作用的結(jié)果,
現(xiàn)象a是原因A作用的結(jié)果,
現(xiàn)象b是原因B作用的結(jié)果,
現(xiàn)象c是原因C作用的結(jié)果;
所以,現(xiàn)象d是原因D作用的結(jié)果。
剩余法的要求非??量?,現(xiàn)象和原因的對(duì)應(yīng)關(guān)系必須是明確的。這一點(diǎn)在極度復(fù)雜的現(xiàn)實(shí)業(yè)務(wù)場(chǎng)景下很難做到,應(yīng)用范圍有限,這里就不多介紹了。
對(duì)比思維小結(jié)
數(shù)據(jù)分析方法,都值得重新研究一遍。
綜合以上的方法,我們發(fā)現(xiàn),對(duì)比分析除了最基礎(chǔ)的“比大小”之外,還有“比相同”,“比不同”,“比變化”等等不同的方法。
這些對(duì)比思維的方法還只是框架,在實(shí)際的數(shù)據(jù)分析過(guò)程中,有一些衍生方法。
第一個(gè)衍生方法是趨勢(shì)分析
趨勢(shì)分析的整個(gè)分析過(guò)程基本都是建立在對(duì)比思維的基礎(chǔ)上的。趨勢(shì)分析其實(shí)就是將一個(gè)業(yè)務(wù)指標(biāo),和自己在過(guò)去的情況做對(duì)比。
趨勢(shì)分析過(guò)程中還會(huì)用到一些對(duì)比方法,比如:
如果隨著時(shí)間的發(fā)展,指標(biāo)穩(wěn)步上升,那么基本就是共變法,指標(biāo)隨著時(shí)間上升,未來(lái)也會(huì)上升。
如果趨勢(shì)分析中有幾個(gè)點(diǎn)異常,特別高或特別低,那么找出這些異常點(diǎn)和其他點(diǎn)的區(qū)別,就是求異法。
如果找出幾個(gè)異常點(diǎn)的共同點(diǎn),那就是求同法。
第二個(gè)衍生方法是競(jìng)品分析
競(jìng)品分析也是一類幾乎完全建立在對(duì)比思維基礎(chǔ)上的分析方法,競(jìng)品分析其實(shí)就是將自己的產(chǎn)品和競(jìng)爭(zhēng)對(duì)手的產(chǎn)品在多個(gè)維度上進(jìn)行對(duì)比。
競(jìng)品分析的分析過(guò)程中會(huì)用到一些對(duì)比方法,比如:
如果想找出競(jìng)品近期快速增長(zhǎng)的原因,用的就是共變法。某一時(shí)段做了某件事,之后快速增長(zhǎng)。
如果想找出成功的APP的共同點(diǎn),就是求同法,等等。
其他的衍生方法還有比如相關(guān)分析、AB測(cè)試等等,之前都有提到,這里就不多說(shuō)了。
最后說(shuō)下,以上方法都是不完全歸納,也就是說(shuō)即使論證過(guò)程沒(méi)問(wèn)題,結(jié)果依然有可能是錯(cuò)誤的。而且容易找到的因果關(guān)系已經(jīng)被大家挖掘的差不多了,這些因果關(guān)系我們可以直接拿來(lái)用,我們沒(méi)有必要自己重新造輪子。
所以如果分析處在初步摸索階段,我們可以用這些對(duì)比方法找出一些初步結(jié)論。
如果在找出解決方案的階段,我們可以直接拿那些已經(jīng)被驗(yàn)證的因果關(guān)系做演繹法的大前提,用演繹法做論證,這樣的結(jié)果更可靠而且高效。
對(duì)比分析是數(shù)據(jù)分析的基礎(chǔ)方法,幾乎所有的分析都需要做對(duì)比分析。
但是很多人覺(jué)得對(duì)比思維就是“比大小”,這未免也太小看了數(shù)據(jù)分析師的技能水平了。
很多人覺(jué)得數(shù)據(jù)分析很簡(jiǎn)單,很多數(shù)據(jù)分析的技能看起來(lái)平平無(wú)奇。
實(shí)際上,我們不去說(shuō)那些復(fù)雜的算法,即使是基礎(chǔ)的分析思路都是一門很大的學(xué)問(wèn)。
我覺(jué)得,數(shù)據(jù)分析方法,都值得我們?cè)僦匦卵芯恳槐椤?/strong>
#專欄作家#
三元方差,公眾號(hào):三元方差(sanyuanfangcha),人人都是產(chǎn)品經(jīng)理專欄作家。專注用數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng),擅長(zhǎng)數(shù)據(jù)分析、用戶增長(zhǎng)。喜歡閱讀、思考和創(chuàng)作。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
點(diǎn)贊
你跑出第一個(gè)問(wèn)題之前,麻煩請(qǐng)先解決,不然后續(xù)再多理論,對(duì)于大部分決策者,至少是我,會(huì)覺(jué)得你浪費(fèi)時(shí)間。
1
講的很好,如果能把相關(guān)關(guān)系和因果關(guān)系 做個(gè)分析那就太棒了;因?yàn)槟壳昂芏嗳嗽诮鉀Q問(wèn)題時(shí),雖然收集了大量的數(shù)據(jù),甚至形成價(jià)值信息后,仍無(wú)法很好的解決問(wèn)題,其主要原因就是搞不清楚相關(guān)關(guān)系和因果關(guān)系。