提高產(chǎn)品假設及決策質量的方法——因果推斷
產(chǎn)品經(jīng)理的核心價值在于決策,正確的決策能夠引導產(chǎn)品在正確的方向上。那么如何借助于“因果推斷”的一些方法,在已有數(shù)據(jù)的基礎上構建準實驗,并依據(jù)相應的數(shù)據(jù)分析結論去提升事前決策的質量呢?本文進行了總結,希望對你有所啟發(fā)。
產(chǎn)品經(jīng)理的核心價值在于決策力,科學合理的決策將指引業(yè)務前行在正確的方向上,而一旦有所偏離或不斷低質量重復性嘗試則會讓業(yè)務停留在原地轉圈。因此,在整個工作流中, 最為關鍵的其實是第一步,即如何在事前提高決策的質量和正確概率,后面的步驟按照既有流程執(zhí)行也能保證較高質量的交付。
那么如何借助于“因果推斷”的一些方法,在已有數(shù)據(jù)的基礎上構建準實驗,并依據(jù)相應的數(shù)據(jù)分析結論去提升事前決策的質量呢?
一、因果關系與歸因偏誤
首先,我們需要了解因果關系。因果關系是當其他控制變量不變,因某個特定解釋變量的變化而引起被解釋變量變化的關系。倘若我們要對去探究我們所關注的變量的因果關系,其實可以拆解為兩個子問題:其一,界定因果關系:X和Y誰是因、誰是果?;其二,衡量因果效應大小:這種影響有多大?
在正式論述如何去界定因果并估計因果效應之前,我們現(xiàn)來看一個例子認識歸因過程中的常見偏誤并基于此去理解該如何去做因果推斷。假設我們?yōu)榱搜芯磕撤諏MV的貢獻,數(shù)據(jù)里活躍用戶和非活躍用戶,各組里都有使用過該服務或沒有使用過該服務的用戶,詳細數(shù)據(jù)如下所示:
由上表可知,活躍用戶使用過該服務的用戶累計GMV平均比未使用過該服務的用戶高1000元,非活躍用戶使用過該服務的用戶累計GMV平均比未使用過該服務的用戶高500元,但從整體來看,使用過該服務的用戶累計GMV反而比未使用過該服務的用戶低123元。
細分人群構成來看,在現(xiàn)有數(shù)據(jù)中未使用過該服務的用戶主要是活躍用戶,而使用過該服務的用戶主要是非活躍用戶,兩組間人群構成存在差異。也就是說總體數(shù)據(jù)的比較結果并未對個體活躍程度進行控制,因而造成服務使用效果的評價中混入了活躍程度的影響。
從上例中,我們不能根據(jù)直觀數(shù)據(jù)簡單通過正負相關去推導因果關系:因為會存在可觀測或不可觀測的混淆變量對因果解釋造成偏差。因此,因果推斷最主要的思路就是需要控制混淆變量。
控制混淆變量的最理想的方式即采用隨機對照實驗,因為隨機分配使得干擾項條件均值獨立于解釋變量,即解釋變量與任何其他可能的混淆變量都不相關,這種情況下解釋變量與被解釋變量之間不會存在混淆路徑,二者的相關性能直接反映因果關系。但出于種種原因,如時效性、費用成本、操作性困難等原因,我們可能不會有理想實驗條件,只能通過既有的觀察性數(shù)據(jù)去推斷,這時候就需要使用計量方法去幫助我們做出因果推斷。
二、因果推斷的計量方法
以下將簡要介紹4種常用的因果推斷計量方法
2.1 匹配法
基本原理:對于接受處置的個體,找到可觀測特征相同的未被處置的個體,通過比較他們的觀測結果的差異,達到估計處置效應的目標。
成立假設:
- 條件獨立假設:給定可觀測特征后,潛在結果獨立于處置狀態(tài);
- 共同支撐域條件:給定可觀測特征 Xi= x,個體接受處置的概率大于0并小于1。用于確保同時存在處置組和控制組
方法及操作步驟:匹配法主要可分為直接匹配法和傾向得分匹配法兩種。直接匹配法:根據(jù)可觀測的特征值直接匹配;如果可觀測特征只包含少數(shù)幾個非連續(xù)變量,可進行直接匹配,但當可觀測特征維度增加時,要在多維進行直接匹配就存在操作性困難;傾向得分匹配法:通過函數(shù)關系將多維變量變換為一維的傾向得分(propensity score)之后,再根據(jù)傾向得分進行匹配。
傾向得分匹配操作步驟:第一步:估計傾向得分(首先,確定模型-Probit/Logit;其次,選擇納入模型的變量);
第二步:匹配前均衡檢驗:根據(jù)匹配得分將樣本分為若干區(qū)間,保證每個區(qū)間里處置組和控制組的平均傾向性得分相同,并檢驗每個區(qū)間內,處置組和控制組的特征變量是否均衡;
第三步:評估共同支撐域條件,考慮使用有共同支撐域的樣本;
第四步:選擇匹配方法(分塊匹配法、近鄰匹配法、卡尺匹配法、半徑匹配法、核匹配法);
第五步:匹配后均衡檢驗:確定匹配樣本后檢驗處置組和控制組變量是否均衡;
第六步:根據(jù)條件期望公式計算處置效應。
2.2 雙重差分法
方法概述:尋找自然發(fā)生的實驗或者現(xiàn)有的觀察數(shù)據(jù)根據(jù)反事實推斷框架建構實驗條件,尋找良好控制的對照組的準實驗。在干預前后都有實驗組、對照組面板數(shù)據(jù)的情況下,通常采用雙重差分法估計這類干預項目的因果效應。
基本原理:利用實驗組和對照組的變動趨勢差異來衡量因果效應,即用干預后兩組被解釋變量之差減去干預前兩組被解釋效應之差來反應由被解釋變量干預后由此變量所帶來的效應大小。
成立假設:
- 共同趨勢假設:沒有解釋變量干預,對照組和實驗組的自然變動趨勢保持一致;
- 共同支撐域假設:給定可觀測特征 Xi= x,個體接受處置的概率大于0并小于1。用于確保同時存在處置組和控制組。
方法及操作如上圖所示:首先,計算第一重差分,即自然趨勢差異——干預前實驗組被解釋變量均值-干預前對照組被解釋變量均值;其次,計算第二重差分,即干預后差異——干預后實驗組被解釋變量均值-干預后對照組被解釋變量均值。最后,計算雙重差分——干預后差異-自然趨勢差異。
2.3 斷點回歸法
斷點回歸(regression discontinuity design):是一種研究非隨機實驗那接近隨機實驗數(shù)據(jù)的方法,適用于研究某類特定社會科學事件的因果,這些事件的特點是,個體是否受到事件的影響,取決于其某個可觀測特征的連續(xù)變量是否大于給定的臨界值。
而由于該變量在臨界值兩側是連續(xù)的, 因此個體針對該連續(xù)變量的取值落入該臨界點任意一側是隨機發(fā)生的,即不存在人為操控使得個體落入某一側的概率更大, 則在臨界值附近構成了一個準自然實驗。如下圖所示,我們可根據(jù)某一連續(xù)變量的臨界值去劃分出是否接受過解釋變量影響的兩組人群,并根據(jù)其在被解釋變量的值的差異去計算解釋變量所帶來的效應大小。
操作步驟:第一步,用散點圖顯示解釋變量和被解釋變量關系;
第二步,在散點圖基礎上,進一步去除散點噪音,采用多項式回歸或分區(qū)均值擬合的方式對數(shù)據(jù)進行“平滑擬合”并繪制關系圖。
第三步,進行斷點回歸模型基本假設檢驗:檢驗解釋變量的概率分布連續(xù)性及個體特征變量連續(xù)性;
第四步,計算斷點處置效應:采用全局多項式回歸或局部多項式回歸的方法來估計被解釋變量在斷點處的跳躍程度的大小及顯著性。
2.4 工具變量法
基本原理:核心思路是通過工具變量“清理”解釋變量,將解釋變量中與干擾項相關的部分剔除,僅保留與干擾項不相關的部分去估計解釋變量對被解釋變量的因果影響。
如下圖所示,在因果推斷過程中,常常會遇見與解釋變量和被解釋變量均相關的不可觀測變量,如“好勝心”對“教育水平”和“職業(yè)收入”。
在此種情景下,有D到Y的因果路徑,也有干擾項E所帶來的混淆路徑,因此需要截斷。
工具變量的整體思路是引入一個用于剔除被解釋變量中與干擾項相關的部分。如上圖所示,工具變量Z將原有解釋變量D分為與干擾項不相關的D’和與干擾項相關的V,從而讓D’獨立于干擾項,可采用D’到Y的系數(shù)β作為解釋變量D對于被解釋變量Y的因果效應值。而要充當工具變量,需要具備如下兩個前提條件:1.外生性:工具變量和干擾項不相關;2.相關性:工具變量和解釋變量相關。
操作步驟:第一步、定義研究問題,描述機制并設置基本模型,對基本模型進行OLS回歸,得到初步結果。第二步、尋找有效的工具變量:并利用原理、理論或常識證明變量的相關性和外生性。第三步、使用工具變量對模型進行估計,同時進行必要的統(tǒng)計檢驗(解釋變量內生性檢驗-HAUSMAN檢驗/工具變量相關性、外生性檢驗)。第四步、將工具變量估計結果與OLS結果進行對比,理解結果為何有差異。
綜上,在沒有實驗條件或在既往數(shù)據(jù)中,也可通過因果推斷的方法去提高決策判斷力,保證產(chǎn)品交付質量。
本文由 @鯉魚說 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!