3年產(chǎn)品,教你如何用好AB Test

14 評論 15634 瀏覽 55 收藏 11 分鐘

本文作者分享了自己從事產(chǎn)品經(jīng)理三年以來做AB Test的相關(guān)經(jīng)驗。在自我總結(jié)的同時,期待可以提高自己。

入行三年,回顧自己做過的四五十個AB Test,有成功也有失敗,有疑惑也有感嘆。剛開始接觸AB Test理論的時候,心想這真的是產(chǎn)品的一劑靈丹妙藥啊,就像互聯(lián)網(wǎng)有一句話,“當(dāng)產(chǎn)品想不清楚的時候,就做AB吧!”,但它真的有這么靈嗎?它真的能拯救你的產(chǎn)品于水火嗎?讓我們一起揭開AB Test的靚麗面紗。

一、當(dāng)我們說起AB Test,我們在說什么

AB Test實(shí)際上是一種假設(shè)性驗證,是一種很科學(xué)的方法論。通過設(shè)置只有一個變量的實(shí)驗,在兩組特征均分的用戶群中放置一段時間,最終分析由這個變量帶來的數(shù)據(jù)浮動。

與其互相撕逼,不如讓數(shù)據(jù)說話。

舉個例子:審美是一件非常復(fù)雜的事情,2017年,團(tuán)隊的設(shè)計師們曾經(jīng)用AB Test的邏輯不斷測試,尋找到了點(diǎn)擊率更優(yōu)的Banner樣式,把審美這件事進(jìn)行量化。一方面,這次的AB確實(shí)讓我們在能想到的幾種設(shè)計樣式中找尋到了最優(yōu)解,減少設(shè)計師和運(yùn)營平時的相互扯皮,提升團(tuán)隊效率;但另一方面,也給大家?guī)砹诵碌乃伎?,市場會變,審美會變,現(xiàn)在的最優(yōu)解在未來真的適用嗎?

我們現(xiàn)在AB到的所有方案,包含了所有可能的形式嗎?會有更好的形式嗎?仿佛小熊摘玉米,可能你能看到的,就是某個空間某個時間內(nèi)的最大的玉米,而后面更大的玉米,隱藏在你的下一次判斷中。真的要不斷依賴AB去尋找這個最大的玉米嗎?

實(shí)際上,AB Test解決是的決策的準(zhǔn)確性和成本之間的平衡問題。決策的準(zhǔn)確性是指你能否有看到周圍更大的玉米的能力。這決定著,投入產(chǎn)出比的天花板。判斷的成本是指這個相互PK尋找更大的玉米的過程是有成本的,無論是產(chǎn)品設(shè)計、開發(fā)、數(shù)據(jù)分析、溝通成本,還有最重要的時間成本,都會讓整個戰(zhàn)線拉的非常長。如果產(chǎn)品每次都可以以較為準(zhǔn)確的眼光迅速發(fā)現(xiàn)周圍比較大的玉米,那么實(shí)際上是不需要AB Test提供這個PK的過程的。而判斷的準(zhǔn)確性。仍然是決定這場戰(zhàn)爭的核心。

二、AB Test的常見誤區(qū)

1. 想不清楚就做AB?你只是把困境后移了

剛剛接觸AB的時候,大家會覺得這是一劑救命稻草。因為是拍照類的APP,拍照效果就是我們的核心,有時候作出兩種效果的方向,但產(chǎn)品和效果設(shè)計師暫時想不清楚,哪一種效果用戶會更喜歡呢?于是把一堆自拍效果同時上線AB。

我做過最多的一次AB,是有56個實(shí)驗組,把各種效果參數(shù)拆開排列組合,完全以數(shù)據(jù)結(jié)論為導(dǎo)向來設(shè)置實(shí)驗。最后上線之后,數(shù)據(jù)有好有壞,用戶反饋也一大堆,然后再根據(jù)數(shù)據(jù)和用戶反饋去拆解,為什么實(shí)驗組A好,為什么實(shí)驗組B不好;為什么年齡大一點(diǎn)大用戶會吐槽效果1,年齡小一點(diǎn)大用戶會吐槽效果2。

這就是想不清楚實(shí)驗?zāi)康牡腁B最終會帶來的困境。所以說,還是要基于產(chǎn)品核心能力和市場,有最起碼的判斷和假設(shè)。再去用AB去驗證這個假設(shè)。

2. 指標(biāo)找錯,一切全費(fèi)

每個產(chǎn)品都有自己的北極星指標(biāo)。所謂北極星指標(biāo),就是一旦這個指標(biāo)變動,產(chǎn)品的戰(zhàn)略目標(biāo)指標(biāo)也會產(chǎn)生強(qiáng)因果關(guān)系的變動。在尋找北極星指標(biāo)的過程中,我們探索過很多次,最終把核心業(yè)務(wù)的保存數(shù)定為北極星指標(biāo),在實(shí)行了一年的周期之后,還是發(fā)現(xiàn)這個指標(biāo)找錯了。因為后面我們發(fā)現(xiàn)當(dāng)保存數(shù)瘋漲的時候,戰(zhàn)略目標(biāo)DAU或者收入并沒有因此而增長。這意味著,之前所有AB Test的結(jié)論都站不住腳,換句話說,做了一年的“無效AB”,浪費(fèi)了無法去估計的資源成本。所以可見,指標(biāo)的尋找是多么重要。

3. AB的結(jié)果是好的,一全量并沒有什么卵用?

我們之前做過的很多AB Test都有這個問題,做了很多比較正向且可信的測試,但全量之后,仿佛一粒沙子融入了大海,大盤并沒有什么波動。分析起來,本質(zhì)上是一種增長乏力的表現(xiàn)。這種乏力分為兩種情況:

  • 每次AB帶來的變動很小,最終反應(yīng)在結(jié)果上數(shù)據(jù)的波動非常小,即使正向,因為其能帶來的改變天花板非常低。
  • 做撬動市場的新功能,但最終沒能打成戰(zhàn)略目標(biāo)的提升。

這時候,市場在提醒你,也許應(yīng)該換一種思路來做產(chǎn)品。

4. 一定要做的改變,需要做AB嗎?

業(yè)界,我見過上新一個功能,就必須做AB Test的產(chǎn)品。如果數(shù)據(jù)不好,這個功能整個都不上線。其實(shí)我個人是不太建議這樣的方法。對于那些戰(zhàn)略新功能,做好前期的市場調(diào)研、需求挖掘更重要。甚至有了功能之后不上線,利用可行性測試讓目標(biāo)用戶試用,不斷優(yōu)化并最終上線。

一定要做的改變也不限于想要撬動市場的新功能,還可能是接下來的戰(zhàn)略目標(biāo)部署等。想清楚之后,如果這些是一定要做的,那么不要讓AB阻擋你改變的腳步。

三、如何真正用好AB Test

1. 忘記它,以不做AB Test為己任

任據(jù)App?Sumo評估,只有25%的AB測試產(chǎn)生了有意義的結(jié)果。而一次完整的AB測試周期可能就需要幾周的時間。有人經(jīng)常問我:AB能來帶增長嗎?答案是,并不能。它只是產(chǎn)品的一種輔助工具,并且要謹(jǐn)慎試用。一個依賴AB Test的產(chǎn)品,并不真正理解它的用戶,它的產(chǎn)品和它的方向。有的時候,AB一時的數(shù)據(jù)雖然是負(fù)向的,但如果產(chǎn)品能判斷這一步的修改對未來戰(zhàn)略目標(biāo)的意義,數(shù)據(jù)也就變得不那么重要了。

每次我們產(chǎn)品內(nèi)部在討論需求的時候,有人在提AB,我都會詢問(1)AB的目的是什么?(2)你覺得哪個方案會更好?(3)你是否做過市場分析和用戶調(diào)研?這三個問題能夠有效幫產(chǎn)品梳理需求的意義。如果僅僅以“我拿不準(zhǔn)哪個方案會更好”來進(jìn)行AB,那么最終你的團(tuán)隊會陷入無限AB無限浪費(fèi)資源的死循環(huán)。所以警惕你的團(tuán)隊始終在用AB的思路前進(jìn),要讓每個產(chǎn)品都培養(yǎng)“以不做AB Test”為己任的意識。

2. 尋找屬于你的業(yè)務(wù)的AB Test規(guī)律

不同類型的AB Test是有不同的策略的。針對我們做過的所有AB Test,我做了這個一個梳理:首先按照有沒有創(chuàng)造新價值,可以把AB分為增長類和核心類。

  • 增長類的AB分為兩類,首先是視覺類的:一般是改一個icon的顏色、改一個UI的排布樣式。另一類是路徑類:減少或者改變用戶的路徑。這一類的增長天花板比較低,不需要給它過高的預(yù)期,但往往投入產(chǎn)出比很高。如果項目組有余力,可以簡單快速AB。
  • 核心類的AB也分為兩類。一類是對已經(jīng)上線的新功能進(jìn)行修改/優(yōu)化。這一類的AB經(jīng)常會影響到老用戶的使用體驗,特別是對于產(chǎn)品的核心功能,一定要慎重修改。比如微信的聊天主界面,從一開始上線到現(xiàn)在,也不會做過多的修改。另一類是完全拓展的新的功能,提供了新的價值。這種建議多結(jié)合市場進(jìn)行判斷,大膽上線。

這只是針對我們自己做過的實(shí)驗進(jìn)行的總結(jié),并不保證適用于所有的行業(yè)。也許你的行業(yè)也有類似的規(guī)律可循,不妨試試吧!

最后,我想談?wù)劇爱a(chǎn)品感”這件事情。對于產(chǎn)品經(jīng)理來說,產(chǎn)品感仍然是我們最核心的能力和價值。AB是一種很理性的增長思路,它往往顯得沒有那么有“人情味”,你無法決定它的答案,但你可以決定如何使用它。一旦開始使用它,預(yù)示著團(tuán)隊以數(shù)據(jù)目標(biāo)為導(dǎo)向的決心,但千萬不要被AB的結(jié)論帶著走,忘記了產(chǎn)品的初心。

 

作者:小梅梅,美圖公司產(chǎn)品經(jīng)理

本文由 @小梅梅 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 請教下,為啥戰(zhàn)略目標(biāo)是dau和收入,北極星指標(biāo)要選保存數(shù)?dau很直觀了呀

    回復(fù)
    1. 兩個原因:1.一般戰(zhàn)略目標(biāo)會比較大,北極星指標(biāo)是一個直觀且跟戰(zhàn)略目標(biāo)強(qiáng)相關(guān)的指標(biāo)。比如FaceBook的之前的北極星指標(biāo)是新用戶建立6個社交關(guān)系,因為一旦建立了這個社交關(guān)系,用戶就被激活了。所以選北極星指標(biāo)比較好量化,好像是一把鑰匙(北極星指標(biāo))開一把鎖(戰(zhàn)略目標(biāo))一樣。2.AB的時候,如果指標(biāo)看DAU,其實(shí)沒法衡量。如果指標(biāo)看收入應(yīng)該是可以,因為現(xiàn)階段我們的收入依賴流量即DAU,所以我們也沒有看收入?,F(xiàn)在我們選的AB Test指標(biāo)是留存。

      來自福建 回復(fù)
  2. 有公眾號什么的嘛

    來自北京 回復(fù)
    1. 有的 只是我沒有發(fā)這篇到公眾號…… 太懶了哈哈哈

      來自福建 回復(fù)
  3. 什么文章都看不見,什么意思

    回復(fù)
    1. 什么意思呀?親看不到文章嗎?

      來自福建 回復(fù)
  4. 4象限圖很正確

    來自廣東 回復(fù)
    1. 感謝指教

      來自福建 回復(fù)
  5. 打卡 不錯

    來自山東 回復(fù)
    1. 謝謝??

      來自福建 回復(fù)
  6. 學(xué)習(xí)了

    回復(fù)
  7. abtext是啥

    回復(fù)
    1. A B 兩種不同的變量在同一環(huán)境下測試

      回復(fù)
    2. 謝謝

      回復(fù)