久久久久精品无码专区,日韩毛片无码永久免费看

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

精細(xì)化用戶增長案例（7）：你真的搞明白ABtest了么？我看未必！

李維鑫

2019-12-15

1 評論 16693 瀏覽 119 收藏

13 分鐘

ABtest越來越受到大家的重視，快速的、靈活的快速對比實(shí)驗(yàn)?zāi)苎杆俚恼页鰡栴}所在，避免了大范圍的資源浪費(fèi)。所以設(shè)計(jì)一個(gè)好的實(shí)驗(yàn)是至關(guān)重要的。

一、A/B 測試是什么

簡單來說，A/B測試在產(chǎn)品優(yōu)化中的應(yīng)用方法是：在產(chǎn)品正式迭代發(fā)版之前，為同一個(gè)目標(biāo)制定兩個(gè)（或以上）方案，將用戶流量對應(yīng)分成幾組，在保證每組用戶特征相同的前提下，讓用戶分別看到不同的方案設(shè)計(jì)，根據(jù)幾組用戶的真實(shí)數(shù)據(jù)反饋，科學(xué)的幫助產(chǎn)品進(jìn)行決策。

A/B測試的應(yīng)用方式?jīng)Q定了它擁有的三大特性：先驗(yàn)性、并行性和科學(xué)性。

先驗(yàn)性：?A/B測試其實(shí)是一種“先驗(yàn)”的試驗(yàn)體系，屬于預(yù)測型結(jié)論，與“后驗(yàn)”的歸納性結(jié)論差別巨大。同樣是用數(shù)據(jù)統(tǒng)計(jì)與分析版本的好壞，以往的方式是先將版本發(fā)布，再通過數(shù)據(jù)驗(yàn)證效果，而A/B 測試卻是通過科學(xué)的試驗(yàn)設(shè)計(jì)、采樣樣本代表性、流量分割與小流量測試等方式來獲得具有代表性的試驗(yàn)結(jié)論，這樣就可以用很少的樣本量就能推廣到全部流量可信。

并行性：?A/B測試是將兩個(gè)或以上的方案同時(shí)在線試驗(yàn)，這樣做的好處在于保證了每個(gè)版本所處環(huán)境的一致性，便于更加科學(xué)客觀地對比優(yōu)劣。同時(shí)，也節(jié)省了驗(yàn)證的時(shí)間，無需在驗(yàn)證完一個(gè)版本之后再測試另一個(gè)。

科學(xué)性：?這里強(qiáng)調(diào)的是流量分配的科學(xué)性。A/B 測試的正確做法，是將相似特征的用戶均勻的分配到試驗(yàn)組中，確保每個(gè)組別的用戶特征的相似性，從而避免出現(xiàn)數(shù)據(jù)偏差，使得試驗(yàn)的結(jié)果更有代表性。

二、A/B 測試的使用誤區(qū)

誤區(qū)一：輪流展現(xiàn)不同版本

首先需要明確，這種做法不是真正意義上的A/B測試。而這一現(xiàn)象，經(jīng)常出現(xiàn)在如今的廣告投放的環(huán)節(jié)。廣告主為了提升著陸頁的轉(zhuǎn)化率，會選擇將不同的廣告版本進(jìn)行輪流投放展示。

但這一做法并不能保證每個(gè)版本所處的環(huán)境相同，例如選在工作日的晚七點(diǎn)黃金檔和下午三點(diǎn)時(shí)段，受眾群體會有明顯區(qū)別，以至于最終效果是否有差異，甚至導(dǎo)致效果不同的原因是很難下定論的。

正確做法：?不同版本方案并行（同時(shí)）上線試驗(yàn)，盡可能的降低所有版本的測試環(huán)境差別。

誤區(qū)二：選擇不同應(yīng)用市場投放（隨機(jī)選取用戶測試）

對于一些已經(jīng)意識到數(shù)據(jù)先驗(yàn)重要性的企業(yè)來說，為了驗(yàn)證新版本對于用戶使用真實(shí)影響，可能會選擇將不同版本打包，分別投放到不同的應(yīng)用市場，當(dāng)發(fā)現(xiàn)其中某版本的數(shù)據(jù)表現(xiàn)的最好，就決定將該版本全量上線。

更有甚者，會隨機(jī)選取一部分用戶（甚至是公司內(nèi)部人員）進(jìn)行前期試用，根據(jù)數(shù)據(jù)反饋決定迭代版本。這都違背了A/B測試的科學(xué)流量分配的原則，很容易造成辛普森悖論（即某個(gè)條件下的兩組數(shù)據(jù)，分別討論時(shí)都會滿足某種性質(zhì)或趨勢，可一旦合并起來考慮，卻可能導(dǎo)致相反的結(jié)論）。

正確做法：?科學(xué)的進(jìn)行流量分配，保證每個(gè)試驗(yàn)版本的用戶特征相類似。

誤區(qū)三：讓用戶自主選擇版本

不少企業(yè)會在新版的頁面上留下返回老版本的入口，讓用戶自主選擇使用哪一版，通過收集返回按鈕的點(diǎn)擊率來判斷最佳版本。但該思路不利于統(tǒng)計(jì)分析用戶在新版的行為數(shù)據(jù)，因?yàn)橛脩綦x開新版本可能單純是因?yàn)榱?xí)慣使用老版本，而不是認(rèn)為新版本的體驗(yàn)不好，最終導(dǎo)致了試驗(yàn)結(jié)果的不準(zhǔn)確。

正確做法：?讓用戶展現(xiàn)對不同版本的真實(shí)使用體驗(yàn)，企業(yè)則應(yīng)實(shí)時(shí)關(guān)注各版本的數(shù)據(jù)表現(xiàn)，并根據(jù)數(shù)據(jù)反饋及時(shí)調(diào)整試驗(yàn)流量。

誤區(qū)四：對試驗(yàn)結(jié)果的認(rèn)知和分析過淺

這一誤區(qū)又包括了兩個(gè)不同的內(nèi)容：

其一，認(rèn)為只有當(dāng)試驗(yàn)版本結(jié)果優(yōu)于原始版本時(shí)，試驗(yàn)才算成功。事實(shí)上，A/B 測試是用于選擇最佳版本的工具。試驗(yàn)可能出現(xiàn)的結(jié)果分為三種：試驗(yàn)版本有提升（試驗(yàn)版本最佳）、無明顯差異（兩版本均可）、試驗(yàn)版本的表現(xiàn)比原始版本糟糕（原始版本最佳），這三種結(jié)果其實(shí)都說明了試驗(yàn)的成功。

其二，單從試驗(yàn)的整體數(shù)據(jù)結(jié)果，就推論所有場景的表現(xiàn)效果。例如，當(dāng)A/B測試的結(jié)果表明試驗(yàn)版本的數(shù)據(jù)差于原始版本時(shí)，就認(rèn)定所有的地區(qū)或渠道的效果都是負(fù)面的。

但如果細(xì)分每個(gè)版本中不同瀏覽器的數(shù)據(jù)，可能會發(fā)現(xiàn)：由于某一瀏覽器的明顯劣勢，導(dǎo)致整體試驗(yàn)數(shù)據(jù)不佳。因此，不要只專注于試驗(yàn)數(shù)據(jù)的整體表現(xiàn)，而忽略了細(xì)分場景下可能導(dǎo)致的結(jié)果偏差。

正確做法：?在分析試驗(yàn)整體數(shù)據(jù)的同時(shí)，需要從多個(gè)維度細(xì)分考量試驗(yàn)數(shù)據(jù)結(jié)果

三、A/B 測試可以用在哪里

盡管A/B 測試可以彌補(bǔ)產(chǎn)品優(yōu)化中遇到的不足，但它并不完全適用于所有的產(chǎn)品。因?yàn)锳/B 測試的結(jié)果需要大量數(shù)據(jù)支撐，日流量越大的網(wǎng)站得出結(jié)果越準(zhǔn)確。通常來說，我們建議在進(jìn)行A/B測試時(shí)，能夠保證?每個(gè)版本的日流量在1000個(gè)UV以上?，否則試驗(yàn)周期將會很長，或很難獲得準(zhǔn)確（結(jié)果收斂）的數(shù)據(jù)結(jié)果推論。

說完什么樣的產(chǎn)品適合用A/B 測試，接下來我們將從優(yōu)化內(nèi)容和應(yīng)用場景兩個(gè)方面說明A/B測試可以用在哪些地方，希望能給你一些啟發(fā)。

優(yōu)化內(nèi)容

產(chǎn)品UI

不同行業(yè)的產(chǎn)品需要不同的風(fēng)格，同時(shí)還要與企業(yè)的品牌相得益彰。利用A/B 測試優(yōu)化UI能給用戶帶來更好的交互體驗(yàn)和視覺感受。

文案內(nèi)容

顧名思義是指用戶閱讀到的文字內(nèi)容，它貫穿一個(gè)產(chǎn)品的所有部分，小到圖片配文和按鈕文字，大到文章標(biāo)題甚至版塊主題。這些部分都可以嘗試變換文案內(nèi)容，測試不同方案的數(shù)據(jù)效果。

頁面布局

有些時(shí)候，可能根本不需要對產(chǎn)品的UI或是文案內(nèi)容作出調(diào)整，只是在布局排版上的改變，就可以出現(xiàn)增長的效果。

產(chǎn)品功能

想給產(chǎn)品增加一個(gè)新功能，可是很難確定是否能達(dá)到用戶的預(yù)期，如果盲目上線，可能會造成一些損失。使用A/B 測試，對你的用戶真正負(fù)責(zé)。例如：社交類產(chǎn)品在付費(fèi)查看照片的新功能正式上線前，需要進(jìn)行A/B 測試，以驗(yàn)證功能的使用情況和效果。

推薦算法

包括基于內(nèi)容的推薦算法（根據(jù)用戶的歷史記錄推薦相似內(nèi)容）、基于協(xié)同過濾的推薦算法（根據(jù)有相似興趣用戶的行為推薦相關(guān)內(nèi)容）、基于關(guān)聯(lián)規(guī)則的推薦算法（根據(jù)內(nèi)容本身的相關(guān)性給用戶推薦），最終提高用戶使用黏性。

四、應(yīng)用場景

廣告著陸頁

著陸頁作為互聯(lián)網(wǎng)營銷中流量的承接和轉(zhuǎn)化的關(guān)鍵步驟，如何讓訪客在看到廣告（或營銷頁面）后點(diǎn)擊進(jìn)入著陸頁，并繼續(xù)保持對您的產(chǎn)品或服務(wù)的興趣，乃至產(chǎn)生好感，最終完成注冊、購買、分享等轉(zhuǎn)化行為是十分重要的。A/B測試能夠幫助你最大化你的營銷ROI。

Web/H5 頁面

除廣告營銷的傳播外，產(chǎn)品的官網(wǎng)頁面（不論是PC端還是移動端）始終是用戶了解產(chǎn)品的重要渠道。因此，如何讓用戶更好的了解產(chǎn)品信息，激發(fā)用戶產(chǎn)生進(jìn)一步行為意愿，從而得到更高的注冊率、購買率、下載率等，是Web端頁面優(yōu)化的首要目標(biāo)。利用A/B測試，可以在較少的成本支出下，找到頁面的最佳展現(xiàn)方法。

APP用戶體驗(yàn)

隨著C端用戶的海量進(jìn)入，產(chǎn)品的復(fù)雜度越來越高，新版本的決策風(fēng)險(xiǎn)也急劇提升，保持產(chǎn)品核心業(yè)務(wù)數(shù)據(jù)穩(wěn)步增長是每個(gè)App的版本目標(biāo)，通過A/B測試在每個(gè)版本正式發(fā)布之前驗(yàn)證版本的數(shù)據(jù)表現(xiàn)，讓每次迭代都能得到確定性增長。

媒體廣告投放與管理

對于媒體和廣告技術(shù)公司而言，可以通過A/B測試實(shí)現(xiàn)由設(shè)計(jì)與數(shù)據(jù)驅(qū)動的創(chuàng)新性廣告產(chǎn)品的優(yōu)化。

一方面借助測試可以優(yōu)化廣告投放效果和廣告資源填充率，以達(dá)到提升廣告單價(jià)的目標(biāo)；另一方面還能衡量現(xiàn)有廣告產(chǎn)品對用戶體驗(yàn)的影響，通過不斷提高用戶體驗(yàn)的廣告產(chǎn)品，從而驅(qū)動更高的移動廣告業(yè)務(wù)收入。

灰度發(fā)布

目前產(chǎn)品優(yōu)化迭代的方式，通常是直接將某版本上線發(fā)布給全部用戶，一旦遇到線上事故（或BUG），對用戶的影響極大，解決問題周期較長，甚至有時(shí)不得不回滾到前一版本，嚴(yán)重影響了用戶體驗(yàn)。A/B測試通過給小批量用戶發(fā)放版本，有效減少全用戶發(fā)生線上事故/重大BUG的概率，絕大多數(shù)用戶對BUG無感知，最大程度保證了用戶的良好體驗(yàn)。