A/B測試:基本概念
網(wǎng)站設(shè)計中,我們經(jīng)常會面臨多個設(shè)計方案的選擇,比如某個按鈕是用紅色還是用藍(lán)色,是放左邊還是放右邊。傳統(tǒng)的解決方法通常是集體討論表決,或者由某位專家或領(lǐng)導(dǎo)來拍板,實在決定不了時也有隨機選一個上線的。雖然傳統(tǒng)解決辦法多數(shù)情況下也是有效的,但A/B測試(A/B-Testing)可能是解決這類問題的一個更好的方法。
所謂A/B測試,簡單來說,就是為同一個目標(biāo)制定兩個方案(比如兩個頁面),讓一部分用戶使用 A 方案,另一部分用戶使用 B 方案,記錄下用戶的使用情況,看哪個方案更符合設(shè)計目標(biāo)。當(dāng)然,在實際操作過程之中還有許多需要注意的細(xì)節(jié)。
A/B 測試并不是互聯(lián)網(wǎng)測試新發(fā)明的方法,事實上,自然界也存在著類似 A/B 測試的事件,比如下圖中的達爾文雀。
達爾文雀主要生活在太平洋東部加拉帕戈斯(Galapagos)的一個名為伊莎貝拉(Isabela)的島上,一部分生活在島的西部,另一部分生活在島的東部,由于生活環(huán)境的細(xì)微不同它們進化出了不同的喙。這被認(rèn)為是自然選擇學(xué)說上的一個重要例證。
同樣一種鳥,究竟哪一種喙更適合生存呢?自然界給出了她的解決方案,讓鳥兒自己變異(多個設(shè)計方案),然后優(yōu)勝劣汰。具體到達爾文雀這個例子上,不同的環(huán)境中喙也有不同的解決方案。
上面的例子雖然和網(wǎng)站設(shè)計無關(guān),但包含了 A/B 測試最核心的思想,即:
1、多個方案并行測試;
2、每個方案只有一個變量(比如鳥喙)不同;
3、以某種規(guī)則優(yōu)勝劣汰。
需要特別留意的是第 2 點,它暗示了 A/B 測試的應(yīng)用范圍,——必須是單變量。有時我們的多個設(shè)計稿可能會有非常大的差異,這樣的情況一般不太適合做 A/B 測試,因為它們的變量太多了,變量之間會有較多的干擾,我們很難通過 A/B 測試的方法來找出各個變量對結(jié)果的影響程度。比如,土豆燒肉和豆腐鯽魚湯都挺美味,但我們很難比較土豆和豆腐哪一個對菜的美味影響更大,而土豆燒肉和豆腐燒肉則是不錯的比較。另外,雖然 A/B 測試名字中只包含 A、B ,但并不是說它只能用于比較兩個方案的好壞,事實上,你完全可以設(shè)計多個方案進行測試,“A/B 測試”這個名字只是一個習(xí)慣的叫法。
回到網(wǎng)站設(shè)計,一般來說,每個設(shè)計方案應(yīng)該大體上是相同的,只是某一個地方有所不同,比如某處排版、文案、圖片、顏色等。然后對不同的用戶展示不同的方案。
要注意,不同的用戶在他的一次瀏覽過程中,看到的應(yīng)該一直是同一個方案。比如他一開始看到的是 A 方案,則在此次會話中應(yīng)該一直向他展示 A 方案,而不能一會兒讓他看 A 方案,一會兒讓他看 B 方案。同時,還需要注意控制訪問各個版本的人數(shù),大多數(shù)情況下我們會希望將訪問者平均分配到各個不同的版本上。要做到這些很簡單,根據(jù) cookie (比如 cookie 會話ID的最后一位數(shù)字)決定展示哪個版本就是一個不錯的方法。
下面是 A/B 測試示意圖:
可以看到,要實現(xiàn) A/B 測試,我們需要做以下幾個工作:
1、開發(fā)兩個(或多個)不同的版本并部署;
2、收集數(shù)據(jù);
3、分析數(shù)據(jù),得出結(jié)果。
關(guān)于 A/B 測試的基本概念就介紹到這里,其余部分我會在后續(xù)文章中繼續(xù)介紹。
源地址:http://www.aliued.cn/?p=2773
- 目前還沒評論,等你發(fā)揮!