將一個App應用從1.9分提到4.5分,需要做些什么?
各類應用商店評分的重要性,不言而喻。評分低下會影響排名,排名影響的是下載量和下載速度,最終影響商業結果。
運營過一個C端產品的人,大抵都了解在應用商店里評分的重要性。評分能影響應用在商店里的排名,以蘋果商店為例,想進入某個分類的前1000名,4分是一個最基礎的準線。排名進而影響的是下載量和下載速度,最終影響商業結果。商店評分的重要性,不言而喻。
前不久每日優鮮的評分翻車事件,說起來也特別好笑——更新文案中跪舔996,引起大量用戶反感(或許用戶大部分都是程序員),導致各路商店里每日優鮮被瘋狂diss,好好的4.5分被刷成1.3。本想抖個機靈,結果一夜回到解放前。
那我們的應用是怎么了,怎么就到了1.9了?
事情得從一年前說起。
2018年7月,我們以產品演進的形式,承接了一個基于音頻學習的外語學習移動產品,用戶主要分布在北美,有一定的群眾基礎。
接手時,項目已經上線,總體功能還算可以,但效果不是很理想,主要表現為:
- 市場反應差,蘋果商店里評分僅為1.9;
- 用戶反饋的信息很雜亂,難以追根溯源;
- 想優化,不知從何入手。
于是有了下面一段對話:
老板,愁眉苦臉:這怎么弄???這評分實在太讓人沮喪了!
我:你想要到多少分?
老板,毫不猶豫:越高越好!
我:你先冷靜一下!
評分低于2.5,大部分還是應用本身有問題,于是我們有了第一階段:
2018年7月-2018年11月:維穩
這一階段,我們主要解決的是bug和性能問題。
輕易能復現的bug易解,眾說紛紜的性能問題難調。性能問題里,首當其沖的,就是應用崩潰。
我們用google firebase來收集數據,當時的崩潰率在6%左右,用戶關于應用崩潰的抱怨也層出不窮。經過調查,我們著實發現些可以修復的事情,技術人員加緊步伐,爭分奪秒地迭代了幾個版本后,崩潰率和相關抱怨有了非常明顯的降低。
經過技術評估、行業對比,我們做了信息拉通:
- 我們這款應用,因為是音頻類的應用,它的崩潰率就是會比純文本類的應用高一點;
- 因為我們采用的是react native的技術棧,在安卓機上的表現就是會比蘋果機差一點;
- 經過我們近期4次版本線上數據的分析統計,我們認為,安卓崩潰率在3%、蘋果崩潰率在1%,是我們合理的性能指標。
在以后的迭代中,如果發現崩潰率到達警戒,則我們要尤為重視。
圖例1: 安卓設備上crash free rate
三個月后,我們的評分已經悄然升到3分。
啟發一:數據,相互比較,才有意義
起初,我們沒有數據,不知什么樣的表現才讓人安心。通過一段時間的運營、迭代,有了各種比較,才正確地建立了我們的安全指標。有了這個指標做指導,我們的工作才更加有方向。
3分不是任何人想要的終點,我們在尋求下一步的改變。
2018年11月-2019年1月:求變
應用商店里的評分,大家想來也知道會有很大的隨意性:
- 阿西吧,居然要收費?差評!
- 咋沒有智能問答?差評!
- 勞資今兒心情不好,差評!
在對這些評價置之一笑的同時,我們也在盡所能地分析總結,看有什么是我們能解決的。但有一個很明顯的問題困擾了我們:評論信息太少,我們難以定位。一線客服是兼職的,能提供的信息非常有限。
于是,我們增加了一個新的功能,應用內評價:
- 搖一搖,報告問題;
- 適當地彈出調查,給高分的,引導到商店去評分;給低分的,填具體信息反饋到后臺。正所謂:我們做的好,請告訴全世界,做的不好,告訴我們。
這個功能效果顯著:
- 一來為用戶提供了情緒的出口,讓他們更加方便地吐槽、抱怨,而不用去商店里發泄;
- 二來我們能在后臺統計到用戶使用的機型、系統、版本、甚至是都做了什什么操作。
圖例2:應用內評價及后臺系統
通過這些數據,我們得到很多有用的信息,比如:
- 我們一直沒有做iwatch的適配,我們發現反饋來源里暫時沒有iwatch,那么iwatch的適配就暫時被放在低優先級,不急于處理。
- 有人反饋說,音頻播放的按鈕不靈敏。我們試了試,沒能復現這個原因。設想可能是個別問題,比如他網絡不好,或是手機問題;后來有更多用戶來反應同樣的問題,那么這個問題便不容小覷,優先級大大提升,我們必須馬上做測試、檢測、系統優化。
到了2019年1月份,我們的評分已經漸漸上升到3.8分,著實令人欣慰。
啟發二:數據,能幫助我們厘清優先級,正確分配資源。
我們預算有限,團隊規模不允許我們做大而全的事情。其實,任何一個項目的預算都有限,如何把錢花在刀刃上,可能是每個項目都要考慮的問題。我們無法在短時間里做到十全十美,數據可以幫我們度量事務的重要性,在迭代增量中,爭取最大的商業價值。四兩拔千斤,說的可能就是這意思。
2019年1月-2019年3月:演進
系統穩定了,功能也增強了,是時候談談產品該如何演進了吧。
我曾做過很多設想,比如做一個類似英語流利說那種語音智能打分?讓用戶自己創造內容?初步做了個估算,哪一項都得個一年半載的。
這個時候,我們也有了更多更穩定的數據來源:
- 系統運維數據:firebase的崩潰統計;
- 用戶行為數據:firebase的事件埋點;
- 用戶反饋數據:蘋果/谷歌商店的評論及評分、應用內評價;
- 商業統計數據:蘋果/谷歌后控制中心。
通過對這些數據的分析和比較,我會得到和之前認知不太一樣的結果——比如說,我常聽說商業級產品會有相對集中的用戶行為,因為他們有相同的文化、流程等,而用戶級產品沒有。真的沒有嗎?
這款產品在20年前賣的是CD,用戶就喜歡在開車的時候聽點外語,美國地廣人稀,無網又是常態,那么這種場景就是這款app的重要用戶使用習慣,通過事件點擊數據,我們也能得到一致結論。
圖例3:音頻的使用的周期性,波峰出現在工作日,波谷出現在周末,每個周期出現的規律大體相同,可以推斷用戶大多數會在通勤時使用該應用
那么,藍牙、下載、車載配置,就是用戶最最需要的特性,而在最初的設計中,這部分功能是缺失的,導致相當一部分用戶在反饋這個問題。如今,現在便是產品演進的最好時機。
小步快速地演進了上述功能后,在今年3月初,我們的app已經升到了4.5分,得到了用戶更高的滿意度。用戶滿意了,又怎樣呢?下圖是蘋果商店里銷量的走勢圖。
老板再也不是愁眉苦臉的樣子了,他們現在更熱衷于討論產品如何進一步優化升級。4.5分不是一個終點,無論在用戶量擴大、還是產品體驗上,我們還有很長的路要走。
啟發三:數據,能幫我們糾正認知偏差,回歸客觀事實。
我以前做項目交付,對產品總是存在一些假想,認為應該是這樣這樣。如今明白,基于驗證的結果,才更為可信。
基于驗證的學習策略,是精益創業思想的核心理念之一。基于此理念,Eric Ries定義了“度量——學習——構建”的驗證式學習循環。
如何驗證,數據是最為恰當的手段之一:有針對性地埋點,對產品進行數據度量,通過定性定量分析,學習數據帶來的結果,去偽存真,形成客觀認知,進而構建新一輪的迭代增量——以此來踐行產品演進,或許再適合不過。
作者:劉瀛洲,ThoughtWorks咨詢師,個人公眾號:圓周江湖。
本文由 @劉瀛洲 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
寫得很棒,從出發點到目標節點的過程也很清晰。每個階段針對性的投入資源,解決最高優先級的問題,有效反饋在用戶評價和評分上。
好奇的一點是,你們在這中間走的彎路。
2018年7月-2018年11月這條時間線是維穩和求變同時在進行嗎
不錯,學到不少,希望可以深入分享一下數據埋點的干貨
咦,像是小編改錯時間線了
如果文章有自讀功能就好了
感謝作者的分享,讓我受益匪淺!???????? 作者能再分享下關于數據埋點相關的干貨嗎?期待ing
有點意思
有錯別字。
咦,哪里?不知道能不能改一下。
啟發二:數據,能幫助我們厘清(→理清)優先級,正確分配資源。
(⊙o⊙)…厘清也有,孤陋寡聞了…