產品思考:為什么微信語音消息播放不加進度條?
給微信語音加上進度條,這是很許多微信用戶的痛點所在,用戶想要從長長的語音中更快地聽到重要信息,而不是重復一遍又一遍。但是微信卻一直沒有添加上這個功能,為什么呢?這么設計背后有什么深意嗎?我們又要如何理解?
我最近在看騰訊產品經理的面經,許多面試者被問到一個有趣的問題:微信為什么不加入語音進度條?是啊,為什么不加呢?我在日常使用中,也曾有幾次因為領導發來60s長語音而抓狂。因為在錄音結尾,領導安排我去某個大廈拿文件,而我為了確定大廈名稱,只能從0秒開始又聽了3遍的語音。為了確認兩個字足足花了3分鐘!
我在網上一查,發現跟我一樣的吐槽實在是太多啦!
例如下圖,知乎高贊回答,點贊數2361
微信設計的渣細節有哪些?答:沒有語音進度條!
微博上,同樣每天都有人發微博吐槽微信沒有語音進度條,還時不時@微信團隊。
由此可見,語音消息進度條是明晃晃的一大需求,是許多用戶的痛點所在。
加上進度條的子彈短信和QQ子彈短信就察覺到了這一痛點,并且憑借語音進度條的功能火了一把。子彈短信推出于2018年,上線之初其一大賣點就是語音進度條,并憑借該功能在發布一個月內圈下700萬用戶,實現App Store總榜首連續霸榜9天、社交榜榜首13天。
看到有進度條加持的子彈短信如此火爆,騰訊QQ也選擇了跟進。在2019年更新的QQ 8.0版本中,QQ正式推出了語音進度條功能。語音消息支持暫停和進度拖動,原本的語音氣泡也被附上了漂亮的聲紋。該功能使用至今,并且也同樣應用在了QQ的辦公版TIM上。
微信有加嗎?既然這么多IM軟件都加入了語音進度條,那么微信有考慮過加上嗎?
有的。2018年2月,業內人士就曾爆出微信語音進度條正在內測的消息,當時各路科技媒體紛紛轉載,都在期待該功能的上線。可是時至今年,兩年過去了,我們并沒有看到語音進度條功能的出現,這只能說明:微信團隊在內測之后,選擇了放棄該功能。
以下是2018年媒體關于微信語音進度條即將上線的報道
(網上流出的內測版截圖)
這就有趣了。是什么樣的考量導致微信團隊最終放棄了這個萬千用戶盼望已久的功能呢?
一、需求分析
互聯網產品中,分析一個功能該加不該加,一切都要從用戶需求入手。先分析語音進度條呼聲高漲背后的需求是什么,然后分析該需求發生在哪些場景,最后判斷該需求真偽,大眾還是小眾,值不值得滿足。
步驟一:提煉需求內核
按照需求四要素,語音進度條的需求內核可以提煉為:
- 用戶:微信語音消息接收者場景:第一遍收聽語音時,關鍵信息沒有聽清楚,需要重聽第二遍來確認,但是無法跳過語音前半部分的無用信息,因此浪費了時間。
- 目標:更高效地確認關鍵信息
- 任務:增加語音進度條
若只用一句話,該需求可以概括為:更快地重聽長語音中重要信息的需求。
步驟二:羅列需求場景
由于只有長語音才要用到進度條,所以我們先羅列一些可能會產生長語音的場景。
一條長語音五六十秒,包含150-200字的信息,肯定是帶有敘事性質的才能這么長,一定是包含時間、地點、人物事件等要素的。像“吃飯了嗎”、“我待會去接你”這些問候、陳述、請求類的語句,肯定是短的內容,構不成長語音。
因此,長語音場景普遍為4種:敘事吐槽、咨詢事情、交代任務、溝通工作。
場景1:吐槽敘事
用戶:好友之間場景:敘述者以講故事的口吻向朋友描述一件事情,包含起因、經過、結果,內容較多,因此為通常為長語音。語音案例:“哎,我跟你說,我今天遇到一件奇葩事,我們辦公室不是有個男的叫XXX嘛,他今天XXXXXXXXXXXXXXXXXX,我一聽不對勁啊,我趕緊XXXXXXXXXX,最后XXXXXXXXXXXXXX”
場景2. 咨詢事情
用戶:熟人之間場景:A向B咨詢一些事情,B愿意詳盡回答。由于內容較多,打字耗時,因此B決定用語音回復。語音案例:“你問我雅思怎么復習是嗎?我當時準備了XXX個月,買了XXX書,上了XXX網站,報了XXX班,平時要多練習寫作,不同主題的都要寫,我當時練了XXXX,最后才有所提升………..”
場景3. 交代任務/事情
用戶:員工與老板場景:老板給員工發語音指揮工作,需要交代任務的執行方式、細節和要求,因此通常為長語音。語音案例:“那個小劉啊,吃飯了嗎?是這樣的,我今天去了客戶那里,他同意跟咱們簽合作了,你需要明天打印XX份資料,明天XX點送到客戶辦公室,他們在XX路XX大廈的三樓,不要遲到了。”
場景4. 討論/溝通工作
用戶:同事之間場景:工作上的溝通,有時候會涉及到比較多的細節,信息量較大,打字會很耗時。這種情況下同事之間有時候會用語音進行溝通。語音案例:“你剛發的文件我看了,有幾個地方我覺得好像跟原定的方案不太一致,我語音給你說吧。第一部分XXXX….,原計劃是….,但是你這里…..,第二部分…..。我覺得你可以再問問陳總?”
步驟三:確認需求場景
那么4個長語音應用場景中,哪些是需要用到語音進度條的?
場景1“吐槽敘事”顯然不是,因為不符合“重要信息”的定義(需求內核為“更快地重聽長語音中重要信息”)試想朋友跟你吐槽,發了一個60秒語音,你聽過一次就不會點開聽第二次吧?因為語音內容根本不重要,大體聽懂來龍去脈就好。
那而場景2“咨詢事情”呢?它顯然符合“重要信息”,但不符合“更快”(需求為“更快地重聽長語音中重要信息”)因為對于咨詢事情得到的語音回復,大多數用戶傾向于“仔細、完整地重聽”。
剩下場景3“交代任務/事情”和場景4“討論/溝通工作”。這兩個場景完全符合“更快地重聽長語音中重要信息”這個需求內核。處于工作狀態,所以講究“更快”;因為是工作,所以語音消息中有“重要信息”。因為重要,所以必須要“重聽”。
所以,語音進度條的應用場景為“交代任務”和“討論工作”。這兩個場景明顯屬于辦公場景,因此語音進度條可以認為是主要覆蓋辦公場景的功能。語音進度條這個需求可判定為真實的、明確的。
那么,既然語音進度條的需求那么明顯,微信為什么不設計這個功能,滿足用戶呢?
二、定位優先,需求未必要滿足
首先,用戶有需求,產品不一定就非得滿足。例如,iPhone用戶有手機和PC自由連通訪問文件的需求,但是蘋果有滿足嗎(用戶仍然必須通過PC上的iTunes來訪問手機文件)?iPhone用戶有藍牙傳輸文件至安卓手機的需求,可是蘋果滿足用戶需求了嗎?不是蘋果沒有這個技術,也不是蘋果不知道用戶的需求,而是因為產品的戰略定位優先于用戶需求。蘋果的戰略是打造封閉的iOS系統,當用戶的需求有違戰略時,只能選擇無視。
回到微信語音進度條,微信的戰略定位是什么?從微信的Slogan“微信,是一種生活方式”中就足以看出,微信希望把自己打造成集溝通、社交、支付、內容、服務于一體的生活平臺,希望成為每個人的生活都離不開的工具。溝通功能對于微信而言并不是全部,只是戰略產品定位中的一個部分,因此是不需要做到功能齊全,盡善盡美的。盡善盡美,反而還模糊了定位。
三、專注生活溝通,給企業微信讓路
況且溝通功能也分為商務溝通和生活溝通。從微信團隊單獨開發了企業微信APP這一點就可以看出,微信APP的定位是生活溝通。目前微信已承載了太多功能和關系,人們既在微信上談工作,又在微信上聊生活。而企業微信APP的存在,就意味著微信團隊的戰略方向是將商務溝通從現在的微信上逐漸剝離出去,讓微信APP回歸生活溝通。
目前企業微信已與個人微信的通訊錄相打通,未來應該會繼續發力推廣。語音進度條這個偏辦公屬性的功能,未來很有可能加在企業微信上,作為差異化功能進行宣傳。個人微信不加語音進度條,其實是在給企業微信的差異化留一條后路。
這也解釋了為什么微信不能傳輸超過100MB的文件,為什么文件保留有時效性,為什么刪除消息聊表也會刪除消息記錄。因為,他們都是辦公功能,而微信的定位是生活溝通。
四、語音進度條其實并沒有想象中高效
許多人覺得有了語音進度條,就可以瞬間拖拉到想要聽的位置,效率奇高。但我覺得其實語音進度條的效率是被高估了的。因為當你想要定位到語音中某個關鍵詞時,你只是大概知道所處的語序,但并不知道具體在哪一秒,所以拖動是不精準的,經常會拖過頭。
因此,拖動進度這個操作一定不是瞬間實現的,而是要包含幾個步驟:
- 操作:按下,拖動/約2秒
- 判斷:拖動后識別所在進度是不是關鍵詞所在位置/約3秒
- 等待:判斷出所在節點在關鍵詞之前,接下來就是等信息出現 / 約2秒
- 重新拖動:如果第一次拖到的節點不對,要重新拉/ 重復前三步驟/約7秒
你看,這套拖動進度的機制其實也沒有想象中那么高效,就算只拖動一次,整個流程也要耗費約7秒。10秒內的語音,其實沒有拖動進度的需求,因為在用戶能夠忍受的耐心闕值之內。Youtube的片頭廣告長5秒,歌曲的前奏長10秒,因此大概可以推算出聽覺的耐心闕值大概在7秒左右。而10-20秒以內的語音,使用拖動進度也許還達不到節省時間的效果。因為拖動進度一套操作下來就需要7秒了,而且還有拖過頭的風險,更耗時。
五、溫度感、簡潔性
除了戰略層面和效率層面,不加入語音進度條也有視覺上的考量和交互邏輯上的考量。加上進度條,在視覺和交互上,則更像是“音頻文件”。使用語音氣泡,則更像是“對講機”。
說得可能有點抽象,拿QQ來舉例子。這是QQ加入語音進度條之前和之后的對比。
其實加入進度條之后,交互邏輯是發生了根本變化的。有進度條的語音條,既有暫停鍵,又有聲紋,還能夠拖動快進。給人的感覺更像是對方發給你了一段聲音文件,是冰冷的,機械的,是可操作的,是功能性的。
有點像WhatsApp里面的錄音,你從視覺上感受一下。
(是不是有點像音頻文件的感覺?)
而微信現有的語音氣泡設計,點開就是對方的一段完整聲音,沒有播放暫停的按鈕,沒有快進的功能,播放時只有一個喇叭的圖標的抖動,這種交互更像是“對講機”。給人的感覺更有溫度,更像是對方發來了一段對話,而不是一份音頻文件。(事實上,微信剛推出時,語音消息功能就稱為“對講機”)
為什么QQ要用音頻文件的交互邏輯,而微信要用“對講機”的交互邏輯呢?
因為QQ面對的是年輕用戶,更注重功能性。而微信有大量的中老年用戶,更注重溝通的溫度感。
另外,不加進度條,界面和功能才能保持簡潔,保持清爽。這也是在照顧到中老年用戶的感受。據說當初微信之所以能從QQ手中圈走一大批中年用戶,靠的就是簡潔易用性。因此堅持這個設計理念對覆蓋全年齡段用戶的微信而言,是重要的。
總結一下,微信不加語音進度條的原因在于
- 保持生活溝通的戰略定位
- 進度條實用性被高估
- 堅持溫度感和簡潔性的設計邏輯
本文由 @HotRay 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
評論區大神好多,有點百家爭鳴的感覺??
看了您的分析覺得也對。但是您說的是沒聽清重要的信息內容,這主要應用于工作場景,但是在生活中比如說聽個60秒的語音,聽到一半被別的事情打擾了,還是得重頭聽,也挺煩躁的。要是不聽完就不好回復對方。只加暫停鍵不要進度條?是不是符合您所說的這兩條呢?(1.保持生活溝通的戰略定位 2.進度條實用性被高估)
這個問題親身體驗,也想了好久,還望回復。嘿嘿
不予茍同。
a. 場景方面,我個人使用就是純生活,但是就是純粹生活社交時候,發生了誤操作斷了需要重聽,對方某幾秒我沒聽清需要重聽等。我覺得得不出,進度槽適用于工作等場景更多的結論
b. 高效性方面,點擊-拖動等消耗時間的性價比和語音長度有關,如果有落差,自然就有了性價比。況且,即使消耗時間一樣,但是從心里體驗和交互的角度來看,用戶能感受到的是自己決定的聽取的時間,即使沒能節約時間,但是心里滿足
第一點認同你的想法,所以對答主總結的需求場景不是很認同;但是第二點,首先考慮用戶拖動進度條的場景,語音信息占用頁面面積小,用戶單用手指進行進度控制是非常不精確的,難以找到自己真正想要聽見的內容;同時考慮到拖動進度條需要及時向用戶反饋當前進度的語音,實時性要求比較高,這對一些低質量的手機機型而言是個挑戰。所以即便用戶能夠有效掌控自己的聽取時間提高滿足感,但是很有可能造成部分用戶使用體驗不佳。微信作為一款覆蓋各年齡段用戶的國民級app,這樣的結果顯然是不合適的。
分析的很好??
閾值,不是闕值吧?
3不是很認同,更大的可能是測試時候發現弊大于利,1是60s這種長時間的語音應用場景和頻率極低,能用語音轉文字已經能很大部分解決這類問題,包括打斷重聽也解決了;2.微信是即時通訊,并不是辦公軟件,短語音才是溝通的方式,短語音還要重聽一一遍或者轉文字怎么看效益都比拉進度條高,;當然隨著微信越來越辦公化,長語音的應用場景和頻率更高的話,也有可能會重新考慮進度條的問題。
好吧…不知道為啥大家都覺得文字轉語音是為了解決“重聽語音關鍵詞”的需求。我覺得文字轉語音只是為了覆蓋“用戶不方便聽,只方便看”的場景,例如開會、圖書館、例如在電腦上操作。
文字轉語音是不能解決重聽需求的,因為你重聽是因為語音中的某些關鍵詞模糊不清。你人耳都聽不出來,人腦都分辨不了,怎么盼望機器能順利轉出來呢?
關于這點我也覺得語音轉文字大部分使用場景是我不想聽這段語音,或者不想聽對方的聲音,以及可能現在確實不方便聽。至于如果語音聽不清楚的,有時候轉文字確實也不見得能識別精準!
其實我覺得吧,分析都很有道理,但是更重要的是,像IOS系統和微信這種壟斷性的東西,他就是有資格無視你一些所謂與戰略目標相左的用戶需求。但凡你市場上有能分庭抗禮的競品,你看他會不會屁顛屁顛的聽用戶的?事實上,很多人正是因為IOS系統不能傳文件,而跳去了安卓陣營,然而IOS一枝獨秀的諸多優點,也在源源不斷地吸引一眾安卓用戶,所以蘋果不需要改這個,因為他有別的優點來維持自己的市場。而微信就更猛了,市場上一個能打的都沒有,他就算做成一坨翔,咱們還是得吃;平心而論微信的功能復雜嗎?實現難度大嗎?答案肯定是否定的。國外聊天至少還有Massager,Whatsup等相互競爭督促進步,國內呢,微信就是埋頭做,什么用戶需求啊都與我無關,反正怎么做,用戶也走不掉的
我覺得對也不對。微信不做進度條并不是因為無論做不做用戶都得用。不然你看為什么微信團隊投入了資源開發了內測版本?
如果真的不在乎需求,連內測版本都不會做出來。
我的意思是,微信肯定是在乎用戶需求的,但是相比于競品多的產品,他們沒有那么在乎用戶的需求,而是會把中心偏向他們自己的戰略定位上。因為他們有自信,就算用戶對某些細節不爽,也是絕對不會跳槽去用別的產品的。
這個道理,我感覺就類似上邊蘋果的那些問題一樣,人家蘋果也是自信,就算你對某些不滿,也不會轉用安卓,當然不用蘋果的你再好他們也不見得去使用!
分析很牽強,越講越玄學,沒有必要因為是微信就一通強行分析。個人認為原因很簡單:語音轉文字,解決98%以上的重聽需求。
不是玄學,是價值觀。微信在模擬真實世界,對方刪了你好友你不會知道,你好友列表還有他。對方和你說過的話你也不可能從中間再聽一遍,這就是生活方式,不是玄學。
語音轉文字的使用場景針對的也是不方便聽語音的情況,60s的語音轉文字也不快,加上口音,有時候不如重聽。你這個98%是一線城市領導都是211畢業普通話二甲以上的數據。
不是得出答案了嘛?微信消息的價值觀:每一條消息,你都值得認真對待!
需要重聽的,都是因為你在語音中有關鍵字聽不清。既然你人工都聽不清,怎么能保證語音轉文字功能能夠順利轉出來?
不要讓用戶去適應你開發的功能,要開發客戶需要的功能.
人比機器強的地方就是人是智能的,能獨立思考的.
比如研表究明,漢字序順并不定一影閱響讀!事證實明了當你看這完句話之后才發字現都亂是的.
這句話人腦可以識別出來是什么意思,機器就不一定了.
機器識別語音不全的時候,要開放人工識別去兜底.一句機器識別不了就覺得人也識別不了就完事了?
贊同,第一反應是轉文字
聽不清轉文字也不會轉正確!
我是從運營(迫切性),產品(必要性),技術(可行性),公司(戰略性)四個層面考慮這個問題。
運營:需要數據支撐,如使用長語音的用戶占比,被重復聽的長語音占比等,來判斷是否需求具備迫切性。
產品:與語音轉文字功能重復,進度條可用性不強,影響美觀,語音進度條反復拖反而影響用戶體驗等。
技術:可能有技術瓶頸功能難以實現,帶寬資源不足等。
公司:產品的定位,功能的投入產出比,與其他產品核心功能沖突等。
以上是我個人的一點思考,與筆者有很多共鳴之處。筆者說的“溫度”這個點是我沒考慮過卻觸動我的一個點。所以留下文字,歡迎一起交流!
所以產品不僅要從數據層面說話,也要明白人性的需求。
嗯嗯,很棒。關于技術上,我覺得肯定是能實現的吧。QQ都能這樣做,微信這么龐大的資源為什么不行?
哈哈 關于溫度這一點確實我也認為有點牽強,也許有點道理,但好像只是一小丟丟因素。無關輕重的那種!
這樣,我們不考慮要不要加。而考慮加了會怎樣?第一微信有時長限制,這個時長要做進度條拉動,我想想都煩,還容易誤觸,還不如想辦法提升文字轉化能力,技術都是從不成熟到成熟,這個階段也是習慣的養成,第二,加了之后用戶還還會不會認認真真的去撿重點來說,朋友沒聽懂,我說哪你沒聽懂,我說37秒那,然后你說等我去聽聽,就60S,出現了很多不可思議的事情和場景出來,還有沒想到的,估計微信測試的也不少了,說白了直覺判斷加了弊大于利
關于你說的文字轉化功能,我覺得解決不了重聽語音的需求。因為重聽語音本身就是因為關鍵字聽不清楚,有口音或說得太快。既然人耳都聽不清,人腦都分辨不出來,又怎么能盼望語音轉文字能解決呢?
關于你說的第二點,我很贊同。撿重點來聽,會出現很多奇奇怪怪的場景。贊
我看了之前你的解釋,我的意思是60s的情況下,還是少數才那么長的情況下,重聽的成本甚至低于選擇到那個時間,第二,說到中華言語的大博精深,未必要整段都能翻譯清楚才能看動,第三如果在這兩種情況都沒法,那么就直接在問一遍好了。其實都是成本的博弈,翻譯只是一個特定場景的補充,這點我認同,但我覺得他有一天能從低頻走向高頻,這是技術的成長,我覺得這很正常。
其實我覺得快進比進度條更實用,對于60S的語音而言實用性很差,而且有對應的轉文字的功能(就現在的轉譯正確率來說真的很可觀了),再者微信的整體方向在那里,手Q對于騰訊而言很多時候都是微信的試金石,從目前來看,我敢肯定使用的人肯定不多的,所以基于幾點考慮,沒有做這個也屬于正常
文字轉化功能,我覺得解決不了重聽語音的需求。因為重聽語音本身就是因為關鍵字聽不清楚,有口音或說得太快。既然人耳都聽不清,人腦都分辨不出來,又怎么能盼望語音轉文字能解決呢?
而且,需要重聽確認的都是重要的信息,比如領導讓你去某某大廈拿文件。你能放心只看語音轉文字就執行任務?我個人而言,只要是重要信息,我肯定會親自聽語音來確認內容
聽是復查,其實我只是想說進度條的方式處理得并不高效,其實可以用文字加語音的方式用來直接做確認,因為文字可以很好的幫你定位到你想聽的那一段在哪,需求就二條,快速找到關鍵信息,可以反復確認
我也覺得1、3有些飄渺,2說的挺好的
之前網上有個人說的蠻不錯的
“如果加入語音進度條發送超長語音的人可能會更多”
如果這個假設是合理的,微信更像是做了個在方便性(進度條)和鼓勵性(網友猜測)中做了個折中,選擇了60s
如果微信當時沒有紅包功能,鬼都不是 ??
1保持生活溝通的戰略定位
2進度條實用性被高估
3堅持溫度感和簡潔性的設計邏輯
這3條我只認可第2條,13條過于縹緲。
微信有語音轉文字,甚至做了方言版的轉文字,這個功能不香么?為啥非要去做聲音進度條?
而且技術上來考慮,用戶在沒打開過聲音的情況下,直接去聽中間部分,會有讀取下載的時間,影響了體驗。
既然你要重聽語音,肯定是有些關鍵詞說得口音太重,太快,模糊不清。對于人肉都聽不清楚的語音,我覺得語音轉文字也是轉不成功的。
讀取下載時間,這一點提的蠻好。
機器識別不了的方言,非得等你做出來能識別的時候再用么?
期間就不能讓人自己識別?說句難聽的話就是沒有衛生紙還不拉屎了?
文字識別是一種場景,還有一種是被其他事項打斷聽語音或者聽的時候走神.