NLP方法論(1):如何尋找語音交互的業務場景?

5 評論 4889 瀏覽 37 收藏 23 分鐘

如何尋找語音交互的業務場景?作者從自己實際工作實踐出發,總結分享了相關經驗。希望能夠在你進行語音交互場景設計時,提供一些方向和思路。

這是一個創業者的復盤,主要內容分為兩個部分。

  1. 一個創業者成長的心路歷程——心路日記
  2. 如何尋找語音交互業務場景——干貨思考

繪聲繪色地講故事和枯燥嚴謹地深度思考問題,咱們切換著來,但是最終為標題服務——如何尋找語音交互的業務場景。

一個創業者成長的心路歷程——心路日記(1)

筆者進入AI領域,從事NLP相關的工作,已經超過18個月的時間了。如果算上我們的真9-9-6強度,走過的彎路,做過的那些項目經驗廣度與深度,沒法算。

剛切入AI行業,耳濡目染熟悉了語音交互的優勢和特性,比如:

  • 解放雙手,懶人最愛;
  • 使用門檻低,會普通話就能用;
  • 交互自然,沒有什么學習成本;
  • 一句話就能搞定需求;
  • 如果一句話不行,那就兩句?三句?

彼時外部環境也特別好,彼時各媒體,產業,融資層面的大環境,一片欣欣向榮,此處也不累述了。

從實際的發展趨勢上來看,未來注定是萬物互聯的世界,幾乎任何硬件都可以搭配麥克風、揚聲器和WIFI模塊三件套,且可穿戴智能硬件出貨量特別大……語音是最為自然的交互形態,一定會出現在我們生活中,一切都似乎特別美好。

過往18個月,大家定期就會圍坐一個圈,開頭腦風暴會議,思考有哪些場景適合語音交互?從普羅大眾的高頻剛需到特定行業的細分場景,大家輪流發言,想到哪里是哪里,不打斷不評價,每時每刻都在尋找創業場景。

過往18個月,頭腦風暴了上百個想法,推演過程中拍死了幾十個想法,留下幾十個,因為各種原因半途而廢掉十幾個技能,最后留下了十幾個技能,一看后臺數據,有些表現好,有些表現糟糕。

過往18個月,每當有新的語音交互技能被做出來,便迫不及待的在自己的朋友面前吹牛逼,秀產品DEMO,“Hey,這是我新做出來的東西,要不要看看!”

當我在朋友面前如同開發布會一樣的一波嘴炮鋪墊以及熟練操作之后,我非常欣賞且享受對方面部流露出來那種wow的驚奇感,對方興奮的表情停留在我的腦海中至今難忘,以我對朋友的了解,他情商一般般且沒有討好我的必要且并不是表演專業且無需做出照顧我心情的表現,由此我推斷這是一個真實的表情流露,朋友的這種表現像雞血一樣刺激我又回到辦公室瘋狂努力加班。

心中想著,“尼瑪創業就是要比快,哥們要趕快做出來,顛覆!革命!劃時代!改變世界!讓我們為夢想窒息!”

有的時候我在想,是不是自己的銷售能力比較強,就我那個朋友給我的表現來看,我開發布會在演示產品環節的部分一定給力,差不離也有錘子科技發布會的那種wow,!再來一遍!理解萬歲!的效果。

當技能上線后,一看數據,相當多的技能用戶嘗鮮完畢后,就擱置在那里,就是無法形成使用習慣,甚為不解的我,自然是開展了用戶面對面的訪談調研工作,拿到的反饋是,這個剛開始確實是感覺挺新鮮,有點意思,但是后續我就是忘記使用了。

熟悉不?嘗鮮型體驗,還是根本就是個僅能打動自己的偽需求?

心中的疑惑,由“做什么技能”改成了“為什么我們做出的技能,演示的時候挺有意思,但是后續用戶不會用?”

單單用“用戶習慣難以改變,很多人接受不了新的東西”來為自己開脫,恐怕太偷懶。

過往18個月,筆者面對投資人科普、演示、教學、展望如果給我什么什么條件那么我們就極其有機會做到怎樣怎樣可謂經驗豐富,附帶各種銷售話術,投資人也會在我的話術套路下,流露出我前面朋友一樣wow的驚奇感興奮感,只求對方能夠給我們投錢擴張,不著急投錢等等看的話能連接一些合作資源也成啊。

給B端客戶演示的時候,效果也差不多,雖然他們比較興奮,我也一度享受,可是時間長了,我也有點疲勞,這些事做久了提升的是自己的銷售能力,對自己的專業精進并沒有太大的用,說得多了自己就會陷入稟賦陷阱,即,手里拿著錘子看什么都是釘子。

現在回顧過往,那些半途而廢的,那些上線后數據不好的,都是財富。即,我能給很快的判斷出:哪些業務場景需要語音交互,哪些業務場景根本就是偽需求。

如何尋找語音交互業務場景——干貨思考(1)

創業自然是從找方向開始,一開始是做產品分析及市場調研。

分析競品功能,分析友商情況,分析各種硬件的出貨量,分析自己的優勢劣勢,分析國內外的各個語音技能有哪些,什么受歡迎,什么技能可以直接帶來錢的回報,或用戶增長等等,分析各個技能的實現方案,我們能做到什么程度,人力、資源投產比……

當然最重要的是,總得確立方向,做出點東西來。

筆者MECE之后,總結歸類,市面上所有的語音交互技能都分為下面四個大類別。

【語音&工具】門檻太低,且幾乎沒什么技術含量。巨頭做了,小公司還跟著做,那是一點機會都沒有。

實際上,我們練手了幾個工具型的技能,有一些交互設計上的微創新,但是微創新沒有用,你會接受投資人那個老套而經典的拷問,如果大廠開始抄你,你怎么辦?且用戶也不會因為工具上的微創新而買單。

【語音&內容】技術含量較低,即搜索、點播、操控行為,本質上拼得是接口資源,用戶根本不在意是使用語音還是點觸找到內容,內容才是核心。

實際上,我們能夠做到更好的數據表現,即用戶怎么說,AI都能理解,但是沒有接口給我們調用,因為沒有播放版權,用戶根本不買賬。

【語音&游戲】本質上也是一種互動性較強的內容,依賴個人天賦,游戲創作能力,添加語音交互的這一新的操控維度,未來擁有比較多的想象空間。

實際上,猜歌詞、成語接龍屬于偽多輪,就算發明出幾種變種模式,抄襲也容易沒有什么壁壘。而語音互動小說,也苦于沒有好劇本創作(這事拼天賦),好聲優太貴成本太高,一直沒怎么投資源,內部屬于試驗品。另外的和傳統手游結合的這里不方便展開講,沒做的原因是資源投入過大,一直未動手。

【語音&服務】才是真正意義上的多輪表現,非內容創業,不過分依賴天賦,容易找到高頻剛需,比較考驗對自然語言處理的理解,擁有一定的技術門檻。

唯有語音連接服務,各種條件考量下來,C端B端G端均有需求,故而成為了我們選擇的方向。敲黑板,劃重點,簡單總結:

【語音&游戲】成本高,依賴稟賦的內容生意,投產比風險較大。

【語音&服務】相對而言,是更為廣闊,落地容易且穩妥的選擇。

所有的單輪都沒太大機會,大廠跟進抄襲太容易。

所有做內容搬運,但交互形式不創新的,都沒機會。

只有多輪,巨頭還沒做到的,跟進較難,才是創業公司的出路所在。

第一輪篩選確定方向后,接下來是第二層篩選,選擇哪個細分領域。

一個創業者成長的心路歷程——心路日記(2)

往前推演十幾年,智能手機未普及的時候,大家都是使用鍵盤和鼠標尋求服務。移動互聯網的從興起到如今,人類目前高頻剛需幾乎已經被各個APP占用了,他們共同的交互方式是點觸的形式。而在未來,語音交互由于其特性,一定存在一席之地。

有相當一段時間里,心中也是抱著,使用新的語音交互體驗方式,去顛覆一切舊的用戶行為的心態。

至今自己做什么事,或者觀察其他人做什么事,也在琢磨,能不能讓語音發揮作用,這種習慣保持至今。

過往我們走了太多的彎路,現在看起來很愚蠢的討論,這些方案點子試錯,曾經花費了我們太多的時間,而這些東西如今在我看來,幾乎很快就能通過知識框架推演出有無機會,實現難度幾何。

幾乎每個行業的從業者都會為自己的領域找到價值,而每個從業者都能隨隨便便列舉各種語音交互的優勢,但是光認知優勢沒有用,明白局限才是我們的篩選漏斗,否則即使你做出來,局限處理不好,用戶也不會買單。

在某些大會上,某些路演上,看著臺上的人舉例子說語音交互的場景。

我早上出門比較著急,一邊收拾小孩手忙腳亂的,這個時候我可以用語音叫個車。

我一邊開車,想到公司就能喝到熱咖啡,這個時候我可以用語音搞定。

剛剛下飛機,雙手拎著東西,想通過語音發微信,打電話。

這種例子,完全是基于自己的角度,先把自己置入一個困境強行制造需求,然后提供解決方案。上述的三個業務場景真要抬杠,太容易了,但沒必要。

解決方案是好,但是用戶一定會用么?進入了困境用戶會想起這種解決方案么?習慣如何培養?想要成為一個內行,不光是要看優勢,還要理解局限,才能夠運用自如,而不是一味強求使用語音解決。

擱在以前的我們,只能提煉出“臥室、客廳、車內”這三種場景,提煉出“雙手被占用”,因為行業就是這樣做的,且如此提供服務的。這種不夠抽象,且無法體現出提煉語音交互關鍵點的描述,只會固化我們的思維。

我們應該了解語音交互的特性后去篩選適合的業務場景,而不是先制造困境場景然后尋找語音解決。

如何尋找語音交互業務場景——干貨思考(2)

下面是我總結出來的語音交互對比圖形界面交互的優勢和缺陷。

其中白色塊是特點,綠色塊是優勢,灰色塊是缺陷。

且,理解缺陷非常非常非常重要!他能幫助你避開無數業務設計大坑。

有興趣的,可以看我的另外一篇文章《一篇文章深入理解VUI和GUI的優劣對比》我會把鏈接放在文末。

結合語音交互的優勢和缺陷,下圖是我提供的一個業務場景篩選漏斗。

基于上述,我們可以得出的使用場景有:臥室、客廳、廚房、衛生間、車內、私人辦公室、滑雪場、隧道內、病床上……

然后是具體場景最常用做什么事情,語音交互能夠帶來更好的方案。而不是具體的場景強行做某事?;诖诉M行發散。(臥室、客廳、車載不列舉了,沒啥意思)

  • 跑步的時候,騎車的時候,想切歌,接或者打電話。
  • 廚房里面有點播做菜視頻,買廚房用品的需求。
  • 醫院的衛生間和病床上,病人移動不便,使用語音交互是沒有壓力的。
  • 滑雪場上穿著滑雪服,相當多時候需要用到通訊設備進行交流。
  • 光線不好的隧道內,甚至是地下管道,穿著工作服,使用手機不方便時。
  • 快遞/外賣小哥,騎車和送貨,雙手經常被占用,公共場合使用語音無壓力。

這樣類似的場景完全符合上面的篩選漏斗里面提煉的條件。

而不僅僅是大家一窩蜂做的“臥室、客廳、車內”。

具體容易固化思維;抽象易于發散思考。希望各位讀者能夠明白其價值。

用戶使用語音的前提。一個是不得不,一個是更便捷。我更希望大家從更便捷的角度去考慮,而不是不得不,所有的不得不,人類都有辦法。

通過第一層場景選擇后,第二層是業務選擇,判斷哪些更合適。

用戶非常熟悉,簡單明確的業務,意味著“閉著眼睛就能搞定”,簡單明確,不需要圖形界面確認。

一句話需求就能夠返回結果,是最爽的語音交互狀態。

決策壓力小,相對標準的服務,意味著很多的默認選項,用戶可接受度較高。

我們來看下面幾個案例

廚房買蔬菜就不太合適,是因為蔬菜是非標品,品類和新鮮程度存在太多的人為主觀接受及條件篩選。但買醬油就可以,最多加一個品牌作為復合查詢條件,并且商品的尺寸大小無所謂,決策壓力較小。很多的人買其他的調料(醋、鹽、雞精等)幾乎也沒什么品牌需求,能用就行。即標準品,用戶接受默認選項。

同理,訂麥當勞/KFC/漢堡王、星巴克/瑞幸,喜茶/奈雪/一點點,甚至是煙和酒等標準品服務就相對容易,因為決策壓力小,品質和服務可控。

同理,出行相關的服務,酒店之間的服務差別實在太大,飛機次之,火車最容易,就相對而言更容易立即呈現結果。

訂機票/酒店的業務還算好,至少流程明確,決策路徑較短,最難搞的就是,用戶不知道自己要什么。用馬爸爸好幾年前的話說“每晚有1700萬人逛淘寶,啥都不買?!?br />

衣服鞋帽或者外賣餐食就屬于典型的用戶需求不明確,一句話雖然能夠搞定結果,但是展示的結果,用戶一定不滿意,除非你拿到用戶的個人數據,和過往的喜好選擇,那么才可以提升精準度。如果不精準,而用戶使用語音換來換去,效率就非常低了。

在有些事情上,用戶本來就是挑挑揀揀的心態。用《梁寧產品思維30講》的話來說,“大明”用戶明確需求,而“笨笨”用戶不明確,需要逛來逛去,還喜好挑挑揀揀,這種情況,就不太適合使用語音交互。

所以電商是存在語音交互的可能性的,但是要有這個層面的理解,才方便做篩選,否則就會出現尷尬。

同理,出行,金融,教育,醫療,游戲、線下生活服務同樣可以基于此篩選場景。

筆者負責任的說,任何業務都可以有語音交互的解決方案,只是看合適不合適。

綜上,創業公司在選擇業務場景的時候,通過上述條件要素篩選,更容易篩選機會。

階段性完結

筆者基本上已經對得起當初文章標題所述,如何選擇語音交互的業務場景。

首先是,如何做大方向選擇,每個方向都沒錯,但是要結合自身公司的優勢去判斷,就好,比如,喜馬拉雅,做【語音&內容】絕對是自身稟賦。

接下來使用2層篩選清單去選擇做什么場景,基于場景選擇做什么業務。

具體容易固化思維;抽象易于發散思考。做到精準的抽象,又很難,希望各位讀者能夠明白其價值。

場景和業務明確后,也還存在如何交付的過程,畢竟產品設計方案有太多種,只要是從業者就能給出方案,但方案之間也存在優劣好壞。

故后面的命題是:如何通過語音交互革新體驗,提升用戶使用價值。

出于文章定位原因,本文階段性結束。

我們都知道那個著名的公式:用戶價值=(新體驗舊體驗)替換成本。前段時間讀《俞軍產品方法論》時,更是加深了理解。

我們如何釋放AI的能力去革新體驗,盡量提升(新體驗)的價值。同時用戶(替換成本)是什么,如何降低?如何兩頭用力,最大化創造用戶價值?

引用本文開頭提及的:“過往18個月,頭腦風暴了上百個想法,推演過程中拍死了幾十個想法,留下幾十個,因為各種原因半途而廢掉十幾個技能,最后留下了十幾個技能,一看后臺數據,有些表現好,有些表現糟糕?!?/p>

有些技能是再怎么折騰,也還會糟糕的,有些則是通過一些調整,可以使其變得更好。

一個語音技能,能被C端B端G端所認可接受,一定會經過大量的篩選迭代,留存下來的是價值,那些沒留存下來的,推理過程中被拍死的,半途而廢的,數據表現糟糕的技能,經過思考,總結、復盤也會積累財富。

這個財富有一個別名,叫做認知。

認知不夠,就算發現某些場景,也會認為司空見慣理所當然,跟那些被蘋果砸中的果農沒有任何區別。

#相關閱讀#

VUI 與 GUI,不同場景下的優劣對比

#專欄作家#

飯大官人,微信公眾號:fanfan19860403,人人都是產品經理專欄作家?!队螒蜻\營:高手進階之路》作者,不折騰會死星人,擅長游戲&AI的領域。

本文原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 我當前的公司就有點類似于文章中說的狀態:迫切尋求語音技術在商用服務機器人上的使用,導致很多功能都是讓自己處在一個不得不使用語音的窘境后二產生的。殊不知這種情況發生的概率太小。 現在重新看這個文章,實際上自己已經經歷過一次這樣的場景,只不過之前是參與者,現在是主導者。

    來自廣東 回復
  2. 不太明白的一點是
    不得不 就是強痛點 強痛點就有商機 不是這樣嗎?

    來自上海 回復
    1. 作者強調的應該是,不應該臆想一個用戶的困頓場景,然后再拿出語音的解決方案。
      而應該從方案的優勢點出發,去匹配適用的場景。更好用,用戶會主動選擇。
      所謂的不得不,用戶并不一定會想到的是語音解決,還有可能是喊他兒子用手機打車,或放下東西自己點餐等等。
      同樣是一個場景的打車需求,“不得不用“和“語音更好用”的感知。乃天差地別

      來自北京 回復
  3. 非常喜歡作者的文章
    認知深刻,條理性跟邏輯強

    來自廣東 回復
  4. 結構化思考:按類別歸納語音業務場景;
    產品思維:用戶->場景->需求;
    用戶思維:理解用戶、才能理解用戶的需求;

    來自浙江 回復