老羅的TNT工作站,到底前景如何?
只要語音交互會成功,那TNT是一定會來的。
2018年5月15日老羅發布了一款TNT(Touch And Talk)的工作站,然后每隔一段就有消息爆出,比如:
改變世界的TNT終于被你們笑話死了。
拋開具體某個案例,這類產品的未來究竟會如何?
蓋茨的感嘆
蓋茨先生8/17在領英上推薦了一本書,同時寫下了這樣的一段文字:
In the early days of Microsoft, I felt like I was explaining something completely foreign to people when I would talk about our business plan. They didn’t understand how a company built entirely around software could be profitable.
(在微軟的早期階段,當談到商業計劃時,我感覺自己一直在向人解釋特別陌生的東西。人們不理解為什么一個完全基于軟件的公司可以盈利。)
蓋茨先生說的這類事情一直重復發生,在互聯網早期(2000年前后)其實我們也不理解基于一種免費的產品如何構建商業模式。
每種創新模式之所以難以理解核心在于其往往要依賴于幾個大膽假設,而這些大膽假設本身非常難以求證真偽,從正反兩個方面都可以獲得無數的證據,然后基于這些假設又要做推理,最終才是結論。
這樣的一個過程,不是單純的生意機會,所以明白不難,但認同會比較困難。
我們可以比較下羅老師的TNT工作站和長租公寓:
長租公寓的理解方式可以是:北京有1000萬外來人口,總計需要租房800萬間,市場總共有的房間是500套,所以這是一個供不應求的市場。因此只要能把握房源,建立品牌,那盈利比較確定。(房屋數字和盈利數字都可以進一步精確化和測算,當前數字是我隨便寫的)這樣一來從商業機會的角度看就非常明顯,即容易明白也容易認同。
相比之下,TNT工作站上理解起來就繁雜很多,要理解TNT工作站需要的是:人們需要更便利的交互方式,當前語音技術已經成熟到這個地步,只要加上良好的設計,那就提供更好的體驗。所有這些需要一款新的硬件做載體,因此需要這款產品。
后者麻煩的是,需要的判斷點特別多:需要理解技術的成熟度,需要知道設計本身可以帶來的價值,需要知道有多少人愿意為此買單。但真具有顛覆性的其實是后者,前者只不過是風險不同的各種生意。至少從這個點來看,老羅是值得尊敬的,他在做一些真正有創造性的東西。
說到底還是語音交互
拋開具體某款產品不論,TNT工作站這類產品究竟成立與否最終取決于語音交互落地的深度。
當前的形態(各種音箱上的播歌、控制外設等)可以看成是語音交互的初級階段,也可以看成是第一個支點,隨著應用的深化,那各種深度應用形態必然會不斷出現。(電腦的第一個支點是用來計算的,然后經過字處理、游戲、上網等階段后,最后已經是一種無所不能的通用設備。)
眼下看語音交互的發展從層次上看至少要經歷兩個階段:
第一個階段就是現在Echo所展示的。通過語音來做播放控制,播放的內容可以是音樂、FM、兒歌、天氣、路況等。具體的產品形態可以是音箱(有屏+無屏)、故事機、鬧鐘、電視、盒子、游戲玩具、智能燈等。
第二個階段則是應用深化的階段,這在Echo上也有一定苗頭,比如購物會被整合到語音交互里來。如果語音交互真的可以用于購物,那為什么不可以用于辦公,為什么不可以用于IM等。只要產品基數夠,那每種嘗試就都足以收集自己的反饋,然后迭代發展。這個時候產品的形態反倒是會收斂,越重的應用越需要比較強大的硬件做支撐。而所有現在的嘗試里面,最有可能成為這種通用型產品的基礎的還是智能音箱,智能音箱天生就不是音箱而是一款智能通用設備的基礎。
如果第二個階段全面展開,那設備會分為淺層應用設備和深層應用設備。比如電燈,那需要的還是1-3輪對話來做基本的控制,這就是淺層應用設備。但帶屏的音箱等承載的應用就會非常復雜,電腦上的很多事都需要重做一遍(老羅所看到的機會)。
這時候的智能音箱也會進一步分化,從價格上也可以看出這種劃分?,F在的智能音箱上,巨頭往往主打便宜以啟動市場。但下面則會分化,比如有的人可能會考慮集成NAS的功能,有的人可能會考慮集成路由器的功能等。
最終設備的銷量也會因為這種應用深度的不同而不同:
- 在淺層應用階段,智能音箱的銷量可能更像傳統的音箱,每年的上限在3~4千萬臺。
- 在深層應用的階段,智能音箱則可能突破垂直品類的限制,然后逼近電腦的量級,最終超越電腦的量級,達到每人一個的程度(逼近手機的量級,手機很多時候一個人有兩個)。
有意思的事情是,很多時候大家把眼下的銷量看成是判斷語音交互發展的根據,其實這是有問題的。當前的銷量只是語音交互發展的結果,而語音交互成立與否只與這種交互是否真的便利有關。銷量和使用頻次只與應用的深度和體驗有關。
當前行業的真正瓶頸
當前語音交互在技術上并沒有瓶頸,但在落地上有。
沒技術瓶頸說的是NLP上顯然的限制并不是語音交互的真實瓶頸。我們絕大多數的操作其實可以在三輪交互以內完成,這在當前技術水平所能支持的范圍以內。實際的應用場景上也不真的需要一個開放的無所不能的語音助理(電影里演的那樣)。
不管是從數據還是使用習慣來看,也不存在語音交互習慣不成立的問題,當前落地的真正瓶頸其實是“內容”太少和落地太麻煩。
人們主要的時間其實是被手機占據著,而語音交互設備能做的事太少,只能局限在播放音樂等幾個領域。這時候就特別需要“內容”的出現。這里的內容不單是指“影視”“音樂”的進一步加多,也包含羅老師想挑戰的TNT,包含視頻通話,包含對其它設備的控制等。
從這個角度看,語音交互的第一個戰場就是家里。對決的兩方是:在家里隨著應用的深化語音交互設備PK手機,兩者搶奪家里的用戶時間。
落地太麻煩則是個純粹技術問題,當前打造一款語音設備產品的周期太長,通常要6個月以上。主要問題還不是經常說的NLP甚至ASR,核心在于和聲音相關的部分。不同硬件有不同結構,有不同的聲學特征,需要不同的麥克風陣列,所有這些問題都可以解決,但往往會拉長周期。這時候需要的是Android一樣的系統,當年那么多手機廠商存在,核心的一個原因就是Android這樣的系統拉低了打造一款手機的門檻。
當一個真的屬于語音交互的Android出現后,那這個行業的發展速度可以進一步加快,產品的品類也會進一步加多。
小結
只要語音交互會成功,那TNT是一定會來的。即使不是馬上,本質上也為時不遠。
#專欄作家#
琢磨事,微信公眾號:琢磨事,人人都是產品經理專欄作家。聲智科技副總裁。著有《終極復制:人工智能將如何推動社會巨變》、《完美軟件開發:方法與邏輯》、《互聯網+時代的7個引爆點》等書。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來源于網絡
tnt如果是定位在工作站的話,語音交互對工作效率的提升并不明顯,因為大部分的工作都是嚴謹的,更多是書面上的東西,口語并不嚴謹。未來一定會有大幅度提升工作效率的方法,但不會是通過語音交互。tnt要是能往娛樂游戲方向發展的話,還是比較有搞頭的