尋找下個獨角獸:深度解析AI創(chuàng)業(yè)的三種模式
產(chǎn)品系,從軟到硬以及從硬到軟,這篇文章將探討這三種模式的優(yōu)劣。
這次A.I.浪潮看著眼花繚亂但實際上只有四個可能的落地方向:
- 語音、語義的突破導致語音交互最終真的成為可能;
- 計算機視覺的突破導致AR這樣的混合了現(xiàn)實空間和虛擬空間的顯示方式;
- 計算機視覺的突破讓自動化得以升級,出現(xiàn)自動駕駛汽車、機器人這樣的高度自動化產(chǎn)品;
- 機器學習提供了新的數(shù)據(jù)處理方式。
前三種的創(chuàng)業(yè)模式又可以分為:產(chǎn)品系,從軟到硬以及從硬到軟。這篇文章探討這三種模式的優(yōu)劣。
產(chǎn)品系
我們耳熟能詳?shù)娜斯ぶ悄軇?chuàng)業(yè)公司基本上是產(chǎn)品系,比如國內的出門問問、Rokid機器人,國外的Jibo、Savioke、Knightscope、Meta等。這類創(chuàng)業(yè)公司的根本特征是嘗試借用人工智能上的技術突破,打造具有新奇體驗的新產(chǎn)品(帶語音交互或者AR等),并跑出漂亮的銷售曲線。
那什么是漂亮的銷售曲線?它大概會像下面這樣:
漂亮的銷售曲線意味著新產(chǎn)品的市場一旦啟動,那在之后的三年里,銷售曲線是倍增(可能高于2倍)的,而不是每年增加百分之十這類緩慢遞增。
反過來講這意味著這些創(chuàng)業(yè)公司的決勝期實際上只有三年。不管你之前做了多少,一旦你錯過這三年,那所有努力工作可能就變得沒有價值。
那多久市場才會從早期市場變得真的啟動呢?這沒人知道,趨勢是可以用邏輯推演判斷的,但具體的啟動時間點其實都是瞎猜??赡苁?年,也可能是2年,甚至5年,10年。
這樣一來所有產(chǎn)品系的ai創(chuàng)業(yè)者們要把握的關鍵點就只有兩個:
- 在一個不可清晰預測長度的預熱期做好充足的準備,包括產(chǎn)品、銷售渠道、生產(chǎn)制造能力等。
- 一旦市場啟動,那跑出上面那種銷售曲線。
如果第一點沒做好,那就是老羅和他的錘子科技,如果第二點沒做好那其實會像某些大企業(yè),比如摩托羅拉,什么都不缺但就是干不成事。如果兩點都做好了那就必是新的獨角獸企業(yè)。
這里必須強調的是達成上述兩個目標時真正重要的是產(chǎn)品體驗而不是技術的先進性,也就是說這種模式更需要喬布斯這樣能用好技術的人而不是謝爾蓋布林這樣能創(chuàng)造技術的人。
哪怕所有技術都是別人的,但只要不影響用戶體驗,那其實關聯(lián)不大,但實際上由于這一代AI的創(chuàng)業(yè)者都非常聰明和野心勃勃,他們都不想純粹的變成組裝型企業(yè),所以這類創(chuàng)業(yè)公司通常會在初期就嘗試卡住技術上的某幾個關鍵點,比如ASR等。這里面比較極致的是出門問問,根據(jù)各種信息來看,出門問問全線打造了自己的ASR、NLU甚至搜索。
這就導致產(chǎn)品系創(chuàng)業(yè)很像爬珠穆朗瑪峰的北坡,成了必是一番大事業(yè),但成功非常艱難。高風險來自于這樣兩個方面:
1、預熱期的時長高度不可預測。
拋開AI不論,到現(xiàn)在為止這個模式下里國內比較成功的一家企業(yè)是大疆。大疆的銷售開始起飛大約是2013年(暫時沒有官方數(shù)據(jù),只有Dronelife的猜測數(shù)據(jù))。
那大疆哪一年成立的呢?2006年,也就是說大疆等待產(chǎn)品起飛等待了差不多7年。
2、成本因想卡住關鍵技術點而大幅增加。
前面提到過,新一批創(chuàng)業(yè)者們通常并不想自己成為單純的組裝和銷售公司,所以會在早期就把握住幾個關鍵的技術點。這對產(chǎn)品起量后企業(yè)發(fā)展有利,沒有這些點上的控制權即使成了也可能變成現(xiàn)在的某類PC和手機企業(yè)。
這未必不對,畢竟亞馬遜為了做Echo也收購了三家公司完整搭建自己的技術體系,但無疑,這對創(chuàng)業(yè)公司而言會顯著增加成本和風險,會導致企業(yè)長期處在收入沒著落但支出比較高的狀態(tài)。
從硬到軟
不管從硬到軟還是從軟到硬,說的都是公司本身不做產(chǎn)品、而是為做產(chǎn)品的公司提供服務。從硬到軟說的是公司認為公司優(yōu)勢必須從前端(比如麥克風陣列)開始,延伸到后端(云端)。
從軟到硬則是說公司認為云是智能的核心,前端優(yōu)先級較低。當然我們可以講最好兩端都強,但創(chuàng)業(yè)公司由于資源、創(chuàng)始人背景限制通常只能先強調某一部分。這兩種模式又可以分別落在語音交互與計算機視覺上,但由于很難雜在一起說的清楚,所以下面會拿語音交互這個方向做例子先把這兩種模式說清楚,最后再總的分析下這兩種模式。
國內語音交互人工智能創(chuàng)業(yè)公司里走從硬到軟賽道的公司還比較稀少,最典型的應該是聲智科技(這公司是我Portfolio公司,所以比較了解),聲智科技是從最底層的聲學陣列開始,先做噪聲抑制、混響消除、回聲抵消等,反過來再考慮上面的ASR等,與云知聲等的道路正相反。
這種模式的好處是可以站到產(chǎn)業(yè)鏈的最前端,容易落地,是數(shù)據(jù)的必經(jīng)之路。而數(shù)據(jù)本身是未來ASR甚至NLU的核心驅動力,所以后勁比較足。
壞處是短期需要用硬件獲取客戶,并且需要組織硬件的生產(chǎn),需要較多的啟動資金。
可以講產(chǎn)品系創(chuàng)業(yè)公司的成功事實上有兩個外部要求:一是趨勢要來,其次是產(chǎn)品要經(jīng)得起市場檢驗。從硬到軟的公司也有兩個外部要求,一是趨勢要來,二是要技術過硬,有價格優(yōu)勢。2B的公司所面臨的客戶通常非常理性,很多花哨營銷反倒是作用不大。
從軟到硬
語音交互上從軟到硬比較典型的創(chuàng)業(yè)企業(yè)則是云知聲,這種模式選擇和公司定位甚至從名字上就可以看得出來。
從軟到硬的好處是更容易覆蓋已有的成熟計算平臺,比如所有的 App 都需要一個自己的Siri,那云知聲這樣的企業(yè)只要做好技術壁壘,等著攜程、今日頭條上門就行了。這個方向上主要的挑戰(zhàn)在于要和大公司(比如百度和訊飛)直接競爭。我們這篇文章主要關注的是新硬件產(chǎn)品上落地,所以這點不再展開。
壞處則是在新硬件產(chǎn)品(Echo、汽車、機器人、AR等)上很難落地,因為為了在新硬件產(chǎn)品上落地,中間必須加入陣列那一層,否則效果會很差。而一旦無法落地,其技術優(yōu)勢就很容易被突破。
語音識別的精度骨子里是數(shù)據(jù)驅動的,但顯然不做陣列等硬件,你沒法落地,沒法落地就沒有數(shù)據(jù),也就很難獲得數(shù)據(jù)、技術、精度、場景上的正反饋,也就不容易解決真實環(huán)境的語音識別精度問題。
云知聲等顯然認識到了這一點,所以也在積極往這一方向擴展。這時候通常會碰到軟件企業(yè)跨界做硬件的一般性問題,比如供應鏈侃價搞不定會導致同樣的產(chǎn)品成本會高個百分之幾十等。?路線差異起源于對計算架構的認知?上面拿語音語義的企業(yè)做了個例子,但事實上在計算機視覺上同樣成立,只不過細節(jié)會有差異,比如Movidus的芯片可能在端上就把圖像識別處理完了,而不需要像麥克風陣列那樣自己處理后再把結果傳到云端。這種模式選擇背后隱含的共通的東西是對計算架構認知和假設。
到現(xiàn)在為止這種假設和認知一共有三種:
- 一種是為保證體驗(速度等)端始終要扮演重要的角色,云用來輔助端完成計算。所有我們用的硬件產(chǎn)品:手機、Pad等基本都是這種模式;
- 一種是計算應該大部分發(fā)生在云上。Google主推的ChromeBook是這種模式,以前銀行里的終端也是這種模式;
- 一種是正在興起的傳感器+Fog computing+云架構。這種可以看成是第一種架構的擴展,比如智能家居里所有的設備都直接連云上計算成本太高,那就不如家里有一個中樞先把能處理的處理了(比如天冷開空調,下雨關窗戶就不傳到云端了),實在不行的再連云。
前兩種架構在現(xiàn)實里經(jīng)常會發(fā)生PK,并且導致很嚴重的后果,下面說兩個例子:
一次PK發(fā)生在PC上,那時候Oracle等嘗試做的Network Computer骨子里的含義就是把各種計算轉移到后端,讓前端就變成輸入輸出設備。這種嘗試顯然失敗的慘不忍睹,但有意思的是20幾年后當PC這個品類足夠成熟后仍然走這條路線的Chromebook卻看到了些成功的曙光;
一次發(fā)生在Native APP和HTML5上,當時Facebook是很希望主推HTML5,那時候扎克伯格想用Web App來打破iOS和Anroid的壟斷,但實際上Facebook差點死在在這個選擇上,因為這選擇幾乎讓它錯過移動互聯(lián)網(wǎng),后續(xù)的Instagram與WhatsApp大額收購很可能與這種錯誤路線的選擇有關。
我個人對此的基本認知是:對于新品類硬件產(chǎn)品剛出現(xiàn)的時候,首先是端要足夠強大,把體驗做到極致,隨著應用、帶寬等的逐步發(fā)展,那端上的計算量可能會轉移到云上,因為那會有成本優(yōu)勢,但這需要一個漫長的過程,PC走了20幾年剛看到這可能性。
如果這是對的,那意味著在新硬件產(chǎn)品上,首先成立的會是從硬到軟的模式,而不是從軟到硬。
AR、自動駕駛等都和前面說的語音交互一樣要先解決終端上的問題,讓產(chǎn)品能夠快速準確的進行實時響應,確保用戶體驗,之后再談其它。也可以換個角度來考慮這問題,在新產(chǎn)品上更可能是先有iPhone才有Android手機,而不是掉過來,因為iPhone給用戶的沖擊更強,更容易樹立起一個新的品類,但iPhone不可能用HTML做出來的。
但確實從硬到軟的模式對創(chuàng)始人提出更復雜的要求,比如聲智科技的陳孝良首先是聲學專家,同時也是語音識別專家所以才會選擇這種從前端開始,結合后端的路線。而云知聲的CTO是計算機科學家,更擅長的是算法,深度學習,所以先天上就會傾向于用數(shù)據(jù)、神經(jīng)網(wǎng)絡算法和大幅增長的計算能力(從云計算到HPC)來解決問題。轉到重視端的這條路上來同時需要跨越思維和技術壁壘,也許不太容易。
小結
下面這兩件事情是高度確定的:
- AI的浪潮來了。
- 一定會有新的硬件產(chǎn)品出現(xiàn)。
所以一定會有新的獨角獸從產(chǎn)品系中誕生。
如果你認為新硬件產(chǎn)品必須端的強大做支持,確保體驗,而新品類的基本出現(xiàn)次序也是先有 iPhone,才有 Android,那很可能你會同意有獨角獸會先從從硬到軟的模式里出現(xiàn)。(我曾經(jīng)和很多人講過這些觀點,但很巧的是直到最近才碰到一個做投資的美女和我認知非常一致,不會說我是抄襲她觀點吧……)
必須強調的是這篇文章里主要探討的是新的硬件產(chǎn)品下的可能狀態(tài),數(shù)據(jù)分析類不在這篇文章覆蓋范圍內(數(shù)據(jù)分析是純粹的云端計算),主要面向現(xiàn)有平臺(手機、Pad等)的產(chǎn)品或服務也不在這文章覆蓋的范圍內。
作者:李智勇,十年棧道程序員。
來源:http://www.leiphone.com/news/201611/ZxvhAqWP8cOqBs5U.html
本文來源于人人都是產(chǎn)品經(jīng)理合作媒體@雷鋒網(wǎng),作者@李智勇
- 目前還沒評論,等你發(fā)揮!