圖解人工智能創(chuàng)業(yè)公司如何走出創(chuàng)業(yè)迷局
增哥導(dǎo)讀:本文講了做出正確率80%-90%的mvp(最簡化可實行產(chǎn)品),并建立容錯ux使得用戶和機器共同協(xié)作完成任務(wù),以及后期獲取數(shù)據(jù)的方法。獲取數(shù)據(jù)重要的是對用戶有用或者有趣。比如一些語音廠商把核心技術(shù)預(yù)裝到手機廠商(用戶)這是有用,比如微軟小冰這是刷爆微信群這是有趣。人工智能創(chuàng)業(yè)公司圍繞著有用和有趣就能獲取更多的數(shù)據(jù)。
思維迷宮,是一張標(biāo)注了創(chuàng)業(yè)公司在特定時期要做的所有重大決定和權(quán)衡的地圖。 Balaji Srinivasan 在他的“Market Research, Wireframing and Design”中這樣說到: 一個好的創(chuàng)始人可以預(yù)見什么樣的決定會為公司帶來好處,什么樣的決定會導(dǎo)致公司的滅亡;而一個糟糕的創(chuàng)始人只會帶領(lǐng)大家走進一個電影 / 音樂 / 文件共享 /P2P/ 照片分享的迷宮,而對那些有助于撥開迷霧,改變假設(shè)的行業(yè)歷史,競爭對手,曾發(fā)生過的重大事件,現(xiàn)有科技水平缺乏認識。 我認為如果舉一個我感興趣的領(lǐng)域的例子會更加生動:AI 創(chuàng)業(yè)公司。下圖是一幅針對人工智能創(chuàng)業(yè)的迷宮草圖,接下來我會詳細的解釋這張圖。 正確率80%-90%的MVP (Minimum Viable Product,最簡化可實行產(chǎn)品) 在機器學(xué)習(xí)界,有一句老話說“機器學(xué)習(xí)對幾乎任何問題都可以給出很好的部分解答。”對于大多數(shù)問題,要建立出一個 80-90% 情況下都正確的模型并不難。在模型建立之后,隨著時間,金錢,腦力和數(shù)據(jù)的不斷投入,獲得回報的速度卻越來越慢。大概來說,要達到 80% 的正確率只需要幾個月,但是為了獲得最后的 20%,你不得不花上好幾年,甚至永遠達不到(這就是為什么你會在 Watson 和自動駕駛的部分演示中看到極端場景的原因,比如一只狗以閃電般的速度突然跳到車前。演示本身并沒有什么意義,但是你要看到的是,他們是如何應(yīng)對 10%-20% 的邊緣情況的)。 在迷宮的這個階段,你可以選擇 1)試圖把正確率提高到近乎 100%,或者 2)打造一個部分正確但是可用的產(chǎn)品。我把這個過程稱為構(gòu)建“容錯的 UX(user experience, 客戶體驗)”。 建立容錯的UX 關(guān)于用戶體驗的容錯性有一些好的例子,比如 iOS 的自動改正,還有 Google 搜索的“did you mean X?”。你也可以說 Google 搜索本身就是一個容錯的客戶體驗:每次搜索顯示 10 條結(jié)果,而不是直接轉(zhuǎn)到第一條連接,這樣一來即使機器出錯了,用戶也可以手動控制。建立容錯的用戶體驗并不代表投降,但它卻是意味著一套不同的產(chǎn)品需求。(比如說如果你希望人機可以一起工作,那么間隔時間(latency)就變得很重要,它甚至可以影響你的技術(shù)框架)。 然而,如果你打算使精確度達到 100%,你又應(yīng)該怎么做呢?算法是不會幫你拿到那剩下的 10-20% 的,你只能通過更多的數(shù)據(jù)訓(xùn)練你的模型。對于 AI 來說,數(shù)據(jù)是關(guān)鍵,這是因為 1)我們已經(jīng)有了很好的算法和無盡的計算資源,數(shù)據(jù)唯一缺失的一環(huán),2)數(shù)據(jù)又是最關(guān)鍵的一環(huán)。算法對于研究界來說是共享的資源,而公用數(shù)據(jù)集又難以達到很好的效果,好的數(shù)據(jù)集不是私有的,就是還沒出現(xiàn)。 進一步細分領(lǐng)域 哪怕你已經(jīng)處于一個細分領(lǐng)域中,嘗試進一步地細分。即使的的目標(biāo)是建立 X,有時候先打造一個細分領(lǐng)域下的 MVP,實現(xiàn)部分的 X,可能是最終做出 X 的最好方法。我的建議是,在保證用戶的前提下,盡可能的細分你的產(chǎn)品, 因為將來以總可以擴大你的領(lǐng)域。 如何獲取數(shù)據(jù) 方法大致分為兩類:建立自己的數(shù)據(jù)集或者是眾包。 我們可以對比 Google Maps 和 Waze,Google 雇傭了上千人四處繪制道路,建筑和交通;而 Waze 則想出了一個讓數(shù)百萬人為它這么做的方法。如果你要采取 Google 的方法,你需要的巨大資金量是一般小創(chuàng)業(yè)公司無法承受的。 因此,創(chuàng)業(yè)公司要想獲取數(shù)據(jù)只有兩條途徑,公開數(shù)據(jù)集和眾包。 對于前者,最常見的例子就是從大網(wǎng)站,比如像 Wikipedia 這樣的網(wǎng)站上爬數(shù)據(jù)下來。你可以說這和 Google 搜索利用鏈接作為排名信號是一樣的。許多創(chuàng)業(yè)公司都試圖從 Wikipedia 上挖掘數(shù)據(jù),但是據(jù)我所知并不成功。 對于創(chuàng)業(yè)公司來說更可行的方法可能是眾包采集數(shù)據(jù)。這就歸結(jié)為如何設(shè)計服務(wù)才能激勵用戶,將數(shù)據(jù)傳回,完善系統(tǒng)。設(shè)計眾包產(chǎn)品自己本身就是一個課題(因此這個迷宮也指向了自己,是一個嵌套迷宮),但是我可以說一個可行的方法,使我們?nèi)ツ晖顿Y的一家叫 Wit.ai 采用的。Wit 的想法是為開發(fā)者提供語音轉(zhuǎn)文字和自然語言處理的服務(wù)。他們的 v1.0 系統(tǒng)正確率并不高,但是他們還提供了 dashboard 和 API 可供開發(fā)者更改錯誤。對于那些使用免費版服務(wù)的開發(fā)者們,他們提供的訓(xùn)練使得整個系統(tǒng)更加完善。隨后他們被 Facebook 收購,已經(jīng)成為這家大公司的一部分,但是他們使用的方法很巧妙并且可以為創(chuàng)業(yè)公司們借鑒。 這只是我對 AI 創(chuàng)業(yè)公司思維迷宮看法的一張草圖,必需提醒大家 1)我也有可能犯錯或者是忽略了一些重要的過程,你可以把這張草圖作為討論依據(jù),但是不要把它看成信條 2)就像 Balaji 說的,新科技的發(fā)展可以撥開迷霧,改變假設(shè)。尤其是看看那些新的基礎(chǔ)技術(shù)(互聯(lián)網(wǎng),智能手機,云計算,比特幣等),他們可以在很多行業(yè)開辟新徑,即使我們最初并不覺得他們有關(guān)系。 作者:Chris Dixon;轉(zhuǎn)載自:36氪
- 目前還沒評論,等你發(fā)揮!