你見過的很多可能都是假的人工智能

1 評論 9996 瀏覽 15 收藏 8 分鐘

這篇文章來自我在哈爾濱工業大學的學弟、機器學習從業者Jiasheng Tang。希望能跟大家科普一些關于人工智能創業的常識。

內容起源于一次小范圍的對話:作為投資公司負責投資/調研人工智能相關企業/市場的人,如何判斷什么樣的企業值得投資?人工智能在當下是很熱,無數的科技公司都會強調自己是一家基于智能的公司。口若懸河、濤濤不絕地談起我們使用了人工智能技術balabala……所以我想談談如何在這樣的對話甚至新聞稿中識別相關內容的可靠性。

首先,眼下任何公司談論人工智能的基礎是大數據 + 算法,先有大數據計算能力最重要

隨著存儲成本的逐步降低,對于很多公司來講,無論是采購硬盤還是購買云存儲服務,獲取并保存海量數據并不是特別困難的一件事?,F在聲稱做人工智能的公司,也一定會強調他們有大數據的積累。擁有大量數據在近些年已經是一件開始常態化的事情,真正的問題是如何把數據用起來。那么基于這個假設,就可以一步一步地追問下去:

  1. 你們數據量到底有多大?每日產出多少個T的數據?線上都有會收集哪類日志?
  2. 有幾個的集群去處理、最大的集群有多少臺機器?
  3. 上線之后,使得哪些業務有提升?
  4. 一個常規的流程(從數據采集到新模型上線)能做到t+幾?
  5. ?……

以上問題大概就能了解這個公司在數據收集和數據計算上的能力,沒有相關處理能力的公司/團隊可以在這一輪就再見了。

因為這個只是錢的問題。

其次,建立在基礎的數據處理能力之上的,是算法

很多公司就到這一步開始平庸(僅僅能對數據做簡單的分析),這也給了大家一個印象:國內的公司數據水平只停留在數據分析(甚至不如)。

如果說計算能力還可以用錢堆到一個還不錯的規模,那么算法能力,就完全要靠人。 深入地做數據分析以至于應用相關的人工智能技術(或者幾乎可以替換地叫機器學習技術),是具備一定的門檻的。僅僅是以呈現報表、統計相關指標更多的是一種業務能力的體現。針對于公司的算法能力,可以問如下的問題(還是遞進順序):

  1. 如何根據分析的結果進行建模?
  2. 如何使用算法去解決問題?(這個問題有點太專業了…
  3. 有能力在線上服務中使用非常復雜的算法么?(線上服務中能夠使用多復雜的算法?)
  4. ……

對于在這一步開始扯人工智能、神經網絡、深度學習等術語試圖“群魔亂舞”的時候,首先,保持警惕,堅持問出以上幾個問題;更進一步,如果有開始大談奇點論的問題的話,那就可以轉身走人了。

還有一點是屬于業務層面的事情:是否有使用機器學習算法的必要性。對于創業公司,這一點要格外注意。大公司往往有這個能力甚至閑心讓人工智能處處使用AI everywhere)。然而對于創業公司,衡量人力物力投入、產出、開發周期、效果、甚至業務底線是很關鍵的。如果一家仍在創業期的公司開始考慮讓非必要業務強行使用機器學習,是很危險的信號;機器學習應用在創業公司的第一目的應該是:讓主業務(比如對投資人負責的業務)保持增長。

所以我一直持有一個觀點:排除廣告、圖像、語音類業務之外,只有相對成熟的公司才具備條件(包括充足的人力、良好的數據積累、計算能力、業務規模足夠等)盤點自己的各項業務,尋找依靠算法的可行提升點。人工智能應該是規劃,不是追求熱點。

最后,算法之上的,是優化

這個有點涉及到問題的本質:我們為什么談任何公司都要擁抱、或者說規劃智能?其實這還真的不全是因為要忽悠(笑

所謂擁抱智能其實歸根結底是一個更好的解決方案:用一類技術為公司提供無數種可能性。我們看到滴滴做智能派單、智能路徑規劃;看到阿里做個性化推薦;看到DeepMind曾經為谷歌數據中心省了數億美元…這類技術更本質上講,都是優化技術的具體呈現,它包括:

  1. 常見機器學習算法的立足點凸優化/非凸優化(深度學習完全是非凸優化)
  2. 經濟學領域活躍的博弈論
  3. 管理科學中的運籌學
  4. 組合優化(很多參加過計算機競賽選手的最愛之一)、在線優化等……

優化,在以前曾經是很多行業高端的BI;人工智能,在這一次的浪潮里面,其實是新瓶裝了優化這個醇香的酒。

怎樣讓自己開始具備一定專業的判斷力?

首先,這應該是一種能夠透過交流、PR稿、媒體報道等內容,看到背后虛實的判斷力。而不是泛泛而談的人工智能概念與倫理問題、奇點臨近等。

因為在這里不想涉及到過多深入的領域知識,考慮到相關人工智能必要性的背景知識,推薦大家可以看一本書–吳軍博士的《數學之美》(定位在了解+一點的專業性)。哪怕這些年的更新更復雜的技術,本質也沒有脫離“數學”問題的范疇。 (《智能時代》我本人并沒有看過,不過也有人推薦)

當下(2017年初)很靠譜的細分方向

智能相關,兩個角度來判定到底是不是靠譜(這個靠譜的閾值有點高)地在做事:

  • 對于人工智能,如果一個團隊或者公司強調他們是做優化的,那十有八九是靠譜的——這是看待所做事情的角度;
  • 對于智能硬件,如果一個創業團隊或者公司強調他們是做gpu、FPGA、手機等硬件/端的解決方案(并且有真實的demo),也是靠譜的——涉及到計算能力的未來發展。

最后,希望這篇文章能夠給想具備產業判斷能力的人提供一個視角。

 

作者:Jiasheng Tang

來源:微信公眾號【劉言飛語】

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 不錯

    回復