關(guān)于Google發(fā)布AutoML的幾點(diǎn)看法

1 評(píng)論 8819 瀏覽 11 收藏 10 分鐘

文章為作者對(duì)AutoML的幾點(diǎn)思考,希望能夠給你帶來一些啟發(fā)。

我曾拋出過一個(gè)問題:

有沒有這樣的模型,可以對(duì)應(yīng)用環(huán)境做出實(shí)時(shí)反饋,動(dòng)態(tài)重構(gòu)整套模型?例如:前一秒還是深度神經(jīng)網(wǎng)絡(luò),接受刺激后,就立馬坍縮成一個(gè)SVM。

當(dāng)時(shí)得到的一個(gè)回答是Alpha Zero,這不是我期待的答案,但在大方向上比較接近。

提出這種疑問,是因?yàn)槿祟悓?duì)事物的認(rèn)知也是實(shí)時(shí)重構(gòu)的。人腦的神經(jīng)網(wǎng)絡(luò)有一種在同經(jīng)驗(yàn)的對(duì)話交流中重新串聯(lián)它們自己的能力。每當(dāng)人看到一個(gè)模式,那些認(rèn)識(shí)這個(gè)模式的神經(jīng)網(wǎng)絡(luò)連接會(huì)長得更強(qiáng)大,直到認(rèn)識(shí)變成某種自動(dòng)反應(yīng)。如果模式改變了,那么我們用來感知它的能力也會(huì)慢慢改變,直到我們自己的大腦重新串聯(lián)來認(rèn)識(shí)這個(gè)新模式。

若將人腦的這種學(xué)習(xí)機(jī)制放到AI領(lǐng)域,就是遷移學(xué)習(xí),一種對(duì)變化環(huán)境的適應(yīng)能力。

今天,Google發(fā)布了Cloud AutoML,能夠通過增強(qiáng)學(xué)習(xí)自動(dòng)完成模型選擇+超參數(shù)優(yōu)化。它一定程度上再現(xiàn)了Alpha Zero的設(shè)計(jì)理念,也比Zero更直觀。

人工神經(jīng)網(wǎng)絡(luò)已經(jīng)實(shí)現(xiàn)了學(xué)習(xí)模型的自編碼,還需要人來訓(xùn)練。而AutoML更進(jìn)一步,實(shí)現(xiàn)了訓(xùn)練過程的自編碼,通過類似Axure的拖拽方式就能完成對(duì)話操作。部分場景的訓(xùn)練效果可能比AI工程師還好,提高了開發(fā)效率,也降低了準(zhǔn)入門檻。

下面是本人對(duì)AutoML的幾點(diǎn)思考,還不太成熟,歡迎指正。

AI工程師是否將被取代?

目前只會(huì)刺激更多人投身到AI領(lǐng)域,估計(jì)很快就會(huì)有《零基礎(chǔ)1小時(shí)創(chuàng)建機(jī)器學(xué)習(xí)模型》這類教學(xué)視頻出現(xiàn)。至于取代工程師?未來不好說,目前AutoML還遠(yuǎn)沒有那么強(qiáng)大,優(yōu)秀的AI工程師依然是爭搶的對(duì)象。

AutoML對(duì)AI產(chǎn)品經(jīng)理意味著什么?

它像一款制作Demo的工具,可以幫PM理解端到端學(xué)習(xí)的應(yīng)用邊界。大部分PM(尤其轉(zhuǎn)型中的)并不具備AI工程師的實(shí)操能力,這是個(gè)真實(shí)存在的痛點(diǎn)。以后若要驗(yàn)證新的場景思路,可以先做個(gè)Demo試試。解放出更多精力,分?jǐn)偟椒治鰣鼍?、獲取數(shù)據(jù)、設(shè)計(jì)方案、推進(jìn)落地上。

頂尖企業(yè)是否會(huì)用AutoML?

有AI基因的頂尖企業(yè)會(huì)選擇自研ML訓(xùn)練平臺(tái),比如BAT、華為、訊飛會(huì)將AutoML作為參考和過渡,不會(huì)依賴。這類云服務(wù)有很好的商業(yè)前景,估計(jì)國內(nèi)很快就會(huì)有類似的平臺(tái)上線,并借助自研的平臺(tái)高效為產(chǎn)業(yè)賦能。

非頂尖企業(yè)是否會(huì)用AutoML?

這取決于Google的功能迭代和售后服務(wù),能否滿足企業(yè)日益增長的細(xì)分場景需求。若AutoML能支撐更多場景,用真實(shí)數(shù)據(jù)打消中小型企業(yè)對(duì)黑盒訓(xùn)練的顧慮,就可以幫助互聯(lián)網(wǎng)企業(yè)省掉大量研發(fā)成本。傳統(tǒng)企業(yè)也可通過招募工程師或外包團(tuán)隊(duì),借助AutoML搞定簡單場景。

AutoML后續(xù)的迭代方向有哪些?

a)無監(jiān)督、半監(jiān)督學(xué)習(xí)

目前只支持監(jiān)督學(xué)習(xí),解決了設(shè)計(jì)模型、調(diào)參兩大痛點(diǎn)。其實(shí)相對(duì)于訓(xùn)練模型,有時(shí)候標(biāo)注數(shù)據(jù)的問題更令人頭疼。后續(xù)肯定可以支撐半監(jiān)督學(xué)習(xí),將部分標(biāo)簽數(shù)據(jù)做為參考,對(duì)剩余數(shù)據(jù)自動(dòng)打標(biāo)。

b)增強(qiáng)學(xué)習(xí)

連AutoML本身都是增強(qiáng)學(xué)習(xí)的產(chǎn)物,沒道理不支持。想想也蠻有意思,用增強(qiáng)學(xué)習(xí)來自動(dòng)擬合增強(qiáng)學(xué)習(xí)模型,這就像師父教了個(gè)徒弟,然后徒弟再去教自己的徒弟。

c)NLP、CV、ASR、翻譯

第一版本只開放了圖像識(shí)別,也是最成熟的一塊,其他標(biāo)準(zhǔn)模型的支撐不會(huì)太遠(yuǎn)。

d)從模型延伸到應(yīng)用

能否進(jìn)一步降低門檻,將模型對(duì)通用場景生成API,甚至直接生成AI應(yīng)用呢?

例如一家小型超市,想知道如何調(diào)整商品擺放、商品品類、進(jìn)貨量、促銷活動(dòng)等來實(shí)現(xiàn)更高收益,他們雇不起工程師。這樣的超市還有很多,AutoML將來能否滿足類似的需求?

e)應(yīng)用即訓(xùn)練

目前大部分模型的訓(xùn)練過程與應(yīng)用部署是分開的,當(dāng)然也看具體場景和終端的容量。小米的防盜鎖,每次指紋識(shí)別都會(huì)增加下一次的識(shí)別速度、準(zhǔn)確度,越用越爽。

AutoML能否在云端實(shí)現(xiàn)應(yīng)用場景下的實(shí)時(shí)訓(xùn)練呢?相信會(huì)有這樣的需求,比如在線醫(yī)療成像診斷,實(shí)時(shí)獲取N家醫(yī)院的診斷數(shù)據(jù),通過動(dòng)態(tài)的訓(xùn)練使診斷正確率持續(xù)提升。

f)共享模型/應(yīng)用

數(shù)據(jù)是戰(zhàn)略資源,共享數(shù)據(jù)(尤其打標(biāo)好的)的阻力很大,但共享訓(xùn)練好的模型并非沒有可能。若AutoML支持共享行業(yè)解決方案,會(huì)受到很多企業(yè)的青睞,尤其是冷啟動(dòng)的創(chuàng)業(yè)項(xiàng)目。這樣企業(yè)就不用再愁訓(xùn)練數(shù)據(jù),只要支付云服務(wù)費(fèi)就獲得現(xiàn)成的模型或應(yīng)用。

g)通用能力

估計(jì)企業(yè)最關(guān)心的就是通用能力了,如果不支撐復(fù)雜場景、長尾場景,就有一大批企業(yè)無法靠AutoML訓(xùn)練出想要的模型。

AutoML對(duì)國內(nèi)巨頭意味著什么?

Google大方地公布Tensorflow、AutoML的源碼,不僅因?yàn)殚_放的基因和格局,更因?yàn)樗掷镎莆罩诵母偁幜εc撒手锏,具備降維打擊的能力。它正在汲取群眾的智慧來完善自己,把更多敵人變?yōu)榕笥选?/p>

我覺得未來AI公司的競爭,拼的是這3方面:

  • 以區(qū)塊鏈、遷移學(xué)習(xí)、AI芯片為代表的技術(shù)突破
  • 下探到行業(yè)將場景落地的能力
  • 持續(xù)自我迭代的進(jìn)化能力

這三方面在AutoML上均有體現(xiàn)。不難想象,國內(nèi)巨頭們可能已經(jīng)將自研類似的產(chǎn)品納入到戰(zhàn)略規(guī)劃了。它在自編碼、場景遷移的方向上擁有巨大潛力,這種向內(nèi)生長的可能性比云服務(wù)本身更有價(jià)值。

在探索未來的道路上,Google是走的最遠(yuǎn)的那一個(gè)。我們有理由相信,AutoML只是道開胃小菜,后面會(huì)有一大波滿漢全席靠近,不知國內(nèi)巨頭如何抵擋。

AutoML的局限有哪些?

AutoML降低了準(zhǔn)入門檻,但目前的深度學(xué)習(xí)體系本就是殘缺的,例如:抽象的層次太淺、無視因果關(guān)系、黑盒、基于統(tǒng)計(jì)。DNN還不夠優(yōu)雅,缺乏生機(jī),這是我作為一名產(chǎn)品經(jīng)理感受。

無論NLP還是遷移學(xué)習(xí),瓶頸都在于機(jī)器意識(shí)、知識(shí)圖譜的突破,我的思路是:

  • 從認(rèn)知學(xué)、腦科學(xué)、神經(jīng)學(xué)尋找靈感
  • 結(jié)合最先進(jìn)的機(jī)器學(xué)習(xí)和區(qū)塊鏈技術(shù),做模型間的深度耦合,在算法層面持續(xù)推演
  • 量子計(jì)算芯片的突破,新的底層架構(gòu)一定會(huì)催生出顛覆性的應(yīng)用思路
  • 對(duì)知識(shí)圖譜的思維轉(zhuǎn)變,需要有更復(fù)雜的描述框架。相信未來的知識(shí)圖譜不會(huì)是簡單的存儲(chǔ)結(jié)構(gòu),而是包含計(jì)算力和算法的動(dòng)態(tài)體系,就像人和地球一樣。

 

作者:于長弘,公眾號(hào):AI小宇宙(ID:AI_endless)

本文由 @于長弘 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!