機(jī)器人技術(shù)Robotics 2.0(1):AI重新定義機(jī)器人
本文將揭開新世代AI 機(jī)器人的神秘面紗,并分析AI機(jī)器人將如何影響我們的未來。
人工智能開啟了新一代機(jī)器人技術(shù)Robotics 2.0,最大改變是從原先人工編寫程序而來的自動化,邁向了真正的自主學(xué)習(xí)。 本文將嘗試揭開人工智能(AI)應(yīng)用的神秘面紗,協(xié)助讀者了解AI機(jī)器人將如何影響我們的未來,并厘清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
本文為「Robotics 2.0」系列文章的第一篇,講述機(jī)器人技術(shù)與AI對于各大產(chǎn)業(yè)和未來工作的影響。 我們將討論AI將如何釋放機(jī)器人技術(shù)的潛力,這項(xiàng)新技術(shù)的挑戰(zhàn)和機(jī)會,以及這一切將如何影響我們的生產(chǎn)力、就業(yè)狀況、甚至日常生活。 在人工智能被大肆宣傳的當(dāng)下,我們希望透過這些文章鼓勵(lì)更有建設(shè)性和全面性的探討。
01 重新定義機(jī)器人:揭開次世代AI機(jī)器人Robotics 2.0的神秘面紗
提到機(jī)器人,我們總有各式各樣天馬行空的想象:從Softbank(軟銀集團(tuán))的社交機(jī)器人Pepper、能輕松后空翻的Boston Dynamics公司機(jī)器人Atlas、《魔鬼終結(jié)者》(Terminator)系列電影的人造人殺手,到電視影集《西方極樂園》( ?West World)中隨處可見、栩栩如生的擬真機(jī)器人角色。
我們常常聽到兩極化的觀點(diǎn);有些人傾向高估機(jī)器人模仿人類的能力,認(rèn)為機(jī)器終將取代人類,有些人則對新研究和技術(shù)的潛力太過悲觀。
在過去一年之中,許多創(chuàng)業(yè)、科技、新創(chuàng)業(yè)界的朋友都曾問過我,在AI,尤其是深度強(qiáng)化學(xué)習(xí)和機(jī)器人技術(shù)的領(lǐng)域,究竟有哪些「實(shí)際」進(jìn)展?
令人最為好奇的是:
AI機(jī)器人和傳統(tǒng)機(jī)器人有什么不一樣? ?AI機(jī)器人是否真有顛覆各大產(chǎn)業(yè)的潛力? 它的能力和限制又是什么?
看來,想要了解現(xiàn)在的技術(shù)進(jìn)步和產(chǎn)業(yè)格局,是出乎意料的困難,更不用說要對未來做出預(yù)測。 藉由這篇文章,我嘗試揭開人工智能應(yīng)用于機(jī)器的神秘面紗,厘清這個(gè)我們常常聽到,但卻著墨不多、或根本未全然理解的主題。
首先必須回答的基本問題:什么是AI機(jī)器人(AI-enabled Robotics)? 它們又有什么獨(dú)特之處?
02 機(jī)器人演進(jìn):從自動化到自主化
「機(jī)器學(xué)習(xí)解決了以往『對計(jì)算機(jī)困難,對人來說卻容易』的各種問題,或以更容易理解的方式來說,就是解決了『人類很難讓計(jì)算機(jī)也理解』的問題。 」
——Benedict Evans,安霍創(chuàng)投(a16z)
AI所造就的機(jī)器人技術(shù)領(lǐng)域,最大成果是從原先的「自動化」(工程師藉由程序設(shè)計(jì)編寫規(guī)則,讓機(jī)器人遵守)邁向了真正的「自主學(xué)習(xí)」。
如果機(jī)器人只需要處理一件事情,那么,它到底有沒有人工智能,差別其實(shí)看不出來;但是,如果機(jī)器人需要處理各式各樣的任務(wù)、或是響應(yīng)人類與環(huán)境的變化,就需要一定程度的自主性才能勝任。
我們不妨借用下列不同等級的自駕車定義,一并解釋機(jī)器人的演變:
- Level 0 —無自動化:由人類操作機(jī)器,沒有機(jī)器人的參與。 (機(jī)器人的普遍定義,是指有能力自行從事復(fù)雜動作的可程序化擬人機(jī)械)。
- Level 1 —單一自動化運(yùn)作:單一功能已自動化,但不使用環(huán)境信息。 這是自動化與制造業(yè)中傳統(tǒng)的機(jī)器人使用現(xiàn)況。 透過程序編輯,機(jī)器人能夠以高精度與速度重復(fù)執(zhí)行特定工作;但直至目前為止,多數(shù)實(shí)際運(yùn)用的機(jī)器人都無法感知或應(yīng)變環(huán)境的變化。
- Level 2 —部分自動化:透過環(huán)境感知所輸入的特定功能,協(xié)助機(jī)器進(jìn)行決策。 例如某些機(jī)器人透過視覺傳感器,識別并應(yīng)付不同的對象:然而,傳統(tǒng)的計(jì)算機(jī)視覺,需要對每個(gè)對象進(jìn)行預(yù)先登記和清楚的指示,且機(jī)器人還是缺乏處理變更、意外狀況、或是新對象的能力。
- Level 3 —條件式自主:機(jī)器控制了所有的環(huán)境監(jiān)控行為,但仍需要人為檢查關(guān)注與(實(shí)時(shí))介入。
- Level 4 —高度自主:在某些情況下、或是定義的區(qū)域內(nèi)完全自主。
- Level 5 —完全自主:在任何狀況下均可完全自主,不需人為介入。
03 我們現(xiàn)在處于哪一種自主等級呢?
現(xiàn)在,工廠里多數(shù)機(jī)器人都是透過開放式回路、或是非回饋方式予以控制。 這意味著它們的運(yùn)作與傳感器回饋各自獨(dú)立、彼此互不影響(level 1)。
少數(shù)在工廠中的機(jī)器人,會根據(jù)傳感器回饋而調(diào)整操作(level 2);此外還有協(xié)作型機(jī)器人(cobot),他們的操作更加簡單安全,因此能與人類共同作業(yè)。然而,相較于產(chǎn)業(yè)用機(jī)器人,這種機(jī)器人的精確度和速度卻相形失色。
另外,雖然協(xié)作型機(jī)器人的程序化相對簡單,但它們?nèi)匀徊痪哂凶灾鲗W(xué)習(xí)性;每當(dāng)工作內(nèi)容或環(huán)境有所變動時(shí),就需要由人類手動引導(dǎo)協(xié)作機(jī)器人進(jìn)行調(diào)整,或是重新編寫程序,機(jī)器本身無法自主舉一反三,彈性應(yīng)變。
深度學(xué)習(xí)(Deep Learning)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning)能幫助機(jī)器人自主處理各種對象,將人類的介入程度降到最低。
我們已經(jīng)開始看到一些使用AI 機(jī)器人(level 3/4)的前導(dǎo)試行項(xiàng)目,例如「倉儲揀貨」就是一個(gè)很好的例子。 在貨運(yùn)倉庫中,員工需要根據(jù)客戶需求,將數(shù)百萬種不同的產(chǎn)品放入箱子里。 傳統(tǒng)的計(jì)算機(jī)視覺沒辦法處理如此廣泛的物品類別,因?yàn)槊總€(gè)物品都需要事先登錄、并針對機(jī)器人需要采取的動作,先進(jìn)行程序設(shè)計(jì)。
然而,現(xiàn)在由于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù),機(jī)器人能夠開始自主學(xué)習(xí)處理各種對象,降低人類的介入程度。 在機(jī)器人的學(xué)習(xí)過程中,可能會出現(xiàn)它未曾遇過的某些貨品,而需要人類的協(xié)助或示范(level 3)。 但是,隨著機(jī)器人搜集更多的數(shù)據(jù)、從試驗(yàn)和錯(cuò)誤中學(xué)習(xí)(level 4),算法也將日益改善,邁向完全自主。
就像自駕汽車產(chǎn)業(yè)一樣,機(jī)器人新創(chuàng)公司也采取了不同的策略:有些公司看好人類和機(jī)器人之間的合作,專注于level 3的研發(fā);有些公司則相信,機(jī)器終將實(shí)現(xiàn)真正的完全自主,于是他們跳過level 3,直接著眼于level 4、甚至到level 5。
這也是為什么我們很難評估現(xiàn)在產(chǎn)業(yè)自主程度的原因之一。
新創(chuàng)公司有可能自稱致力于研究level 3/4的自主系統(tǒng),但實(shí)際上卻是大量委外,以人工遠(yuǎn)程操控機(jī)器。 在無法了解其內(nèi)部軟件及AI產(chǎn)品發(fā)展程度的前提下,光從機(jī)器外觀看不出遠(yuǎn)程操控和自主學(xué)習(xí)的差別。 另一方面,目標(biāo)為level 4/5的新創(chuàng)公司,萬一無法在短時(shí)間取得理想結(jié)果,可能反而降低了客戶的早期采用意愿、并導(dǎo)致早期階段的數(shù)據(jù)搜集更加困難。
在本文的后半部分,我將進(jìn)一步討論新創(chuàng)公司的不同的商業(yè)策略思考。
04 AI機(jī)器人的崛起:運(yùn)用范圍不再局限于倉儲管理
有趣的是,機(jī)器人的人工智能應(yīng)用潛能甚至高于無人車,因?yàn)闄C(jī)器人有各式各樣的應(yīng)用與產(chǎn)業(yè),因此從某種意義上說,機(jī)器人理當(dāng)比汽車更容易實(shí)現(xiàn)level 4目標(biāo)。
AI機(jī)器手臂開始在倉庫中被采用,就是最好的例子。 因?yàn)閭}庫屬于「半受控」的環(huán)境,不確定性相對低。 另外,揀貨作業(yè)雖然關(guān)鍵、但能容許錯(cuò)誤。
至于自主居家型或手術(shù)機(jī)器人,則要等到更遙遠(yuǎn)的未來才能實(shí)現(xiàn);畢竟相關(guān)環(huán)境的變量更多,且有些任務(wù)具備不可逆性,以及一定程度的危險(xiǎn)性。 但是,可以預(yù)見的是,隨著技術(shù)精度、準(zhǔn)確性、可靠性的與時(shí)俱進(jìn),我們將看到更多產(chǎn)業(yè)采用AI機(jī)器人。
許多產(chǎn)業(yè)還沒有使用機(jī)械手臂,主要原因在于傳統(tǒng)機(jī)器人和計(jì)算機(jī)視覺的限制。
目前世界上只有大約300萬臺機(jī)器手臂,其中大多數(shù)從事搬運(yùn)、焊接、裝配等任務(wù)。 到目前為止,除了汽車業(yè)和電子業(yè)以外,倉儲、農(nóng)業(yè)和其他產(chǎn)業(yè),幾乎都還沒有開始使用機(jī)械手臂;主要原因,就在于上述傳統(tǒng)機(jī)器人和計(jì)算機(jī)視覺的限制。
在接下來的幾十年中,隨著深度學(xué)習(xí)(DL)、強(qiáng)化學(xué)習(xí)(RL)、以及云端技術(shù)釋放出的機(jī)器人潛力,我們將看到新一代機(jī)器人帶來的爆炸式增長、并改變產(chǎn)業(yè)格局。 其中,AI機(jī)器人的成長契機(jī)有哪些? 新創(chuàng)公司和現(xiàn)有業(yè)者,又采取了哪些不同的方法和商業(yè)模式,來因應(yīng)新科技帶來的變化?
05 新世代AI機(jī)器人新創(chuàng)公司產(chǎn)業(yè)概況
接下來,我會介紹不同市場區(qū)隔中的幾間范例公司。 這樣的概略介紹,當(dāng)然無法涵蓋所有企業(yè)的狀況;歡迎你提供其他公司及應(yīng)用案例,一起讓內(nèi)容更加完備。
AI/Robotics新創(chuàng)公司市場概況(作者提供)
06 垂直應(yīng)用與水平應(yīng)用
研究新世代機(jī)器人新創(chuàng)產(chǎn)業(yè)結(jié)構(gòu),可以看到兩種截然不同的商業(yè)模式。
1. 垂直應(yīng)用
第一種是垂直應(yīng)用:硅谷當(dāng)?shù)囟鄶?shù)的新創(chuàng)公司,專注于為特定的垂直市場開發(fā)解決方案;如電子商務(wù)物流、制造業(yè)、農(nóng)業(yè)等等。
這種提供完整解決方案的作法相當(dāng)合理,畢竟相關(guān)技術(shù)還處于萌芽階段;公司不依賴他人提供關(guān)鍵模塊或組件,而是建構(gòu)端對端的解決方案。 這種垂直整合的解決方案能更快進(jìn)入市場,也能確保公司更全面掌握終端用戶的案例與效能表現(xiàn)。
但是,要找到像「倉庫分揀」這樣相對容易實(shí)現(xiàn)的應(yīng)用案例,則沒有那么容易。 倉庫揀貨是相對簡單的工作,客戶的投資意愿與技術(shù)可行性都較高,而且每個(gè)倉庫幾乎都有相同的揀貨需求。
但在其他產(chǎn)業(yè)(如制造業(yè))中,裝配任務(wù)可能因工廠而各不相同;另外,在制造業(yè)中執(zhí)行的任務(wù),也需要更高的精度和速度,技術(shù)上相對困難。
目前具有學(xué)習(xí)能力的機(jī)器人,仍無法達(dá)到與封閉回路機(jī)器人相同的精度。
盡管機(jī)器學(xué)習(xí)能讓機(jī)器人與時(shí)俱進(jìn),但目前透過機(jī)器學(xué)習(xí)運(yùn)作的機(jī)器人,仍無法達(dá)到與封閉回路機(jī)器人相同的精度,因?yàn)樗枰鄯e嘗試錯(cuò)誤的經(jīng)驗(yàn),從錯(cuò)誤中學(xué)習(xí),逐漸進(jìn)步。
這點(diǎn)說明了為什么Mujin和CapSen機(jī)器人這樣的新創(chuàng)公司,并未采用深度強(qiáng)化學(xué)習(xí),反而選擇使用傳統(tǒng)計(jì)算機(jī)視覺。
然而,傳統(tǒng)計(jì)算機(jī)視覺要求每個(gè)對象都要事先登錄,終究還是缺乏擴(kuò)充和適應(yīng)變化的能力。 一旦深度強(qiáng)化學(xué)習(xí)(DRL)達(dá)到了效能門坎、逐步成為產(chǎn)業(yè)主流,這種傳統(tǒng)方法終究會變得無用武之地。
此外,這些新創(chuàng)公司的另一個(gè)問題,在于它們的價(jià)值往往遭到高估。 我們經(jīng)??吹剑聞?chuàng)公司在硅谷籌集了數(shù)千萬美元資金,卻無法承諾創(chuàng)造出任何真正具體的收入流。
對于創(chuàng)業(yè)者來說,「描繪」深度強(qiáng)化學(xué)習(xí)的美好未來,再容易也不過了;但現(xiàn)實(shí)則是,我們還需要數(shù)年的時(shí)間才能達(dá)到如此的成果。 盡管這些公司離創(chuàng)造獲利還有一段距離,硅谷的創(chuàng)投仍愿意繼續(xù)押寶在這些人才優(yōu)秀、技術(shù)先進(jìn)的團(tuán)隊(duì)上。
2. 水平應(yīng)用
另一方面,水平應(yīng)用則是更實(shí)用、卻比較罕見的模式。 我們可以簡單將機(jī)器人技術(shù)簡化為感測(輸入)、處理、驅(qū)動(輸出)三個(gè)部分;除此之外,還有開發(fā)工具。
(這里使用的「處理」一詞,同時(shí)概略涵蓋了控制器、機(jī)器學(xué)習(xí)、操作系統(tǒng)和機(jī)器人模塊等等,各種不屬于感測或驅(qū)動的其他項(xiàng)目 )
我認(rèn)為未來,這個(gè)領(lǐng)域?qū)⒆罹咴鲩L潛力。 對于機(jī)器人的用戶來說,破碎而零細(xì)的市場是棘手的問題;因?yàn)樗械臋C(jī)器人制造商,都各自推展自家開發(fā)的語言和接口,使得系統(tǒng)整合商與終端用戶,都很難將機(jī)器人與相關(guān)系統(tǒng)進(jìn)行整合。
隨著產(chǎn)業(yè)的逐漸成熟,有越來越多機(jī)器人應(yīng)用到了汽車和電子廠以外的領(lǐng)域;因此我們更加需要標(biāo)準(zhǔn)的操作系統(tǒng)、通訊協(xié)議、接口,從而提高效率、并縮短上市時(shí)間。
舉例來說,美國波士頓的幾家新創(chuàng)公司正在研究相關(guān)的模塊;例如Veo ?Robotics公司開發(fā)的安全模塊,能讓工業(yè)機(jī)器人更安全地和人類協(xié)同工作;Realtime Robotics ??公司則提供加速了機(jī)械手臂路徑的解決方案。
作者:Bastiane Huang,擁有近10年產(chǎn)品及市場開發(fā)管理經(jīng)驗(yàn),目前在舊金山擔(dān)任 AI/Robotics新創(chuàng)公司產(chǎn)品經(jīng)理,專注于開發(fā)機(jī)器學(xué)習(xí)軟件,用于機(jī)器人視覺和控制。
本文由 @Bastiane 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!