從“+AI”到“AI+”,時(shí)代進(jìn)入“Next Level”
在結(jié)束的WAIC大會(huì)上,人形機(jī)器人成為一大看點(diǎn),同時(shí)AI大模型和各種應(yīng)用的推出,讓我們看到后續(xù)發(fā)展的可能。隨著WAIC 2024的落幕,AI應(yīng)用落地的最新趨勢(shì)也逐漸清晰。
“創(chuàng)新的速度比創(chuàng)新本身更重要?!卑B ゑR斯克曾這樣說到。
近日,由馬斯克所掌舵的特斯拉,在2024年世界人工智能大會(huì)上正式推出了第二代Optimus(擎天柱)人形機(jī)器人,距離第一代面世,僅過去9個(gè)月。
加速升級(jí)的人形機(jī)器人不負(fù)所望,成了今年WAIC大會(huì)(世界人工智能大會(huì))的一大看點(diǎn)。除此以外,今年的WAIC大會(huì)還引發(fā)了哪些熱門話題?帶來了哪些前瞻指引?
一、開源和閉源,是互補(bǔ)關(guān)系
今年,華為盤古、百度文心、阿里通義、騰訊混元等國內(nèi)知名大模型悉數(shù)都參加了WAIC,大模型依舊是重頭戲之一。
大會(huì)開幕期間,在談及大模型閉源與開源的選擇時(shí),兩大頭部企業(yè)陷入明顯分歧。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏稱,模型開源無法做到眾人拾柴火焰高,商業(yè)化閉源模型才最能打。
阿里云CTO周靖人則重申了阿里云開源開放的選擇,并強(qiáng)調(diào)阿里兩年前決定將通義大模型開源開放,時(shí)至今日,通義千問已經(jīng)實(shí)現(xiàn)真正意義上的全尺寸、全模態(tài)開源,拉平了開源、閉源模型之間的差距。
相較而言,開源大模型和閉源大模型孰好孰壞,其實(shí)并沒有定論。
從技術(shù)層面來看,閉源由于不公開源代碼,安全性和服務(wù)質(zhì)量更高,而且可以通過銷售許可或提供基于模型的服務(wù)來盈利;但同時(shí)許可費(fèi)高昂,外界難以審查監(jiān)管,而且升級(jí)迭代高度依賴內(nèi)部團(tuán)隊(duì),速度有限。
開源則恰好相反,技術(shù)門檻和成本較低,吸引了全國范圍的開發(fā)者和研究者參與,創(chuàng)新和迭代速度更快,適配更多應(yīng)用領(lǐng)域,但無門檻的技術(shù)共享也帶來了權(quán)益被侵犯的風(fēng)險(xiǎn),質(zhì)量、穩(wěn)定性和安全性難以保證。
對(duì)比來看,閉源想要走向“成功”,唯一的路徑就是進(jìn)化為“超級(jí)應(yīng)用”,從而創(chuàng)造價(jià)值;而開源憑借獨(dú)有的兼容性打造了強(qiáng)有力的獲客手段。由此可見,看似截然不同的兩個(gè)方向背后,是由各自的商業(yè)利益驅(qū)使。
從應(yīng)用層面來看,開源和閉源并不像手機(jī)端的iOS系統(tǒng)或者安卓系統(tǒng)只能二選一,尤其在ToB的情況下,應(yīng)用端既需要技術(shù)共享也會(huì)考慮應(yīng)用安全性,還需要滿足多樣化需求。
對(duì)此,百川智能CEO王小川表示,預(yù)計(jì)未來將有80%的企業(yè)會(huì)用到開源大模型,因?yàn)殚]源沒辦法對(duì)產(chǎn)品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務(wù)。
由此可見,二者并不是非此即彼的對(duì)立關(guān)系,在不同產(chǎn)品和應(yīng)用場景中也可以是互補(bǔ)的關(guān)系。但歸根究底,大模型在發(fā)展之余如何創(chuàng)造價(jià)值,選擇開源還是閉源就不是核心問題,因?yàn)閮H有基礎(chǔ)模型卻沒有應(yīng)用,就等同于一文不值。
二、AI落地的三大方向:大模型、機(jī)器人、終端產(chǎn)品
大模型作為人工智能大家族的組成部分,一直是熱議的話題之一。隨著WAIC 2024的落幕,AI應(yīng)用落地的最新趨勢(shì)也昭然若揭。
1. 大模型加速商業(yè)化
繼百模大戰(zhàn)后,大模型的“精耕細(xì)作”一直在持續(xù)。以ChatGPT和Sora為代表的大模型技術(shù),也已進(jìn)入新一輪迭代。從今年的WAIC來看,百度、阿里巴巴、騰訊、華為等行業(yè)巨頭帶來眾多新技術(shù)和新產(chǎn)品,展現(xiàn)了大模型在金融、醫(yī)療、政務(wù)等多個(gè)行業(yè)場景的應(yīng)用潛力。
截至目前,百度有千帆大模型平臺(tái)、文心一言,阿里有阿里云百煉、通義大模型,騰訊有騰訊云混元大模型、元寶大模型,字節(jié)跳動(dòng)有火山方舟、豆包大模型等等。
在過去的2023年里,大模型的長文處理能力、數(shù)字能力、推理能力、RAG(檢索增強(qiáng)生成)、GPTs、多模態(tài)、原生應(yīng)用、開源等多方面都有大幅增強(qiáng)。同時(shí),訓(xùn)練和部署成本、行業(yè)適配能力、幻想問題以及數(shù)據(jù)安全這四大挑戰(zhàn)也得以優(yōu)化和解決。
在此基礎(chǔ)上,定制化的大模型給To B和To C業(yè)務(wù)帶來了非常深刻和徹底的改造,企業(yè)用戶和終端個(gè)人用戶也逐漸呈現(xiàn)剛性需求?;诖耍琓o C產(chǎn)品可以通過不斷收集用戶反饋、積累模型的應(yīng)用實(shí)踐,來反哺ToB業(yè)務(wù),從而加速大模型商業(yè)化落地。
2. 機(jī)器人和AI高度結(jié)合
今年,人形機(jī)器人專區(qū)也是大會(huì)的一大亮點(diǎn)。在世博展覽館的中廳,18臺(tái)人形機(jī)器人組成陣列展示“才藝”,并與觀眾親切互動(dòng),可見機(jī)器人技術(shù)的協(xié)同效應(yīng)以及在”異構(gòu)群智”領(lǐng)域的重大突破。
隨著人形機(jī)器人和AI兩大領(lǐng)域的高速發(fā)展,產(chǎn)業(yè)進(jìn)入深度融合階段,AI大模型+人形機(jī)器人正掀起下一波技術(shù)熱潮。
從技術(shù)角度看,兩者在自然語言交互、知識(shí)庫與推理、多模態(tài)感知與決策、運(yùn)動(dòng)規(guī)劃、任務(wù)規(guī)劃與執(zhí)行、情感交互、持續(xù)學(xué)習(xí)等七個(gè)板塊均有結(jié)合應(yīng)用的可能性。
在實(shí)際應(yīng)用方面也已經(jīng)取得突破。比如WAIC 2024大會(huì)上,特斯拉的Optimus二代機(jī)器人將深度學(xué)習(xí)應(yīng)用于視覺感知,實(shí)現(xiàn)了精準(zhǔn)的目標(biāo)識(shí)別與抓取,而且可以直立行走,進(jìn)行路線規(guī)劃。
自然語言交互領(lǐng)域,Xiaomi CyberOne等人形機(jī)器人搭載大語言模型,實(shí)現(xiàn)了高自然度語音交互。情感交互領(lǐng)域,Hanson Robotics的Sophia機(jī)器人通過面部表情合成和聲音合成,實(shí)現(xiàn)了豐富的情感表達(dá)。
通過以上技術(shù)的融合,我們有望創(chuàng)造出具備感知、決策、規(guī)劃、控制、交互、學(xué)習(xí)等多維能力的人形機(jī)器人,最終賦予其真正的智能化、人性化。
3. AI終端“新物種”涌現(xiàn)
除了大模型、人形機(jī)器人,AI的終端產(chǎn)品逐漸滲透至日常生活。正如三次工業(yè)革命,蒸汽時(shí)代誕生蒸汽機(jī)、電氣時(shí)代發(fā)明電燈泡、信息化時(shí)代創(chuàng)造計(jì)算機(jī),每一件革命性的“新物種”都被應(yīng)用于終端場景,AI大航海時(shí)代的產(chǎn)物也將如此。
今年,多個(gè)行業(yè)涌現(xiàn)了”終端新物種”。比如戴爾、聯(lián)想、華為的AI PC新產(chǎn)品、內(nèi)置大模型語音助手的雷鳥AR眼鏡X2 Lite、實(shí)現(xiàn)AI翻譯的時(shí)空壺同聲傳譯器X1,以及今年上半年被熱議最多的蘋果vision pro混合現(xiàn)實(shí)頭顯,等等。
追本溯源,終端產(chǎn)品的涌現(xiàn),主要得益于AI模型、AI應(yīng)用、AI硬件的協(xié)同發(fā)展。從AI產(chǎn)業(yè)結(jié)構(gòu)來看,產(chǎn)業(yè)鏈上游為基礎(chǔ)層,包括算力等,中游為算法和模型層,下游為應(yīng)用層。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕細(xì)作”,終端“新物種”應(yīng)運(yùn)而生。
隨著AI生態(tài)和技術(shù)的不斷進(jìn)化,未來AI終端還將迎來架構(gòu)設(shè)計(jì)、交互方式、內(nèi)容、應(yīng)用生態(tài)等的全面創(chuàng)新和升級(jí)?;蛟S,我們會(huì)從提問“AI終端應(yīng)該長什么樣”,轉(zhuǎn)為好奇“AI終端會(huì)長什么樣”。
三、2024,開啟“AI+”時(shí)代
2024年,伴隨大數(shù)據(jù)處理、高性能計(jì)算、深度學(xué)習(xí)等技術(shù)的快速發(fā)展和成熟,人工智能已經(jīng)能夠解決大量的復(fù)雜問題,加上日益成熟的大模型技術(shù),人工智能的準(zhǔn)確度、效率、通用性、靈活性得到顯著提升。
應(yīng)用層面,隨著現(xiàn)代社會(huì)產(chǎn)生的數(shù)據(jù)開始爆發(fā)式增長,為人工智能的進(jìn)化提供了“養(yǎng)料”,人工智能得以更好地學(xué)習(xí)和理解現(xiàn)實(shí)世界。加之,個(gè)人用戶和企業(yè)客戶對(duì)于個(gè)性化、高效的服務(wù)需求日益增強(qiáng)。
在底層技術(shù)高速發(fā)展,以及市場需求的牽引下,人工智能(AI)已經(jīng)由“+AI”模式轉(zhuǎn)型至“AI+”模式的階段。
對(duì)比來看,早前的“+AI”階段,人工智能還只是一項(xiàng)補(bǔ)充技術(shù),被運(yùn)用于傳統(tǒng)行業(yè)的既有業(yè)務(wù)流程和產(chǎn)品之中,目標(biāo)在于提升效率、解決特定問題。
如今的“AI+”階段,AI不再僅僅是業(yè)務(wù)流程的附屬部分,更是各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動(dòng)力,其核心在于數(shù)據(jù)驅(qū)動(dòng)和自我學(xué)習(xí),利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行大量數(shù)據(jù)的訓(xùn)練,模擬人腦的學(xué)習(xí)機(jī)制,從而實(shí)現(xiàn)語音識(shí)別、圖像識(shí)別等多領(lǐng)域超越人類的表現(xiàn)。
這一階段跨越的完成,意味著AI從單純的技術(shù)附加工具轉(zhuǎn)向了引領(lǐng)行業(yè)變革的關(guān)鍵要素,從賦能單一功能升級(jí)為重塑整個(gè)業(yè)務(wù)形態(tài)。
業(yè)務(wù)形態(tài)的重塑具體到應(yīng)用場景,覆蓋了交通出行、生活服務(wù)、工業(yè)制造、文化傳播、醫(yī)療健康、農(nóng)村建設(shè)等多個(gè)領(lǐng)域。
AI+交通領(lǐng)域,在AI算法的加持下,車輛能夠處理海量的傳感器數(shù)據(jù),實(shí)現(xiàn)對(duì)車輛周圍環(huán)境的高精度感知。同時(shí),還能預(yù)測(cè)其他車輛的行駛軌跡,為自動(dòng)駕駛車輛提供決策依據(jù)。最重要的是,AI算法通過不斷學(xué)習(xí)和優(yōu)化,可以提升自動(dòng)駕駛系統(tǒng)的性能和安全性。
AI+制造領(lǐng)域,由于大模型、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等細(xì)分技術(shù)實(shí)現(xiàn)突破,人工智能可以被應(yīng)用于制造業(yè)全流程各環(huán)節(jié),通過挖掘各單一環(huán)節(jié)的數(shù)據(jù)信息,進(jìn)而賦能整體的預(yù)測(cè)、生產(chǎn)、管理、決策,從而實(shí)現(xiàn)精細(xì)化管理,助力企業(yè)降本增效。
工信部數(shù)據(jù)顯示,經(jīng)過智能化改造,制造業(yè)研發(fā)周期縮短約20.7%、生產(chǎn)效率提升約34.8%、不良品率降低約27.4%、碳排放減少約21.2%。
長遠(yuǎn)來看,“AI+”的潛力已經(jīng)開始展現(xiàn)。
四、結(jié)語
2024年,AI應(yīng)用落地的想象力無效迸發(fā)。大模型加速商業(yè)化、AI 和人形機(jī)器人深度結(jié)合、終端新物種大量涌現(xiàn),大航海時(shí)代的歷史齒輪開始高速運(yùn)轉(zhuǎn)。
不只是人工智能行業(yè),整個(gè)產(chǎn)業(yè)鏈也在加速擴(kuò)容,AI+交通、AI+汽車、AI+文化、AI+制造等都開始從理論走向?qū)嵺`,走進(jìn)生產(chǎn)和生活。
“AI+”時(shí)代真的來了。
作者:琴聲奏響時(shí)
來源公眾號(hào):松果財(cái)經(jīng)(ID:songguocaijing1),解讀財(cái)經(jīng)熱點(diǎn)事件,以獨(dú)特的視角帶你挖掘新經(jīng)濟(jì)時(shí)代的商業(yè)機(jī)會(huì)。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @松果財(cái)經(jīng) 授權(quán)發(fā)布,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!