「ChatGPT」全球爆火,百度們?cè)谧鍪裁矗?/h2>
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術(shù)應(yīng)用非人工智能生成內(nèi)容(AIGC)莫屬。那么,AIGC行業(yè)的發(fā)展?fàn)顩r如何呢?百度們?cè)谧鍪裁茨兀孔屛覀円黄饋?lái)看看作者的看法吧。
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術(shù)應(yīng)用非人工智能生成內(nèi)容(AIGC)莫屬。
年中,AI畫(huà)作《太空歌劇院》在科羅拉多州博覽會(huì)藝術(shù)比賽中一舉奪魁,引起了人們對(duì)AI創(chuàng)作合理性的激烈討論。
年末,ChatGPT橫空出世,技驚四座,出色地回答了人類(lèi)提出的各種問(wèn)題,讓許多人感嘆“這是我見(jiàn)過(guò)最像AI的AI”,掀起了與人工智能對(duì)話的熱潮。
而在今年的百度AI開(kāi)發(fā)者大會(huì)中,百度技術(shù)委員會(huì)主席吳華介紹了文心大模型的視頻內(nèi)容生成與編輯技術(shù),讓一言化視頻成為了現(xiàn)實(shí),賦予了每個(gè)人都能成為制片人的機(jī)會(huì),引起了人們的廣泛關(guān)注。
在這多次爆火出圈的背后,真正讓人感嘆的其實(shí)是人工智能技術(shù)的飛速發(fā)展。那么,AIGC的發(fā)展到底經(jīng)歷了哪些階段,為何集中于2022年“井噴”式爆發(fā)?我們的生活又將怎樣被AIGC改變?立足當(dāng)下,AIGC行業(yè)的發(fā)展?fàn)顩r又是如何呢?
一、AIGC的萬(wàn)千“面孔”
歷經(jīng)數(shù)十年發(fā)展,深度學(xué)習(xí)模型不斷迭代,AIGC迎來(lái)突破性發(fā)展。
在各類(lèi)使用AIGC技術(shù)的應(yīng)用大規(guī)?!熬畤姟敝?,AIGC也曾經(jīng)歷了幾十年的發(fā)展。結(jié)合人工智能的演進(jìn)沿革,AIGC的發(fā)展歷程大致可以分為三個(gè)階段:早期萌芽階段、沉淀積累階段、快速發(fā)展階段:
在早期萌芽階段(1950s-1990s),受限于當(dāng)時(shí)的科技水平,AIGC僅限于小范圍實(shí)驗(yàn)。1966年,約瑟夫·魏岑鮑姆和肯尼斯·科爾比開(kāi)發(fā)了世界第一款可人機(jī)對(duì)話的機(jī)器人Eliza。80年代中期,IBM創(chuàng)造了語(yǔ)音控制打字機(jī)Tangora。
在沉淀積累階段(1990s-2010s),AIGC從實(shí)驗(yàn)性向?qū)嵱眯灾饾u轉(zhuǎn)變。2006年,深度學(xué)習(xí)算法、圖形處理器、張量處理器等都取得了重大突破。2012年,微軟公開(kāi)展示了一個(gè)全自動(dòng)同聲傳譯系統(tǒng),可以自動(dòng)將英文演講者的內(nèi)容通過(guò)語(yǔ)音識(shí)別、語(yǔ)言翻譯、語(yǔ)音合成等技術(shù)生成中文語(yǔ)音。
在快速發(fā)展階段(2010s至今),深度學(xué)習(xí)模型不斷迭代,AIGC獲得快速突破性發(fā)展。2014年,對(duì)抗生產(chǎn)網(wǎng)絡(luò)GAN出現(xiàn)。2021年,CLIP模型出現(xiàn);OpenAI推出DALL-E,主要應(yīng)用于文本與圖像交互生成內(nèi)容。
而在2022年,深度學(xué)習(xí)模型Diffusion擴(kuò)散化模型的出現(xiàn),更是直接推動(dòng)了AIGC技術(shù)的突破性發(fā)展,許多基于StableDiffusion模型的應(yīng)用紛紛入局,也正因如此,2022年出現(xiàn)了AIGC應(yīng)用“井噴”現(xiàn)象,也被稱(chēng)為AIGC元年。
國(guó)際大廠紛紛入局,諸多行業(yè)正在被重新定義。
在AIGC的落地應(yīng)用中,僅有先進(jìn)的算法模型遠(yuǎn)遠(yuǎn)不夠,還需要廠商完成場(chǎng)景化的應(yīng)用開(kāi)發(fā)。目前,谷歌、Meta、微軟等國(guó)際互聯(lián)網(wǎng)大廠早已入局,用AI實(shí)力及技術(shù)應(yīng)用推動(dòng)AIGC的風(fēng)潮席卷了全球,正重新定義著諸多行業(yè)。
在世界范圍內(nèi)AIGC應(yīng)用如火如荼的發(fā)展之下,百度、騰訊、阿里、字節(jié)跳動(dòng)、網(wǎng)易等國(guó)內(nèi)大廠也紛紛跟進(jìn),在AIGC領(lǐng)域內(nèi)動(dòng)作頻頻。但要說(shuō)起誰(shuí)更能代表中國(guó)AIGC的發(fā)展,必然當(dāng)百度莫屬。
百度基于在深度學(xué)習(xí)平臺(tái)、大模型上等底層技術(shù)上的積累,以及對(duì)人工智能發(fā)展趨勢(shì)的前瞻性布局,搶占先機(jī),成為全球AIGC發(fā)展領(lǐng)導(dǎo)者之一。目前,百度研發(fā)的文心大模型已經(jīng)憑借其強(qiáng)大的內(nèi)容生成能力,極大地推動(dòng)了AIGC的發(fā)展:
文心大模型中的ERNIE 3.0 Zeus,讓每個(gè)人都能成為天才編劇。想要成為天才編劇,就一定要具備強(qiáng)大的學(xué)習(xí)能力,而文心能從豐富多樣的無(wú)標(biāo)注數(shù)據(jù)中自主學(xué)習(xí),同時(shí)在學(xué)習(xí)的過(guò)程中融入知識(shí)圖譜,大幅提升學(xué)習(xí)效率。還可以跨越不同的形式,進(jìn)行知識(shí)的儲(chǔ)備、融合,勝任多種語(yǔ)言理解和生成任務(wù),成為了一個(gè)名副其實(shí)的“通才”。
除了作為一個(gè)優(yōu)秀的學(xué)習(xí)者、創(chuàng)作者之外,文心大模型還可以勝任美術(shù)師、插畫(huà)師的工作。文心大模型中的ERNIE-ViLG 2.0使用了擴(kuò)散模型,引入了語(yǔ)言、視覺(jué)等多源知識(shí),并在多個(gè)階段選擇不同網(wǎng)絡(luò)來(lái)進(jìn)行建模,實(shí)現(xiàn)了能根據(jù)一句話或者一段描述文本生成一幅精美的畫(huà)作的要求。
在靜態(tài)的文字與畫(huà)作外,制作動(dòng)態(tài)的視頻對(duì)文心來(lái)說(shuō)也是小菜一碟。文心大模型可在文生圖的基礎(chǔ)上通過(guò)添加時(shí)序建模的方法更進(jìn)一步,使得模型能根據(jù)文本或者圖像生成新的視頻,而且可根據(jù)需求,調(diào)節(jié)生成視頻片段的時(shí)長(zhǎng),提升視覺(jué)內(nèi)容生產(chǎn)效果和效率,實(shí)現(xiàn)文生視頻、文剪視頻、修復(fù)視頻的功能。
二、百度的AIGC“答案”
在國(guó)外,谷歌、Meta、微軟積極布局,在AIGC領(lǐng)域做得風(fēng)生水起,讓人們看到了人工智能生成內(nèi)容的前景。而在國(guó)內(nèi)AIGC領(lǐng)域,綜合技術(shù)水平與應(yīng)用向的豐富性,行業(yè)第一非百度莫屬。
每年,百度總會(huì)在舉辦AI開(kāi)發(fā)者大會(huì)的時(shí)候發(fā)布最新技術(shù)進(jìn)展,而這,也是觀察國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展?fàn)顩r的最好窗口之一。
在今年百度的Create暨AI開(kāi)發(fā)者大會(huì)上,介紹的各項(xiàng)技術(shù)讓人眼前一亮,將AI的應(yīng)用提升到了一個(gè)新高度:
人工智能走向千行百業(yè),“深度學(xué)習(xí)+”已成各領(lǐng)域推動(dòng)創(chuàng)新發(fā)展新引擎。
伴隨著算法、算力、數(shù)據(jù)的不斷發(fā)展,深度學(xué)習(xí)技術(shù)及產(chǎn)業(yè)應(yīng)用也正在發(fā)生著巨大的變化。從深度學(xué)習(xí)技術(shù)的興起,到產(chǎn)業(yè)鏈的形成,再到深度跨界融合,深度學(xué)習(xí)已經(jīng)進(jìn)入了一個(gè)全新的發(fā)展階段——“深度學(xué)習(xí)+”。
從技術(shù)角度看,深度學(xué)習(xí)+海量知識(shí),推動(dòng)了人工智能技術(shù)創(chuàng)新突破。通過(guò)讓機(jī)器在海量數(shù)據(jù)與大規(guī)模知識(shí)中學(xué)習(xí)的方法,可以不斷提高AI學(xué)習(xí)效率,完善模型效果,實(shí)現(xiàn)創(chuàng)新突破,最終能更好地幫助人類(lèi)完成工作。舉例來(lái)說(shuō),“文心一格”便是通過(guò)知識(shí)增強(qiáng)跨模態(tài)大模型,通過(guò)從語(yǔ)言、視覺(jué)等知識(shí)中不斷融合學(xué)習(xí),最終實(shí)現(xiàn)“一言成畫(huà)”功能的。
從生態(tài)角度看,深度學(xué)習(xí)+上下游產(chǎn)業(yè),助力形成完整產(chǎn)業(yè)鏈。目前,深度學(xué)習(xí)已經(jīng)在芯片、框架、模型及應(yīng)用層面形成了深度學(xué)習(xí)完整的產(chǎn)業(yè)鏈。在芯片層面,成功推動(dòng)了軟硬件一體化;在框架層面,提供便捷開(kāi)發(fā)、高效訓(xùn)練、全域部署的能力;在模型層面,大幅降低產(chǎn)業(yè)應(yīng)用成本;在應(yīng)用層面,催生了一批新業(yè)態(tài)模式。四大層級(jí)共同擁抱深度學(xué)習(xí),實(shí)現(xiàn)整個(gè)產(chǎn)業(yè)鏈的持續(xù)迭代優(yōu)化。
從產(chǎn)業(yè)角度看,深度學(xué)習(xí)+千行百業(yè),有助于形成全產(chǎn)業(yè)良性循環(huán)。我國(guó)擁有門(mén)類(lèi)齊全、體系完整且規(guī)模龐大的產(chǎn)業(yè)體系,深度學(xué)習(xí)驅(qū)動(dòng)的創(chuàng)新,在中國(guó)擁有更加豐富的應(yīng)用場(chǎng)景,也有助于各行業(yè)形成良性循環(huán),促進(jìn)底層技術(shù)突破,加快現(xiàn)代產(chǎn)業(yè)化產(chǎn)業(yè)體系。
目前,人工智能已經(jīng)進(jìn)入了“深度學(xué)習(xí)+”的新階段,未來(lái),人工智能技術(shù)引領(lǐng)的新一輪科技革命和產(chǎn)業(yè)變革浪潮,將成為未來(lái)世界經(jīng)濟(jì)和高端產(chǎn)業(yè)的主導(dǎo)技術(shù),對(duì)中國(guó)現(xiàn)代化產(chǎn)業(yè)體系建設(shè)發(fā)揮無(wú)可替代的作用。
用大模型驅(qū)動(dòng)搜索進(jìn)化的“知一”、“千流”。
搜索作為互聯(lián)網(wǎng)用戶的剛需,是最核心的基礎(chǔ)應(yīng)用,隨著人們搜索需求的升級(jí),搜索技術(shù)也在越來(lái)越快速地演進(jìn)與發(fā)展,而百度將AI與搜索技術(shù)融合升級(jí),推出了兩項(xiàng)殺手锏技術(shù)——跨模態(tài)大模型“知一”、新一代搜索引擎“千流”。
跨模態(tài)大模型“知一”,助用戶搜索內(nèi)容更精確。
“知一”作為百度推出的跨模態(tài)大模型,具有業(yè)界領(lǐng)先的超大語(yǔ)義理解能力與全網(wǎng)視頻文本理解能力,可以在文本、圖片、視頻和結(jié)構(gòu)化信息中持續(xù)進(jìn)行海量知識(shí)資源的學(xué)習(xí)收集,打破資源形態(tài)界限,將最滿足用戶的搜索結(jié)果呈現(xiàn)出來(lái)。
其次,“知一”基于軟硬一體的定制硬件,通過(guò)百度自研的模型壓縮和預(yù)估優(yōu)化技術(shù),實(shí)現(xiàn)了近乎無(wú)損的大模型落地;另外,“知一”還依托飛槳高性能并行訓(xùn)練框架與百度昆侖芯片,構(gòu)建了業(yè)績(jī)領(lǐng)先的大規(guī)模預(yù)訓(xùn)練技術(shù)。兩者共同解決了搜索所需算力規(guī)模極大、推理能力極強(qiáng)的問(wèn)題,為用戶提供更加快速、精確的搜索服務(wù)。
新一代搜索引擎“千流”,讓搜索更高效、更快速。
搜索所需要處理的數(shù)據(jù)規(guī)模特別大,但又需要在毫秒之間完成整個(gè)過(guò)程,在數(shù)千億的資源中最快速地找到最滿足用戶需求的內(nèi)容,傳統(tǒng)搜索引擎建立了強(qiáng)大的分布式系統(tǒng),通過(guò)算力的堆積完成任務(wù),但該方法性能消耗巨大,同時(shí)搜索內(nèi)容不充分,某些優(yōu)質(zhì)內(nèi)容無(wú)法呈現(xiàn)給用戶,已不再適應(yīng)當(dāng)前的時(shí)代。
而新檢索系統(tǒng)“千流”,依托于大模型對(duì)的內(nèi)容深度理解,將不同維度的信息進(jìn)行智能有序的組織,將傳統(tǒng)索引升級(jí)為多領(lǐng)域多維度表達(dá)的立體柵格化索引, 同時(shí)通過(guò)模型對(duì)每一個(gè)請(qǐng)求進(jìn)行分析,實(shí)現(xiàn)千億分領(lǐng)域內(nèi)容深度觸達(dá),在不消耗巨量算力的前提下,更快速地找到所需內(nèi)容。
展望2023,立足于大模型產(chǎn)業(yè)化應(yīng)用的元年,提高產(chǎn)業(yè)效用、跑通技術(shù)提升與經(jīng)濟(jì)增長(zhǎng)的循環(huán),或許遠(yuǎn)比實(shí)現(xiàn)某個(gè)新技術(shù)的落地應(yīng)用更加重要。
而在大會(huì)中,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏便進(jìn)行了名為“創(chuàng)新驅(qū)動(dòng)增長(zhǎng),反饋驅(qū)動(dòng)創(chuàng)新”的演講,講述了百度在經(jīng)營(yíng)發(fā)展中,客戶端與技術(shù)端如何相互促進(jìn),推出優(yōu)秀產(chǎn)品的實(shí)踐經(jīng)驗(yàn),人工智能技術(shù)的發(fā)展,進(jìn)一步打通了這個(gè)循環(huán)。
“科技創(chuàng)新驅(qū)動(dòng)了大的增長(zhǎng),外部反饋又驅(qū)動(dòng)了科技創(chuàng)新”,李彥宏如是說(shuō)。
而在這一循環(huán)中,人工智能技術(shù)的發(fā)展,便是大大拉近了科技創(chuàng)新與增長(zhǎng)之間的距離。
以百度飛槳為例,目前已經(jīng)凝聚了超五百萬(wàn)開(kāi)發(fā)者,服務(wù)于二十余萬(wàn)家企事業(yè)單位。通過(guò)百度自研的深度學(xué)習(xí)框架,讓開(kāi)發(fā)者能夠像搭積木一樣構(gòu)建AI應(yīng)用,大大降低AI的應(yīng)用門(mén)檻,讓創(chuàng)新持續(xù)發(fā)生,進(jìn)而促進(jìn)頂層的商業(yè)更加繁榮。
在演講末尾,李彥宏還以“危機(jī)和希望”為關(guān)鍵詞,在百度AI作畫(huà)平臺(tái)一格上,由人工智能自動(dòng)生成了這樣一幅畫(huà),以鼓勵(lì)所有的參會(huì)者。
“生機(jī)勃勃的新生命已經(jīng)破冰而出,然而寒冷還沒(méi)有完全褪去所有偉大的企業(yè)、偉大的創(chuàng)造者也是一樣,沒(méi)有一帆風(fēng)順,只有不斷地歷經(jīng)困難再凱旋。困難會(huì)刺激創(chuàng)新,而創(chuàng)新是增長(zhǎng)的真正動(dòng)力?!?/p>
三、AIGC背后的“大學(xué)”
一個(gè)產(chǎn)業(yè)的發(fā)展,依靠的絕不僅是尖端技術(shù)的進(jìn)步,更需要的是人才隊(duì)伍的培養(yǎng),而AI行業(yè)的發(fā)展更是如此。當(dāng)前全球范圍內(nèi),AI行業(yè)酣戰(zhàn)初始,其中對(duì)人才的競(jìng)爭(zhēng)已然激烈起來(lái)。
截至2021年,全球已經(jīng)有超39個(gè)國(guó)家和地區(qū)制定了人工智能戰(zhàn)略政策,并普遍將人才培養(yǎng)作為了戰(zhàn)略重點(diǎn),布局和搶占人工智能高地愈發(fā)成為各國(guó)的共識(shí)。
盡管各國(guó)在政策端、資金端提供了很大支持,但人才培養(yǎng)并非一蹴而就,仍然存在著大量的缺口。其中,我國(guó)AI行業(yè)人才培養(yǎng),就存在著人才不足、崗位錯(cuò)配、質(zhì)量不高的情況。
從業(yè)內(nèi)人才數(shù)量來(lái)看,中國(guó)AI產(chǎn)業(yè)人才缺口很大。
人社部等3部門(mén)聯(lián)合發(fā)布的報(bào)告中指出,根據(jù)測(cè)算,我國(guó)人工智能人才目前缺口超過(guò)500萬(wàn),國(guó)內(nèi)供求比例為1:10,如不加強(qiáng)人才培養(yǎng),至2025年人才缺口將突破1000萬(wàn)。
從崗位類(lèi)型來(lái)看,我國(guó)AI技術(shù)類(lèi)崗位人才供需比遠(yuǎn)遠(yuǎn)不足。
從具體的技術(shù)方向來(lái)看,人工智能芯片、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)崗位的人才供需比均低于0.4,人才供應(yīng)嚴(yán)重不足,特別是智能語(yǔ)音、計(jì)算機(jī)視覺(jué)方向,人才供需比僅為 0.08和 0.09,急需加快技術(shù)類(lèi)崗位的人才培養(yǎng)。
從人才質(zhì)量上來(lái)看,求職者的能力與AI雇主的要求相差較遠(yuǎn)。
據(jù)調(diào)查發(fā)現(xiàn),近三成AI領(lǐng)域的求職者與雇主所要求的各項(xiàng)指標(biāo)相距甚遠(yuǎn),背后原因包括學(xué)歷過(guò)低、經(jīng)驗(yàn)不足、缺乏實(shí)際技能等。同時(shí),鑒于合格AI人才特別是高學(xué)歷AI人才的培養(yǎng)所需時(shí)間遠(yuǎn)高于一般 IT 人才,這意味著人才質(zhì)量導(dǎo)致的人才缺口可能難以在短期內(nèi)得到有效解決。
面對(duì)如此大的人才缺口,諸如百度等國(guó)內(nèi)AI公司主動(dòng)擔(dān)當(dāng)起了為社會(huì)、為產(chǎn)業(yè)培養(yǎng)AI人才的責(zé)任。數(shù)據(jù)顯示,在過(guò)去三年中,百度為社會(huì)培養(yǎng)、輸送超300萬(wàn)AI人才,同時(shí),還組織推進(jìn)了多個(gè)人才培養(yǎng)計(jì)劃,共同助力行業(yè)發(fā)展:
百度與全國(guó)百余校所高校、十余家職業(yè)教育集團(tuán)達(dá)成深度合作,投入超過(guò)千萬(wàn)基金,累計(jì)免費(fèi)培訓(xùn)4100多名AI相關(guān)專(zhuān)業(yè)教師,為人才的成長(zhǎng)提供了沃土。
除了對(duì)教師的支持外,百度還設(shè)立了專(zhuān)項(xiàng)獎(jiǎng)學(xué)金,資助行業(yè)內(nèi)優(yōu)秀的華人學(xué)生,該獎(jiǎng)也是國(guó)內(nèi)AI領(lǐng)域資助金額與含金量最高的學(xué)術(shù)獎(jiǎng)學(xué)金之一,被業(yè)內(nèi)譽(yù)為“人才認(rèn)證書(shū)”與“行業(yè)風(fēng)向標(biāo)”。
在象牙塔之外,十幾年來(lái),百度還舉辦了多屆AI行業(yè)的高端競(jìng)賽,在更為廣泛的范圍內(nèi),為企業(yè)和社會(huì)選拔出大量頂尖人工智能人才。無(wú)數(shù)編程人才通過(guò)大賽脫穎而出,而其中的百度之星程序設(shè)計(jì)大賽更是被譽(yù)為國(guó)內(nèi)程序員的“造星工場(chǎng)”,為社會(huì)選拔輸送了一批又一批頂尖人才。
AI企業(yè)們,正在承擔(dān)起AI知識(shí)界如同大學(xué)與研究院一樣的存在,源源不斷輸出著AI人才與知識(shí)體系。
四、寫(xiě)在最后
AI已經(jīng)從技術(shù)走向生活。
ChatGPT這樣爆火的AIGC應(yīng)用,只是當(dāng)前AIGC落地了眾多的應(yīng)用場(chǎng)景中很小的一個(gè)。
作為新一代創(chuàng)作方式,AIGC是數(shù)智時(shí)代的典型應(yīng)用創(chuàng)新。它的快速發(fā)展不僅革新了數(shù)字文化創(chuàng)作的生產(chǎn)范式,也在快速改變?nèi)祟?lèi)與人工智能的交互模式,并越來(lái)越多地輻射到了各行各業(yè)中。
同時(shí),伴隨著數(shù)據(jù)、算法、算力等核心技術(shù)的突破,AIGC技術(shù)仍在持續(xù)進(jìn)步中,推動(dòng)著內(nèi)容生產(chǎn)向更有自主性的方向發(fā)展。
而如此快速的AI技術(shù)革新與應(yīng)用落地背后,是眾多像百度一樣的公司在培養(yǎng)和輸出萬(wàn)千AI人才和知識(shí)體系。
可以預(yù)見(jiàn)的是,在全球數(shù)智化大勢(shì)之下,在政策的支持和鼓舞,業(yè)界如百度一樣眾多科技企業(yè)的合力推動(dòng)下,未來(lái)的某一天,當(dāng)技術(shù)跨越某個(gè)奇點(diǎn),AI不僅能帶來(lái)生產(chǎn)力的革新與進(jìn)化,更能帶來(lái)創(chuàng)造力與想象力的延伸與散漫。
作者:奇偶派
來(lái)源公眾號(hào):奇偶派(ID:jioupai),講述商業(yè)故事,厘清商業(yè)邏輯,探索商業(yè)模式
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @奇偶派 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術(shù)應(yīng)用非人工智能生成內(nèi)容(AIGC)莫屬。那么,AIGC行業(yè)的發(fā)展?fàn)顩r如何呢?百度們?cè)谧鍪裁茨兀孔屛覀円黄饋?lái)看看作者的看法吧。
回顧2022年,出圈次數(shù)最多,引起人們討論最廣泛的技術(shù)應(yīng)用非人工智能生成內(nèi)容(AIGC)莫屬。
年中,AI畫(huà)作《太空歌劇院》在科羅拉多州博覽會(huì)藝術(shù)比賽中一舉奪魁,引起了人們對(duì)AI創(chuàng)作合理性的激烈討論。
年末,ChatGPT橫空出世,技驚四座,出色地回答了人類(lèi)提出的各種問(wèn)題,讓許多人感嘆“這是我見(jiàn)過(guò)最像AI的AI”,掀起了與人工智能對(duì)話的熱潮。
而在今年的百度AI開(kāi)發(fā)者大會(huì)中,百度技術(shù)委員會(huì)主席吳華介紹了文心大模型的視頻內(nèi)容生成與編輯技術(shù),讓一言化視頻成為了現(xiàn)實(shí),賦予了每個(gè)人都能成為制片人的機(jī)會(huì),引起了人們的廣泛關(guān)注。
在這多次爆火出圈的背后,真正讓人感嘆的其實(shí)是人工智能技術(shù)的飛速發(fā)展。那么,AIGC的發(fā)展到底經(jīng)歷了哪些階段,為何集中于2022年“井噴”式爆發(fā)?我們的生活又將怎樣被AIGC改變?立足當(dāng)下,AIGC行業(yè)的發(fā)展?fàn)顩r又是如何呢?
一、AIGC的萬(wàn)千“面孔”
歷經(jīng)數(shù)十年發(fā)展,深度學(xué)習(xí)模型不斷迭代,AIGC迎來(lái)突破性發(fā)展。
在各類(lèi)使用AIGC技術(shù)的應(yīng)用大規(guī)?!熬畤姟敝?,AIGC也曾經(jīng)歷了幾十年的發(fā)展。結(jié)合人工智能的演進(jìn)沿革,AIGC的發(fā)展歷程大致可以分為三個(gè)階段:早期萌芽階段、沉淀積累階段、快速發(fā)展階段:
在早期萌芽階段(1950s-1990s),受限于當(dāng)時(shí)的科技水平,AIGC僅限于小范圍實(shí)驗(yàn)。1966年,約瑟夫·魏岑鮑姆和肯尼斯·科爾比開(kāi)發(fā)了世界第一款可人機(jī)對(duì)話的機(jī)器人Eliza。80年代中期,IBM創(chuàng)造了語(yǔ)音控制打字機(jī)Tangora。
在沉淀積累階段(1990s-2010s),AIGC從實(shí)驗(yàn)性向?qū)嵱眯灾饾u轉(zhuǎn)變。2006年,深度學(xué)習(xí)算法、圖形處理器、張量處理器等都取得了重大突破。2012年,微軟公開(kāi)展示了一個(gè)全自動(dòng)同聲傳譯系統(tǒng),可以自動(dòng)將英文演講者的內(nèi)容通過(guò)語(yǔ)音識(shí)別、語(yǔ)言翻譯、語(yǔ)音合成等技術(shù)生成中文語(yǔ)音。
在快速發(fā)展階段(2010s至今),深度學(xué)習(xí)模型不斷迭代,AIGC獲得快速突破性發(fā)展。2014年,對(duì)抗生產(chǎn)網(wǎng)絡(luò)GAN出現(xiàn)。2021年,CLIP模型出現(xiàn);OpenAI推出DALL-E,主要應(yīng)用于文本與圖像交互生成內(nèi)容。
而在2022年,深度學(xué)習(xí)模型Diffusion擴(kuò)散化模型的出現(xiàn),更是直接推動(dòng)了AIGC技術(shù)的突破性發(fā)展,許多基于StableDiffusion模型的應(yīng)用紛紛入局,也正因如此,2022年出現(xiàn)了AIGC應(yīng)用“井噴”現(xiàn)象,也被稱(chēng)為AIGC元年。
國(guó)際大廠紛紛入局,諸多行業(yè)正在被重新定義。
在AIGC的落地應(yīng)用中,僅有先進(jìn)的算法模型遠(yuǎn)遠(yuǎn)不夠,還需要廠商完成場(chǎng)景化的應(yīng)用開(kāi)發(fā)。目前,谷歌、Meta、微軟等國(guó)際互聯(lián)網(wǎng)大廠早已入局,用AI實(shí)力及技術(shù)應(yīng)用推動(dòng)AIGC的風(fēng)潮席卷了全球,正重新定義著諸多行業(yè)。
在世界范圍內(nèi)AIGC應(yīng)用如火如荼的發(fā)展之下,百度、騰訊、阿里、字節(jié)跳動(dòng)、網(wǎng)易等國(guó)內(nèi)大廠也紛紛跟進(jìn),在AIGC領(lǐng)域內(nèi)動(dòng)作頻頻。但要說(shuō)起誰(shuí)更能代表中國(guó)AIGC的發(fā)展,必然當(dāng)百度莫屬。
百度基于在深度學(xué)習(xí)平臺(tái)、大模型上等底層技術(shù)上的積累,以及對(duì)人工智能發(fā)展趨勢(shì)的前瞻性布局,搶占先機(jī),成為全球AIGC發(fā)展領(lǐng)導(dǎo)者之一。目前,百度研發(fā)的文心大模型已經(jīng)憑借其強(qiáng)大的內(nèi)容生成能力,極大地推動(dòng)了AIGC的發(fā)展:
文心大模型中的ERNIE 3.0 Zeus,讓每個(gè)人都能成為天才編劇。想要成為天才編劇,就一定要具備強(qiáng)大的學(xué)習(xí)能力,而文心能從豐富多樣的無(wú)標(biāo)注數(shù)據(jù)中自主學(xué)習(xí),同時(shí)在學(xué)習(xí)的過(guò)程中融入知識(shí)圖譜,大幅提升學(xué)習(xí)效率。還可以跨越不同的形式,進(jìn)行知識(shí)的儲(chǔ)備、融合,勝任多種語(yǔ)言理解和生成任務(wù),成為了一個(gè)名副其實(shí)的“通才”。
除了作為一個(gè)優(yōu)秀的學(xué)習(xí)者、創(chuàng)作者之外,文心大模型還可以勝任美術(shù)師、插畫(huà)師的工作。文心大模型中的ERNIE-ViLG 2.0使用了擴(kuò)散模型,引入了語(yǔ)言、視覺(jué)等多源知識(shí),并在多個(gè)階段選擇不同網(wǎng)絡(luò)來(lái)進(jìn)行建模,實(shí)現(xiàn)了能根據(jù)一句話或者一段描述文本生成一幅精美的畫(huà)作的要求。
在靜態(tài)的文字與畫(huà)作外,制作動(dòng)態(tài)的視頻對(duì)文心來(lái)說(shuō)也是小菜一碟。文心大模型可在文生圖的基礎(chǔ)上通過(guò)添加時(shí)序建模的方法更進(jìn)一步,使得模型能根據(jù)文本或者圖像生成新的視頻,而且可根據(jù)需求,調(diào)節(jié)生成視頻片段的時(shí)長(zhǎng),提升視覺(jué)內(nèi)容生產(chǎn)效果和效率,實(shí)現(xiàn)文生視頻、文剪視頻、修復(fù)視頻的功能。
二、百度的AIGC“答案”
在國(guó)外,谷歌、Meta、微軟積極布局,在AIGC領(lǐng)域做得風(fēng)生水起,讓人們看到了人工智能生成內(nèi)容的前景。而在國(guó)內(nèi)AIGC領(lǐng)域,綜合技術(shù)水平與應(yīng)用向的豐富性,行業(yè)第一非百度莫屬。
每年,百度總會(huì)在舉辦AI開(kāi)發(fā)者大會(huì)的時(shí)候發(fā)布最新技術(shù)進(jìn)展,而這,也是觀察國(guó)內(nèi)AI產(chǎn)業(yè)發(fā)展?fàn)顩r的最好窗口之一。
在今年百度的Create暨AI開(kāi)發(fā)者大會(huì)上,介紹的各項(xiàng)技術(shù)讓人眼前一亮,將AI的應(yīng)用提升到了一個(gè)新高度:
人工智能走向千行百業(yè),“深度學(xué)習(xí)+”已成各領(lǐng)域推動(dòng)創(chuàng)新發(fā)展新引擎。
伴隨著算法、算力、數(shù)據(jù)的不斷發(fā)展,深度學(xué)習(xí)技術(shù)及產(chǎn)業(yè)應(yīng)用也正在發(fā)生著巨大的變化。從深度學(xué)習(xí)技術(shù)的興起,到產(chǎn)業(yè)鏈的形成,再到深度跨界融合,深度學(xué)習(xí)已經(jīng)進(jìn)入了一個(gè)全新的發(fā)展階段——“深度學(xué)習(xí)+”。
從技術(shù)角度看,深度學(xué)習(xí)+海量知識(shí),推動(dòng)了人工智能技術(shù)創(chuàng)新突破。通過(guò)讓機(jī)器在海量數(shù)據(jù)與大規(guī)模知識(shí)中學(xué)習(xí)的方法,可以不斷提高AI學(xué)習(xí)效率,完善模型效果,實(shí)現(xiàn)創(chuàng)新突破,最終能更好地幫助人類(lèi)完成工作。舉例來(lái)說(shuō),“文心一格”便是通過(guò)知識(shí)增強(qiáng)跨模態(tài)大模型,通過(guò)從語(yǔ)言、視覺(jué)等知識(shí)中不斷融合學(xué)習(xí),最終實(shí)現(xiàn)“一言成畫(huà)”功能的。
從生態(tài)角度看,深度學(xué)習(xí)+上下游產(chǎn)業(yè),助力形成完整產(chǎn)業(yè)鏈。目前,深度學(xué)習(xí)已經(jīng)在芯片、框架、模型及應(yīng)用層面形成了深度學(xué)習(xí)完整的產(chǎn)業(yè)鏈。在芯片層面,成功推動(dòng)了軟硬件一體化;在框架層面,提供便捷開(kāi)發(fā)、高效訓(xùn)練、全域部署的能力;在模型層面,大幅降低產(chǎn)業(yè)應(yīng)用成本;在應(yīng)用層面,催生了一批新業(yè)態(tài)模式。四大層級(jí)共同擁抱深度學(xué)習(xí),實(shí)現(xiàn)整個(gè)產(chǎn)業(yè)鏈的持續(xù)迭代優(yōu)化。
從產(chǎn)業(yè)角度看,深度學(xué)習(xí)+千行百業(yè),有助于形成全產(chǎn)業(yè)良性循環(huán)。我國(guó)擁有門(mén)類(lèi)齊全、體系完整且規(guī)模龐大的產(chǎn)業(yè)體系,深度學(xué)習(xí)驅(qū)動(dòng)的創(chuàng)新,在中國(guó)擁有更加豐富的應(yīng)用場(chǎng)景,也有助于各行業(yè)形成良性循環(huán),促進(jìn)底層技術(shù)突破,加快現(xiàn)代產(chǎn)業(yè)化產(chǎn)業(yè)體系。
目前,人工智能已經(jīng)進(jìn)入了“深度學(xué)習(xí)+”的新階段,未來(lái),人工智能技術(shù)引領(lǐng)的新一輪科技革命和產(chǎn)業(yè)變革浪潮,將成為未來(lái)世界經(jīng)濟(jì)和高端產(chǎn)業(yè)的主導(dǎo)技術(shù),對(duì)中國(guó)現(xiàn)代化產(chǎn)業(yè)體系建設(shè)發(fā)揮無(wú)可替代的作用。
用大模型驅(qū)動(dòng)搜索進(jìn)化的“知一”、“千流”。
搜索作為互聯(lián)網(wǎng)用戶的剛需,是最核心的基礎(chǔ)應(yīng)用,隨著人們搜索需求的升級(jí),搜索技術(shù)也在越來(lái)越快速地演進(jìn)與發(fā)展,而百度將AI與搜索技術(shù)融合升級(jí),推出了兩項(xiàng)殺手锏技術(shù)——跨模態(tài)大模型“知一”、新一代搜索引擎“千流”。
跨模態(tài)大模型“知一”,助用戶搜索內(nèi)容更精確。
“知一”作為百度推出的跨模態(tài)大模型,具有業(yè)界領(lǐng)先的超大語(yǔ)義理解能力與全網(wǎng)視頻文本理解能力,可以在文本、圖片、視頻和結(jié)構(gòu)化信息中持續(xù)進(jìn)行海量知識(shí)資源的學(xué)習(xí)收集,打破資源形態(tài)界限,將最滿足用戶的搜索結(jié)果呈現(xiàn)出來(lái)。
其次,“知一”基于軟硬一體的定制硬件,通過(guò)百度自研的模型壓縮和預(yù)估優(yōu)化技術(shù),實(shí)現(xiàn)了近乎無(wú)損的大模型落地;另外,“知一”還依托飛槳高性能并行訓(xùn)練框架與百度昆侖芯片,構(gòu)建了業(yè)績(jī)領(lǐng)先的大規(guī)模預(yù)訓(xùn)練技術(shù)。兩者共同解決了搜索所需算力規(guī)模極大、推理能力極強(qiáng)的問(wèn)題,為用戶提供更加快速、精確的搜索服務(wù)。
新一代搜索引擎“千流”,讓搜索更高效、更快速。
搜索所需要處理的數(shù)據(jù)規(guī)模特別大,但又需要在毫秒之間完成整個(gè)過(guò)程,在數(shù)千億的資源中最快速地找到最滿足用戶需求的內(nèi)容,傳統(tǒng)搜索引擎建立了強(qiáng)大的分布式系統(tǒng),通過(guò)算力的堆積完成任務(wù),但該方法性能消耗巨大,同時(shí)搜索內(nèi)容不充分,某些優(yōu)質(zhì)內(nèi)容無(wú)法呈現(xiàn)給用戶,已不再適應(yīng)當(dāng)前的時(shí)代。
而新檢索系統(tǒng)“千流”,依托于大模型對(duì)的內(nèi)容深度理解,將不同維度的信息進(jìn)行智能有序的組織,將傳統(tǒng)索引升級(jí)為多領(lǐng)域多維度表達(dá)的立體柵格化索引, 同時(shí)通過(guò)模型對(duì)每一個(gè)請(qǐng)求進(jìn)行分析,實(shí)現(xiàn)千億分領(lǐng)域內(nèi)容深度觸達(dá),在不消耗巨量算力的前提下,更快速地找到所需內(nèi)容。
展望2023,立足于大模型產(chǎn)業(yè)化應(yīng)用的元年,提高產(chǎn)業(yè)效用、跑通技術(shù)提升與經(jīng)濟(jì)增長(zhǎng)的循環(huán),或許遠(yuǎn)比實(shí)現(xiàn)某個(gè)新技術(shù)的落地應(yīng)用更加重要。
而在大會(huì)中,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏便進(jìn)行了名為“創(chuàng)新驅(qū)動(dòng)增長(zhǎng),反饋驅(qū)動(dòng)創(chuàng)新”的演講,講述了百度在經(jīng)營(yíng)發(fā)展中,客戶端與技術(shù)端如何相互促進(jìn),推出優(yōu)秀產(chǎn)品的實(shí)踐經(jīng)驗(yàn),人工智能技術(shù)的發(fā)展,進(jìn)一步打通了這個(gè)循環(huán)。
“科技創(chuàng)新驅(qū)動(dòng)了大的增長(zhǎng),外部反饋又驅(qū)動(dòng)了科技創(chuàng)新”,李彥宏如是說(shuō)。
而在這一循環(huán)中,人工智能技術(shù)的發(fā)展,便是大大拉近了科技創(chuàng)新與增長(zhǎng)之間的距離。
以百度飛槳為例,目前已經(jīng)凝聚了超五百萬(wàn)開(kāi)發(fā)者,服務(wù)于二十余萬(wàn)家企事業(yè)單位。通過(guò)百度自研的深度學(xué)習(xí)框架,讓開(kāi)發(fā)者能夠像搭積木一樣構(gòu)建AI應(yīng)用,大大降低AI的應(yīng)用門(mén)檻,讓創(chuàng)新持續(xù)發(fā)生,進(jìn)而促進(jìn)頂層的商業(yè)更加繁榮。
在演講末尾,李彥宏還以“危機(jī)和希望”為關(guān)鍵詞,在百度AI作畫(huà)平臺(tái)一格上,由人工智能自動(dòng)生成了這樣一幅畫(huà),以鼓勵(lì)所有的參會(huì)者。
“生機(jī)勃勃的新生命已經(jīng)破冰而出,然而寒冷還沒(méi)有完全褪去所有偉大的企業(yè)、偉大的創(chuàng)造者也是一樣,沒(méi)有一帆風(fēng)順,只有不斷地歷經(jīng)困難再凱旋。困難會(huì)刺激創(chuàng)新,而創(chuàng)新是增長(zhǎng)的真正動(dòng)力?!?/p>
三、AIGC背后的“大學(xué)”
一個(gè)產(chǎn)業(yè)的發(fā)展,依靠的絕不僅是尖端技術(shù)的進(jìn)步,更需要的是人才隊(duì)伍的培養(yǎng),而AI行業(yè)的發(fā)展更是如此。當(dāng)前全球范圍內(nèi),AI行業(yè)酣戰(zhàn)初始,其中對(duì)人才的競(jìng)爭(zhēng)已然激烈起來(lái)。
截至2021年,全球已經(jīng)有超39個(gè)國(guó)家和地區(qū)制定了人工智能戰(zhàn)略政策,并普遍將人才培養(yǎng)作為了戰(zhàn)略重點(diǎn),布局和搶占人工智能高地愈發(fā)成為各國(guó)的共識(shí)。
盡管各國(guó)在政策端、資金端提供了很大支持,但人才培養(yǎng)并非一蹴而就,仍然存在著大量的缺口。其中,我國(guó)AI行業(yè)人才培養(yǎng),就存在著人才不足、崗位錯(cuò)配、質(zhì)量不高的情況。
從業(yè)內(nèi)人才數(shù)量來(lái)看,中國(guó)AI產(chǎn)業(yè)人才缺口很大。
人社部等3部門(mén)聯(lián)合發(fā)布的報(bào)告中指出,根據(jù)測(cè)算,我國(guó)人工智能人才目前缺口超過(guò)500萬(wàn),國(guó)內(nèi)供求比例為1:10,如不加強(qiáng)人才培養(yǎng),至2025年人才缺口將突破1000萬(wàn)。
從崗位類(lèi)型來(lái)看,我國(guó)AI技術(shù)類(lèi)崗位人才供需比遠(yuǎn)遠(yuǎn)不足。
從具體的技術(shù)方向來(lái)看,人工智能芯片、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)崗位的人才供需比均低于0.4,人才供應(yīng)嚴(yán)重不足,特別是智能語(yǔ)音、計(jì)算機(jī)視覺(jué)方向,人才供需比僅為 0.08和 0.09,急需加快技術(shù)類(lèi)崗位的人才培養(yǎng)。
從人才質(zhì)量上來(lái)看,求職者的能力與AI雇主的要求相差較遠(yuǎn)。
據(jù)調(diào)查發(fā)現(xiàn),近三成AI領(lǐng)域的求職者與雇主所要求的各項(xiàng)指標(biāo)相距甚遠(yuǎn),背后原因包括學(xué)歷過(guò)低、經(jīng)驗(yàn)不足、缺乏實(shí)際技能等。同時(shí),鑒于合格AI人才特別是高學(xué)歷AI人才的培養(yǎng)所需時(shí)間遠(yuǎn)高于一般 IT 人才,這意味著人才質(zhì)量導(dǎo)致的人才缺口可能難以在短期內(nèi)得到有效解決。
面對(duì)如此大的人才缺口,諸如百度等國(guó)內(nèi)AI公司主動(dòng)擔(dān)當(dāng)起了為社會(huì)、為產(chǎn)業(yè)培養(yǎng)AI人才的責(zé)任。數(shù)據(jù)顯示,在過(guò)去三年中,百度為社會(huì)培養(yǎng)、輸送超300萬(wàn)AI人才,同時(shí),還組織推進(jìn)了多個(gè)人才培養(yǎng)計(jì)劃,共同助力行業(yè)發(fā)展:
百度與全國(guó)百余校所高校、十余家職業(yè)教育集團(tuán)達(dá)成深度合作,投入超過(guò)千萬(wàn)基金,累計(jì)免費(fèi)培訓(xùn)4100多名AI相關(guān)專(zhuān)業(yè)教師,為人才的成長(zhǎng)提供了沃土。
除了對(duì)教師的支持外,百度還設(shè)立了專(zhuān)項(xiàng)獎(jiǎng)學(xué)金,資助行業(yè)內(nèi)優(yōu)秀的華人學(xué)生,該獎(jiǎng)也是國(guó)內(nèi)AI領(lǐng)域資助金額與含金量最高的學(xué)術(shù)獎(jiǎng)學(xué)金之一,被業(yè)內(nèi)譽(yù)為“人才認(rèn)證書(shū)”與“行業(yè)風(fēng)向標(biāo)”。
在象牙塔之外,十幾年來(lái),百度還舉辦了多屆AI行業(yè)的高端競(jìng)賽,在更為廣泛的范圍內(nèi),為企業(yè)和社會(huì)選拔出大量頂尖人工智能人才。無(wú)數(shù)編程人才通過(guò)大賽脫穎而出,而其中的百度之星程序設(shè)計(jì)大賽更是被譽(yù)為國(guó)內(nèi)程序員的“造星工場(chǎng)”,為社會(huì)選拔輸送了一批又一批頂尖人才。
AI企業(yè)們,正在承擔(dān)起AI知識(shí)界如同大學(xué)與研究院一樣的存在,源源不斷輸出著AI人才與知識(shí)體系。
四、寫(xiě)在最后
AI已經(jīng)從技術(shù)走向生活。
ChatGPT這樣爆火的AIGC應(yīng)用,只是當(dāng)前AIGC落地了眾多的應(yīng)用場(chǎng)景中很小的一個(gè)。
作為新一代創(chuàng)作方式,AIGC是數(shù)智時(shí)代的典型應(yīng)用創(chuàng)新。它的快速發(fā)展不僅革新了數(shù)字文化創(chuàng)作的生產(chǎn)范式,也在快速改變?nèi)祟?lèi)與人工智能的交互模式,并越來(lái)越多地輻射到了各行各業(yè)中。
同時(shí),伴隨著數(shù)據(jù)、算法、算力等核心技術(shù)的突破,AIGC技術(shù)仍在持續(xù)進(jìn)步中,推動(dòng)著內(nèi)容生產(chǎn)向更有自主性的方向發(fā)展。
而如此快速的AI技術(shù)革新與應(yīng)用落地背后,是眾多像百度一樣的公司在培養(yǎng)和輸出萬(wàn)千AI人才和知識(shí)體系。
可以預(yù)見(jiàn)的是,在全球數(shù)智化大勢(shì)之下,在政策的支持和鼓舞,業(yè)界如百度一樣眾多科技企業(yè)的合力推動(dòng)下,未來(lái)的某一天,當(dāng)技術(shù)跨越某個(gè)奇點(diǎn),AI不僅能帶來(lái)生產(chǎn)力的革新與進(jìn)化,更能帶來(lái)創(chuàng)造力與想象力的延伸與散漫。
作者:奇偶派
來(lái)源公眾號(hào):奇偶派(ID:jioupai),講述商業(yè)故事,厘清商業(yè)邏輯,探索商業(yè)模式
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @奇偶派 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!