2022,AIGC元年?

1 評(píng)論 12660 瀏覽 48 收藏 16 分鐘

在元宇宙、web3概念不斷火熱的情況下,AI憑借“創(chuàng)作”強(qiáng)勢(shì)崛起了。很多人說(shuō),AIGC或?qū)?huì)改變內(nèi)容領(lǐng)域的生產(chǎn)方式,帶來(lái)整個(gè)行業(yè)的變革,又或迎來(lái)不同時(shí)期的變化。2022年,真的是AIGC的元年嗎?

2022年12月16日,Science雜志發(fā)布了2022年度科學(xué)十大突破,韋伯望遠(yuǎn)鏡當(dāng)選為年度最大科學(xué)突破,可謂實(shí)至名歸。而在其他入選的科學(xué)突破中,AIGC也赫然在列。

這或許是當(dāng)下最炙手可熱的概念了。無(wú)論是火遍全網(wǎng)的AI繪畫,還是震驚世人的ChatGPT,都屬于AIGC這一概念,即生成式AI。憑借著諸多明星技術(shù)、產(chǎn)品的問(wèn)世,誰(shuí)也沒(méi)有想到,在元宇宙、web3等概念叱咤風(fēng)云的2022年里,AI憑借“創(chuàng)作”強(qiáng)勢(shì)崛起了。

有人認(rèn)為,AIGC將會(huì)改變內(nèi)容領(lǐng)域的生產(chǎn)方式,帶來(lái)整個(gè)行業(yè)的變革,也有人認(rèn)為AIGC將會(huì)取代大多數(shù)創(chuàng)作者,帶來(lái)災(zāi)難性的影響。在各種言論甚囂塵上之時(shí),一個(gè)共識(shí)似乎悄然達(dá)成了,從2022年開(kāi)始,AIGC將迎來(lái)完全不同的發(fā)展時(shí)期。

2022年,真的是AIGC的元年嗎?

一、AIGC編年史

首先明確一個(gè)定義,何為AIGC?

跟PGC、UGC、PUGC等概念一樣,AIGC即是指利用人工智能技術(shù)生成內(nèi)容,也就是說(shuō)內(nèi)容的制作者從實(shí)打?qū)嵉娜嘶驒C(jī)構(gòu)變成了AI。

AI繪畫最早要追溯2014年,GAN(生成式對(duì)抗網(wǎng)絡(luò))的誕生。據(jù)說(shuō)人工智能專家Ian Goodfellow在一次酒后想到了這一深度模型概念,基于CNN(深度卷積神經(jīng)網(wǎng)絡(luò)),GAN創(chuàng)造性地將兩個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)抗,即生成器與鑒別器。生成器用于生成“造假數(shù)據(jù)”,鑒別器用于判斷數(shù)據(jù)的真?zhèn)危趦烧叩膶?duì)抗中,逐漸演化出強(qiáng)大的“造假能力”,而這種造假能力則用于圖像的合成。

GAN被稱為21世紀(jì)最強(qiáng)大的算法模型之一,Ian Goodfellow也一躍成為AI領(lǐng)域最知名的專家之一。2015年開(kāi)始,GAN開(kāi)始被投入實(shí)際運(yùn)用中,相關(guān)的論文也爆發(fā)式增長(zhǎng),也成為AI生成圖像、處理圖像任務(wù)里最常見(jiàn)的存在。

在GAN大放異彩的2015年,一家公司在美國(guó)硅谷成立,其背后站著“鋼鐵俠”埃隆·馬斯克、Y Combinator總裁阿爾特曼、天使投資人彼得·泰爾等一眾硅谷大佬,這家公司就是ChatGPT的締造者——OpenAI。

OpenAI創(chuàng)立的初衷是預(yù)防人工智能帶來(lái)的災(zāi)難性影響,推動(dòng)人工智能發(fā)揮積極作用,雖為公司,但OpenAI是一家非營(yíng)利機(jī)構(gòu),是馬斯克等大佬用愛(ài)發(fā)電的產(chǎn)物,在創(chuàng)立之初,大佬們投入了10億美元用于AI的開(kāi)發(fā)。2016年,OpenAI進(jìn)一步明確了自己的目標(biāo),即向AGI(通用人工智能)研究發(fā)力,致力于讓AI成為改變?nèi)祟惿畹男录夹g(shù)。

OpenAI最大的特點(diǎn)即是“Open”,即開(kāi)放AI能力,全球研發(fā)者都可以通過(guò)其提供的開(kāi)發(fā)與研究框架投入AI開(kāi)發(fā)中,共同促進(jìn)AI技術(shù)的發(fā)展。也是從2016年開(kāi)始,OpenAI推出了自己的AI平臺(tái)Universe。故事轟轟烈烈地開(kāi)始了。

時(shí)間來(lái)到2018年,Transformer 架構(gòu)的發(fā)展改變了NLP(自然語(yǔ)言處理)技術(shù)的發(fā)展,預(yù)訓(xùn)練模型的引入改變了一切。GPT系列正是OpenAI在NLP(自然語(yǔ)言處理)領(lǐng)域打造的模型,其第一款產(chǎn)品GPT-1也是在2018年正式推出。GPT-1的獨(dú)特之處在于“半監(jiān)督”,在此前的NLP模型中,AI需要基于特定任務(wù)對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行學(xué)習(xí),而這些數(shù)據(jù)是需要“監(jiān)督”的,即人為地對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。

GPT-1則可以在開(kāi)始進(jìn)行無(wú)監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練,通過(guò)對(duì)數(shù)據(jù)的學(xué)習(xí)增強(qiáng)語(yǔ)言能力,最后進(jìn)行部分有監(jiān)督的微調(diào)。簡(jiǎn)單來(lái)說(shuō),GPT-1可以用更少的資源和數(shù)據(jù)進(jìn)行更具效率的學(xué)習(xí),但GPT-1仍舊是青澀的,一方面礙于訓(xùn)練數(shù)據(jù)的有限,AI的“世界觀”很有限,另一方面其性能仍舊不夠好,遠(yuǎn)遠(yuǎn)達(dá)不到對(duì)話的能力。

自2018年開(kāi)始NLP領(lǐng)域迎來(lái)了飛速發(fā)展,也從某種程度上改變了AI生成圖像的未來(lái),也就是AI繪畫。

2020年是翻天覆地的一年。彼時(shí),OpenAI推出了GPT-3,相比前兩代,這一次GPT實(shí)現(xiàn)了進(jìn)化,GPT-3的參數(shù)超過(guò)1750億個(gè),是人腦神經(jīng)連結(jié)的十分之一,與此同時(shí)GPT-3的性能也更強(qiáng),它能夠識(shí)別更深層次的文本含義,并進(jìn)行反饋。GPT-3的推出是一場(chǎng)革新。

2022,AIGC元年?

與此同時(shí),在圖像生成領(lǐng)域,一場(chǎng)革命也在發(fā)生。盡管GAN已經(jīng)能生成較高質(zhì)量的圖片及內(nèi)容,但相較來(lái)說(shuō),其效率較低,同時(shí)生成的圖像始終難以令人滿意。而Transformer架構(gòu)的出現(xiàn)改變了一切,自此開(kāi)始,圖像合成領(lǐng)域告別了GAN時(shí)代,NLP與計(jì)算機(jī)視覺(jué)技術(shù)搭配的新時(shí)代來(lái)臨了。

隨后便是我們熟知的故事了。2022年9月,AI繪畫爆火,11月30日,ChatGPT橫空出世,正式讓全世界看到了AIGC的“強(qiáng)大”。

二、AIGC國(guó)內(nèi)玩家

在OpenAI等行業(yè)巨頭的帶領(lǐng)下,海外AIGC產(chǎn)業(yè)正處于一個(gè)高速發(fā)展時(shí)期,那么在國(guó)內(nèi),AIGC發(fā)展到哪一步了?

首先我們需要認(rèn)識(shí)到一個(gè)現(xiàn)實(shí),相較于美國(guó),國(guó)內(nèi)AIGC領(lǐng)域的發(fā)展是相對(duì)滯后的,但近幾年來(lái),阿里巴巴、百度、騰訊等互聯(lián)網(wǎng)巨頭都注意到了AIGC這一未來(lái)的產(chǎn)業(yè)富礦。

國(guó)內(nèi)AI領(lǐng)域,繞不開(kāi)的一家公司即是百度。

在五個(gè)月前的百度世界大會(huì)上,百度CEO李彥宏就著重強(qiáng)調(diào)了AIGC,他認(rèn)為,AIGC不僅能夠提升內(nèi)容生產(chǎn)小籠包,還能創(chuàng)造出有獨(dú)特價(jià)值的獨(dú)立視角的內(nèi)容。在世界大會(huì)上,百度AI也展示出了自己的實(shí)力:在十分鐘內(nèi)復(fù)原了《富春山居圖》的殘卷,其背后依賴的深度學(xué)習(xí)模型,即是百度的當(dāng)家模型——文心大模型。

2022,AIGC元年?

百度AI復(fù)原的《富春山居圖》,圖源網(wǎng)絡(luò)

文心大模型起源于2019年,是百度深耕預(yù)訓(xùn)練模型的產(chǎn)物,其核心特色在于“知識(shí)增強(qiáng)”,能夠?qū)A繑?shù)據(jù)進(jìn)行深度學(xué)習(xí),并為多種AIGC應(yīng)用提供支持。目前為止文心大模型已經(jīng)發(fā)布了超過(guò)十多個(gè)大模型,形成了一個(gè)大模型家族。

在世界大會(huì)兩個(gè)月后的萬(wàn)象大會(huì)上,百度還發(fā)布了AI助理,根本上是多種AIGC應(yīng)用的集合,包括文本生成、圖片生成,圖片轉(zhuǎn)換視頻等多種功能,最值得關(guān)注的一點(diǎn)是,其直接面向用戶與內(nèi)容創(chuàng)作者,也就是說(shuō),AIGC技術(shù)的C端應(yīng)用化正在實(shí)現(xiàn)。

AIGC也不止圖像生成、文本生成等領(lǐng)域,AI創(chuàng)作同樣是多元的,音樂(lè)、編程等領(lǐng)域同樣在飛速發(fā)展。

就在不久前,昆侖萬(wàn)維高調(diào)宣布入局AIGC領(lǐng)域,并發(fā)布了“昆侖天工”模型。這一成立于2008年的公司早期以游戲代理起家,自2016年起,昆侖萬(wàn)維在海外建立起龐大業(yè)務(wù),成為國(guó)內(nèi)知名的出海巨頭之一,近年來(lái),昆侖萬(wàn)維更是發(fā)力元宇宙社交等領(lǐng)域,而這一進(jìn)軍AIGC,也是早有準(zhǔn)備。

自2020年起,昆侖萬(wàn)維便組建了超過(guò)200人的AIGC團(tuán)隊(duì),訓(xùn)練集群200張卡,投入數(shù)千萬(wàn)元,并在2021年4月研發(fā)出了百億參數(shù)的中文GPT-3模型。值得關(guān)注的是,在很多人忽略的音樂(lè)領(lǐng)域,昆侖萬(wàn)維也取得了不錯(cuò)的進(jìn)展,于2022年1月啟動(dòng)的SkyMusic已經(jīng)可以實(shí)現(xiàn)生成商用級(jí)別的音樂(lè)。

值得注意的是,昆侖天工選擇開(kāi)源,與百度一樣,昆侖萬(wàn)維堅(jiān)信開(kāi)源能夠給AIGC帶來(lái)更長(zhǎng)效的發(fā)展力,并致力于降低AIGC技術(shù)的使用門檻,讓AI能夠幫助更多內(nèi)容創(chuàng)作者。

除了以上提到的這兩家公司外,在國(guó)內(nèi)AIGC領(lǐng)域,垂直賽道的初創(chuàng)公司也勢(shì)頭正勁,覆蓋AI音樂(lè)、虛擬人、AI音頻語(yǔ)音、AI游戲等領(lǐng)域。

但另一個(gè)事實(shí)也同時(shí)存在,相較于OpenAI等海外巨頭,國(guó)內(nèi)AIGC領(lǐng)域公司仍存在較大的差距,一方面在組織架構(gòu)方面,國(guó)內(nèi)基本都基于公司自身的科研團(tuán)隊(duì),而OpenAI等組織更類似一個(gè)研究院,能夠通過(guò)開(kāi)放共享的模式吸納全球頂尖科研人才。

另一方面,國(guó)內(nèi)AIGC相關(guān)公司面對(duì)的營(yíng)收壓力客觀存在,很難像OpenAI等平臺(tái)不計(jì)成本的進(jìn)行投入。但伴隨著AIGC逐漸成熟的商業(yè)化以及更廣泛的應(yīng)用,或許國(guó)內(nèi)AIGC領(lǐng)域即將迎來(lái)春天。

三、為何元年?

回到最開(kāi)始的那個(gè)問(wèn)題,2022年為何會(huì)被看作AIGC的元年?

其實(shí)深入了解AI繪畫與ChatGPT就能理解這一說(shuō)法:

2022年8月,人工智能公司Stability AI推出了AI文生圖模型Stable Diffusion(擴(kuò)散模型),將AI圖像生成的效率與精度提升到了前所未有的量級(jí),在最基礎(chǔ)的終端設(shè)備上,只需輸入關(guān)鍵詞,就能生成高質(zhì)量的AI圖像,幾乎讓整個(gè)世界為之瘋狂。AI繪畫的爆發(fā)式發(fā)展也第一次讓C端感受到了AIGC的強(qiáng)大魅力。

而ChatGPT的到來(lái)更令人震驚。作為基于GPT-3.5的對(duì)話式AI,ChatGPT最大的特點(diǎn)即是能夠“理解”對(duì)話者的語(yǔ)義,能夠進(jìn)行更有效的反饋,并進(jìn)行連續(xù)對(duì)話。基于對(duì)超大規(guī)模數(shù)據(jù)的深度學(xué)習(xí),ChatGPT在文本生成領(lǐng)域幾乎能“以假亂真”,讓你認(rèn)為其真的擁有了意識(shí)。此外,ChatGPT不僅能答疑解惑,還能寫故事、作詩(shī),甚至編程,生成內(nèi)容的能力空前提高。

2022,AIGC元年?

AIGC元年的秘密就藏在這兩個(gè)模型里。

第一,在性能上,AI已經(jīng)實(shí)現(xiàn)了“進(jìn)化。相比以前的GAN圖像生成模型,Stable Diffusion最大的特點(diǎn)就在于精準(zhǔn),只要輸入對(duì)關(guān)鍵詞,其就能產(chǎn)生較為接近的圖像結(jié)果,這是此前的圖像生成很難做到的。ChatGPT也同樣是高性能的,有人幾乎把它當(dāng)做了谷歌一樣的搜索引擎,正是在于其對(duì)于文本的深度分析并能夠生成較為精確的反饋。而各種生成內(nèi)容則進(jìn)一步顯示了其性能的強(qiáng)大。

第二則在于“理解”。這點(diǎn)在ChatGPT上體現(xiàn)的更加明顯,相比此前的對(duì)話AI,人們驚奇的發(fā)現(xiàn),ChatGPT似乎能夠理解文本更深層次的含義,無(wú)論是連續(xù)流暢的對(duì)話,還是對(duì)于錯(cuò)誤想法的糾正,都讓人感覺(jué)到對(duì)面的AI似乎是有思想的,盡管其只是類似“中文屋”的深度學(xué)習(xí)的產(chǎn)物,但強(qiáng)化學(xué)習(xí)模型的加入會(huì)讓其不斷進(jìn)化,對(duì)話任務(wù)也完成的更加出色。

最后則在于更大范圍的應(yīng)用。相比于此前的“圈內(nèi)狂歡”,2022年的AIGC真正做到了全民關(guān)注,這是技術(shù)飛速發(fā)展下的產(chǎn)物,以Stable Diffusion為例,其最大的特點(diǎn)即是低門檻,不需要多強(qiáng)大的顯卡與服務(wù)器,最普通的PC就能完成任務(wù)。同時(shí)平臺(tái)的封裝也讓AIGC更加“平易近人”,AI繪畫僅需要輸入關(guān)鍵詞,ChatGPT也只需要網(wǎng)頁(yè)和提問(wèn)欄就能實(shí)現(xiàn)對(duì)話,這讓普通人接觸AIGC的機(jī)會(huì)大大增加了。

AIGC在2022年的火爆,是技術(shù)積累與發(fā)展策略雙重變革的產(chǎn)物,從某種角度來(lái)看,稱之為元年也并不為過(guò),只不過(guò)2022年更應(yīng)該是AIGC的“應(yīng)用元年”。

AIGC也還有很長(zhǎng)的路要走。一方面,在“創(chuàng)造”這一概念面前,基于深度學(xué)習(xí)的AI的創(chuàng)作是否真正是創(chuàng)造還難以定論,另一方面知識(shí)產(chǎn)權(quán)問(wèn)題也像一把達(dá)摩克利斯之劍始終懸在AIGC頭上,如何解決AI學(xué)習(xí)背后的倫理問(wèn)題也是一大難題。

但在AI技術(shù)的發(fā)展問(wèn)題面前,以上問(wèn)題可能都是細(xì)枝末節(jié)了。正如OpenAI等平臺(tái)所期望的那樣,AIGC并不是最終目的,真正實(shí)現(xiàn)通用人工智能才是最核心的目標(biāo)。

作者:世昕;編輯:石燦

來(lái)源公眾號(hào):刺猬公社(ID:ciweigongshe),互聯(lián)網(wǎng)內(nèi)容行業(yè)觀察與研究。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@刺猬公社 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 先是AI繪畫的爆發(fā),然后又是ChatGPT的紅火,讓人感覺(jué)AIGC無(wú)處不在啊

    來(lái)自廣東 回復(fù)