為什么說(shuō)誰(shuí)掌握了人工智能誰(shuí)就掌握元宇宙?

2 評(píng)論 1575 瀏覽 3 收藏 39 分鐘

編輯導(dǎo)語(yǔ):元宇宙,主要能夠突出VR視頻和交互技術(shù),它和AI碰撞在一起會(huì)是怎樣的呢?而本篇文章中作者結(jié)合多種實(shí)際案例來(lái)闡述元宇宙跟AI結(jié)合會(huì)碰撞出怎樣的火花,歡迎感興趣的小伙伴們一起閱讀分享~

今天想跟大家聊一下元宇宙跟 AI 結(jié)合會(huì)碰撞出怎樣的火花。

元宇宙,正如我們之前的視頻所說(shuō),就是以VR為媒介的下一代互聯(lián)網(wǎng),突出VR視頻和交互技術(shù)成熟帶來(lái)的極致臨場(chǎng)感和沉浸感,無(wú)限模糊真實(shí)和虛擬,拉近人與人之間的距離。

它與AI人工智能的結(jié)合可能大家一下就會(huì)想到一些科幻電影,比如當(dāng)年還是沃卓斯基兄弟的沃卓斯基姐妹的傳世經(jīng)典《黑客帝國(guó)》系列,再比如去年的那部《失控玩家》。

在黑客帝國(guó)里面,AI統(tǒng)治了地球,人類(lèi)的意識(shí)被禁錮在了虛擬世界當(dāng)中,肉體則成為了培養(yǎng)倉(cāng)當(dāng)中的生物電池。各種功能的AI不但無(wú)所不能,而且還在虛擬世界里突變進(jìn)化。

比如大反派特工史密斯,作為有思想的殺毒軟件,就在虛擬世界的數(shù)字信息海洋中,不斷學(xué)習(xí)進(jìn)化,逆襲了母體,甚至進(jìn)入了現(xiàn)實(shí)世界。

而在失控玩家當(dāng)中,游戲里面的NPC Guy某一天突然產(chǎn)生了人類(lèi)一般的自我意識(shí),脫離了他被設(shè)定好的那個(gè)角色開(kāi)始在虛擬世界翻云覆雨,還跟現(xiàn)實(shí)當(dāng)中的女主談起了戀愛(ài)。

也就是不管是在AI虛擬世界帶來(lái)人類(lèi)末世這種黑暗結(jié)局,還是游戲NPC產(chǎn)生人類(lèi)最珍貴的美好情感這種光明結(jié)局當(dāng)中,至少在兩個(gè)點(diǎn)上,電影的創(chuàng)作者們達(dá)成了共識(shí):

  1. 一是虛擬世界會(huì)因?yàn)锳I的存在變得豐富多彩,并且具備一定的脫離人類(lèi)自我發(fā)展迭代的能力
  2. 二是AI在脫離現(xiàn)實(shí)世界的束縛之后會(huì)變得更加的強(qiáng)大,甚至反過(guò)來(lái)影響現(xiàn)實(shí)世界

所以類(lèi)似這樣的未來(lái)是否會(huì)成為現(xiàn)實(shí)呢?

01

在深入探討之前,我覺(jué)得有必要先簡(jiǎn)單地聊一下現(xiàn)在我們稱(chēng)之為AI的那個(gè)東西他本質(zhì)上是個(gè)啥,不然空對(duì)空說(shuō)它能干什么不能干什么就有點(diǎn)尬了。對(duì)AI非常熟悉的朋友可以忽略這段。

大家印象比較深刻AI應(yīng)該是2016年3月?lián)魯±钍朗腁lpha Go,它就像一個(gè)神話故事中的水晶球,只要把現(xiàn)在的棋譜告訴它,它內(nèi)部不知道怎么計(jì)算了一下,就能輸出必然贏得比賽的落子策略,把杰寶之類(lèi)的人類(lèi)高手都打哭了。

在Alpha Go之后,短短幾年之間,AI擴(kuò)展到了我們生活的方方面面。我們現(xiàn)在刷的視頻大概率是AI推送的,很多視頻里面的配音都是AI配的,我們買(mǎi)的東西是AI推薦的,我們電腦顯卡手機(jī)GPU是AI加速的,張學(xué)友演唱會(huì)逮捕逃犯是靠AI識(shí)別的,連現(xiàn)在這段BGM都是AI譜曲的。

而正如芯片有它的基本單元,也就是可以輸出0和1的晶體管一樣,AI也有它的基本單元,叫做感知機(jī)。

02

1957年,康奈爾大學(xué)的心理學(xué)家兼工程師弗朗克·羅森布拉特受到神經(jīng)細(xì)胞的啟發(fā),提出了感知機(jī)的構(gòu)想。

神經(jīng)細(xì)胞的形狀呢非常的“支棱”,除了那一坨細(xì)胞主體之外,它的外壁有很多樹(shù)杈狀的短突起,叫做樹(shù)突,還有一根長(zhǎng)長(zhǎng)的“尾巴”叫做軸突。

樹(shù)突的作用是接收外部輸入的各種刺激,形成生物電,這些生物電經(jīng)過(guò)整合后,一旦超過(guò)某個(gè)閾值,就會(huì)經(jīng)由軸突傳導(dǎo),并在末端分泌神經(jīng)遞質(zhì),將信息傳遞給下一個(gè)細(xì)胞,否則就不向下傳遞信息。

所以神經(jīng)元細(xì)胞的輸出只有兩種狀態(tài),用數(shù)學(xué)表示就是“0”或者“1”,然后人腦有超過(guò)一百億個(gè)神經(jīng)元組成一個(gè)神經(jīng)網(wǎng)絡(luò),前面的神經(jīng)元輸出作為后面的神經(jīng)元輸入進(jìn)一步處理,不斷反復(fù),最終實(shí)現(xiàn)人類(lèi)的智能。

參照了輸入,處理,分類(lèi),輸出四個(gè)步驟,感知機(jī)就模擬出了類(lèi)似的結(jié)構(gòu)。

每個(gè)輸入信號(hào)乘上對(duì)應(yīng)的權(quán)重,對(duì)應(yīng)著樹(shù)突的刺激輸入,累加這個(gè)函數(shù)符號(hào)模擬了神經(jīng)細(xì)胞整合生物電的過(guò)程,激活函數(shù)則判斷累加值是否達(dá)到閾值,比閾值大,就輸出1,否則輸出0。

類(lèi)似于看到一只貓,我知道它是貓,這對(duì)我來(lái)說(shuō)是廢話,問(wèn)題是我不知道我是怎么判斷的。那我猜想,肯定是眼睛看到貓的一瞬間,采集了大量的信息點(diǎn),比如它的大小,它的花色,它的臉型,它的尾巴長(zhǎng)度等等等等,然后我的大腦經(jīng)過(guò)一瞬間綜合考慮,覺(jué)得它是個(gè)貓。

那只要這些信息點(diǎn),都是具體的可以衡量的類(lèi)似大小,色號(hào)這類(lèi)可數(shù)據(jù)化的參數(shù),就可以轉(zhuǎn)化為計(jì)算機(jī)的輸入信號(hào),而這個(gè)調(diào)權(quán)重加總的過(guò)程就可以類(lèi)比為我腦子里那一瞬間的綜合考慮,最終作出一個(gè)它是不是貓的分類(lèi)判斷,輸出一個(gè)0或者1的數(shù)。

說(shuō)白了感知機(jī)就是對(duì)于人類(lèi)神經(jīng)細(xì)胞的一個(gè)模仿。

那具體是怎么操作的呢?

03

比如,我們看到一個(gè)人的照片,要判斷一下它是不是我,那你足夠細(xì)的話,完全可以找出一萬(wàn)個(gè)我這個(gè)人的特征。但為了便于討論,讓我們姑且通過(guò)臉?lè)降某潭?、頭大的程度兩個(gè)指標(biāo)用數(shù)字表示,讓感知機(jī)去判斷。

比如設(shè)定完全圓臉是0,臉?lè)降酶业氖澜缋锩嫒宋镆粯邮?;比如完全沒(méi)有頭是0,頭跟大頭兒子一樣大是1。

分別把這兩個(gè)輸入當(dāng)成平面坐標(biāo)系的兩個(gè)軸,找一些人的照片,記錄他們是誰(shuí)以及臉型、頭的大小這些量化指標(biāo),放到坐標(biāo)系里面。

那很顯然,我們可以劃一條線,把我跟類(lèi)似周冬雨這樣的人大概率地區(qū)分出來(lái),因?yàn)槲叶碱^比較大臉也比較方,像周冬雨這樣的女明星恰恰相反。

對(duì)于計(jì)算機(jī)而言,這條線就是ax+by+c=0。

如果加權(quán)求和出來(lái)的結(jié)果大于零就在線上方,就是我,如果小于零,就是周冬雨。

當(dāng)然,現(xiàn)實(shí)當(dāng)中我們不可能只用兩個(gè)參數(shù)來(lái)判斷這個(gè)人是誰(shuí),要做出更精確的判斷還需要很多維度的輸入,比如體型、五官、化妝等等。

引入化妝這個(gè)維度,坐標(biāo)軸就變成三個(gè),成為了一個(gè)三維空間坐標(biāo),那根一分為二的線也變成了一個(gè)平面。

繼續(xù)引入第四個(gè)、五個(gè)輸入的話就有點(diǎn)無(wú)法想象了,只能通過(guò)數(shù)學(xué)的形式來(lái)表現(xiàn),叫做超平面,不過(guò)沒(méi)有關(guān)系,這對(duì)電腦不是問(wèn)題,它還是可以通過(guò)公式計(jì)算,把一個(gè)多維空間一分為二。

乍看起來(lái)有點(diǎn)弱智,但這個(gè)感知機(jī)的精髓就在于它不用我去告訴它該把線畫(huà)在哪里,它可以通過(guò)所謂的“學(xué)習(xí)”來(lái)自己找到準(zhǔn)確的畫(huà)線位置,這就是它跟以往的所有機(jī)器或者工具不同的地方。

還是之前那個(gè)是我還是周冬雨的問(wèn)題,在沒(méi)有樣本點(diǎn)輸入的情況下,我可以先在平面上隨便畫(huà)一條線,然后規(guī)定這條線上方是我,下方是周冬雨。

但輸入了實(shí)際的數(shù)據(jù)后發(fā)現(xiàn)直線上方居然出現(xiàn)了周冬雨的照片,比如她某些角度看起來(lái)臉比較方,那不行。于是我們就可以把這條線往上抬一點(diǎn)。再看一下所有點(diǎn)的分布,再進(jìn)行判斷,如果還不行再挪一下,再判斷,以此類(lèi)推,直到所有照片都能正確分類(lèi),感知機(jī)逐漸就精確了。

從計(jì)算機(jī)的操作來(lái)看,挪動(dòng)直線這個(gè)動(dòng)作就是調(diào)整輸入權(quán)重abc的過(guò)程。

比如在這臺(tái)感知機(jī)中,我們就可以計(jì)算分類(lèi)錯(cuò)誤的點(diǎn)到直線距離的和的函數(shù),這個(gè)函數(shù)是跟權(quán)重參數(shù)也就是那個(gè)a、b或者c相關(guān),叫做“損失函數(shù)”,越大說(shuō)明錯(cuò)得越離譜。

就比如損失函數(shù)隨著臉型對(duì)應(yīng)的權(quán)重參數(shù)a的變化是這樣的。

那有一種挪動(dòng)的方法就是,假設(shè)現(xiàn)在權(quán)重在大寫(xiě)的A這個(gè)位置,我們每次就移動(dòng)A點(diǎn)的導(dǎo)數(shù)乘以一個(gè)事先規(guī)定的值,這個(gè)值叫做步長(zhǎng),然后重復(fù)這個(gè)過(guò)程,直到所有照片都能夠被正確分類(lèi),我就是我,周冬雨就是周冬雨。

因?yàn)槭菂⒖冀Y(jié)果往前推導(dǎo)“輸入的權(quán)重”,所以這個(gè)方法也叫做“反向傳播”。

但是上世紀(jì)五六十年代,由于硬件算力的限制和網(wǎng)絡(luò)結(jié)構(gòu)的過(guò)于復(fù)雜,當(dāng)時(shí)這種自我學(xué)習(xí)理論還無(wú)法實(shí)現(xiàn),真正反向傳播算法的提出還要等很久。

現(xiàn)在回過(guò)頭來(lái)看,感知機(jī)毫無(wú)疑問(wèn)是二十世紀(jì)乃至于人類(lèi)歷史上最偉大的發(fā)明之一,因?yàn)樗K結(jié)了機(jī)器只能機(jī)械執(zhí)行人類(lèi)具體指令的時(shí)代,開(kāi)啟了機(jī)器會(huì)自己想辦法完成主人任務(wù)的時(shí)代。

但是感知機(jī)的理論在當(dāng)時(shí)卻遭到了另一個(gè)人工智能大佬馬文·明斯基的強(qiáng)烈反對(duì),明斯基還特意寫(xiě)了一本叫做《感知機(jī)》的書(shū)來(lái)抨擊羅森布拉特,認(rèn)為他的研究沒(méi)有什么價(jià)值。

當(dāng)然明斯基有羨慕嫉妒恨的嫌疑,但他的攻擊也算是有理有據(jù):

他認(rèn)為感知機(jī)的原理過(guò)于簡(jiǎn)單,無(wú)法解決一些問(wèn)題,比如“異或邏輯”。

04

異或邏輯問(wèn)題說(shuō)起來(lái)很麻煩,但實(shí)際上就是,這個(gè)世界上并不是只有我和周冬雨這兩種人啊,還有馬云呢,馬云臉比我還方但頭沒(méi)有我大,還有雷佳音呢,甚至于,還有姚明呢,姚明是真的很大而且很方啊。

很顯然如果讓感知機(jī)去畫(huà)一條線,是沒(méi)有辦法把我跟這些個(gè)臉型和頭的大小各異的人都分出來(lái)的。

現(xiàn)實(shí)是復(fù)雜的,是沒(méi)法簡(jiǎn)單地一分為二的,明斯基指出了最關(guān)鍵的地方,這一波嘲諷效果拔群,導(dǎo)致以感知機(jī)為起點(diǎn)的人工智能研究停滯了大約30年。

上世紀(jì)7、80年代,隨著信息技術(shù)的發(fā)展,大家逐漸發(fā)現(xiàn),雖然單個(gè)感知機(jī)能力有限,但我再加兩個(gè)感知機(jī),等于多畫(huà)兩條線,不就行了嗎?

只要感知機(jī)層數(shù)夠多,無(wú)論多復(fù)雜的分類(lèi)問(wèn)題,不斷用反向傳播算法進(jìn)行訓(xùn)練,就能得到最優(yōu)解。

并且,我們需要注意到,解決了分類(lèi)問(wèn)題并不意味我們只能做分類(lèi),其實(shí)基于分類(lèi)可以解決很多很多問(wèn)題。

比如判斷和分類(lèi),邏輯上就是一回事兒。

智能攝像頭判斷門(mén)口來(lái)的那個(gè)人是不是公司的同事,判斷一個(gè)路過(guò)的人是不是某個(gè)新冠患者,就是分成是和不是兩類(lèi)唄。

在規(guī)則明確的情況下,對(duì)于接下來(lái)發(fā)生的事情進(jìn)行預(yù)測(cè),其實(shí)本質(zhì)上也是分類(lèi),下棋的話分為這樣下下去是會(huì)輸還是會(huì)贏唄,掃地的話分成有沒(méi)有掃過(guò)、會(huì)不會(huì)撞墻唄。

有了預(yù)測(cè)了之后,就可以進(jìn)行決策了,掃地,下棋,推薦,甚至指揮調(diào)度,都可以了,簡(jiǎn)直無(wú)所不能啊。

所以,人工智能在上世紀(jì)80、90年代開(kāi)始進(jìn)入“多層感知機(jī)”時(shí)代,當(dāng)時(shí)的人工智能在理論上已經(jīng)非常強(qiáng)大,可以解決大量的問(wèn)題。

但它還是受到兩個(gè)關(guān)鍵因素的制約:

  1. 一個(gè)是系統(tǒng)的算力,也就是動(dòng)輒幾千萬(wàn)參數(shù)的反向傳播算法需要巨量的算力;
  2. 另外一個(gè)是數(shù)據(jù),也就是需要大量打好數(shù)據(jù)標(biāo)簽的類(lèi)似我的照片周冬雨照片這樣的東西作為人工智能學(xué)習(xí)的資料。

搞定了這兩項(xiàng)關(guān)鍵資源人工智能才能真正上路!

05

從1965直到2016年以前,芯片算力都在隨著摩爾定律呈幾何倍數(shù)增長(zhǎng),而最近20年互聯(lián)網(wǎng)產(chǎn)業(yè)蓬勃發(fā)展也帶來(lái)了數(shù)據(jù)量的爆炸式增長(zhǎng),人工智能的發(fā)展有了肥沃的土壤。

另外,科學(xué)家也開(kāi)發(fā)了一系列的方法去處理這兩個(gè)問(wèn)題。

深度神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò),蒙特卡洛樹(shù)等等都是試圖用更小的算力處理更復(fù)雜的問(wèn)題。

比如深度神經(jīng)網(wǎng)絡(luò),就是把我們能提取到的信息點(diǎn),根據(jù)不同的維度,分成更多的層。

比如要分辨一個(gè)人,從單個(gè)五官,眼睛鼻子嘴各有各的特色,五官又組成了一張臉,臉、身體、四肢又組成了一個(gè)人,我們把這些特征分成不同的層不要混在一起計(jì)算,會(huì)提升系統(tǒng)的效率。

就比如為了把我跟姚明區(qū)別出來(lái),如果把何種參數(shù)混在同一層計(jì)算有可能你會(huì)發(fā)現(xiàn)我跟姚明還挺像,但只要把代表體型的那些參數(shù)單獨(dú)拎出來(lái),那就一點(diǎn)也不像了。

再比如所謂卷積神經(jīng)網(wǎng)絡(luò)。卷積計(jì)算是一種可以從矩陣中提取某些特征值的運(yùn)算,我當(dāng)年上大學(xué)的時(shí)候?qū)@玩意兒印象很深刻因?yàn)樗炙闫饋?lái)特別麻煩,到底是哪個(gè)人發(fā)明了這種東西那么無(wú)聊,后來(lái)發(fā)現(xiàn)它還真挺有用。

就比如我們按照片去分辨兩個(gè)人,那首先我們比較的是兩個(gè)人吧?你人工智能分析半天在比較后面的背景那算力就完全打了水漂了。

同理我們智能停車(chē)場(chǎng)識(shí)別車(chē)牌號(hào)得先找到車(chē)牌在哪里吧?智能商場(chǎng)識(shí)別顧客得先找到人在哪里吧?這是一項(xiàng)我們?nèi)祟?lèi)天生就有的能力,找重點(diǎn)的能力。

那如何讓計(jì)算機(jī)也擁有找重點(diǎn)的能力呢?我們就可以引入一個(gè)所謂卷積核,一般是個(gè)3*3、5*5、7*7像素的矩陣,用它從頭到尾掃描圖像,把圖像和卷積核對(duì)應(yīng)像素點(diǎn)的數(shù)值相乘再求和輸出,就能得到一張?zhí)崛×四撤N特征的更小的圖像。然后再基于這些特征,去判斷哪些部分是重點(diǎn),哪些部分是邊角料。

在2012年的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽上,一個(gè)叫做AlexNet的深度卷積神經(jīng)網(wǎng)絡(luò)在對(duì)1000種物體進(jìn)行分類(lèi)的比賽中獲得了第一名的成績(jī),錯(cuò)誤率僅為15.3%,比第二名低了大約11%之多,基于卷積神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法一戰(zhàn)成名。

這是人工智能發(fā)展歷史上的里程碑事件,卷積神經(jīng)網(wǎng)絡(luò)是一種通用的提升算力利用效率的技術(shù),它現(xiàn)在基本上是人工智能的標(biāo)配了。

而所謂蒙特卡洛樹(shù)搜索,也是一種判斷哪里是重點(diǎn)哪里是邊角料的方法,當(dāng)年跟李世石對(duì)弈的那個(gè)alpha go的算法就是基于蒙特卡洛樹(shù),而李世石第四局下出所謂神之一手,其實(shí)就是下到邊角料上了,邊角料是神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)盲區(qū),于是它就亂了套了。

另一方面,人工智能目前最大的發(fā)展瓶頸還是來(lái)自于數(shù)據(jù),目前相關(guān)產(chǎn)業(yè)的發(fā)展速度基本上就等同于獲取大數(shù)據(jù)的難易程度,比如智能推薦內(nèi)容,智能推薦商品這些容易獲取數(shù)據(jù)的項(xiàng)目現(xiàn)在就特別的成功,像自動(dòng)駕駛這種就會(huì)比較慢一點(diǎn)。

06

有一些方法可以人工的去創(chuàng)造數(shù)據(jù)來(lái)喂養(yǎng)神經(jīng)網(wǎng)絡(luò)。

就比如所謂強(qiáng)化學(xué)習(xí),就是脫離人類(lèi)數(shù)據(jù)樣本,基于環(huán)境和規(guī)則自己生成數(shù)據(jù)往下算。下國(guó)際象棋就是它有明確的規(guī)則,最終的目標(biāo)就是吃了對(duì)面的王,基于這一點(diǎn)去預(yù)測(cè)接下來(lái)最合適的策略,再通過(guò)得到的結(jié)果和預(yù)測(cè)值進(jìn)行比較,優(yōu)化自身參數(shù),于是就不用輸入太多人類(lèi)的棋譜了。

在國(guó)際象棋中,人類(lèi)頂尖高手可以預(yù)測(cè)接下來(lái)10步的行動(dòng)。1997年,當(dāng)時(shí)的IBM研發(fā)了一個(gè)用來(lái)下國(guó)際象棋的AI,叫做“深藍(lán)”,

深藍(lán)可以預(yù)測(cè)12步,每一步都遍歷了可能發(fā)生的所有情況,相當(dāng)于用強(qiáng)大的算力進(jìn)行了12步的暴力窮舉,擊敗了當(dāng)時(shí)等級(jí)分排名世界第一的加里·卡斯帕羅夫。

當(dāng)然這個(gè)暴力窮舉的方法在目前的算力下,對(duì)特別復(fù)雜的問(wèn)題比如圍棋、星際爭(zhēng)霸會(huì)相對(duì)無(wú)力一點(diǎn)。

然后還有多智能體,就是搞兩個(gè)或者以上的AI,讓它們自己打自己,卷起來(lái)。

結(jié)合強(qiáng)化學(xué)習(xí)和多智能體學(xué)習(xí),有時(shí)候我們會(huì)發(fā)現(xiàn),其實(shí)很多人類(lèi)的經(jīng)驗(yàn)并不靠譜,還不如讓AI自己去算然后自己打自己,就比如Alpha Zero的圍棋棋力就完爆學(xué)習(xí)了人類(lèi)棋譜的Alpha Go。

還有一個(gè)特別有意思的方法叫做GAN,所謂對(duì)抗生成網(wǎng)絡(luò)。如果說(shuō)之前的AI主要干的事兒是判斷和決策,在2014年被發(fā)展出來(lái)的GAN網(wǎng)絡(luò)則賦予AI比較強(qiáng)的創(chuàng)作能力。

剛才我們不是說(shuō)可以做一個(gè)AI判別網(wǎng)絡(luò),去對(duì)一類(lèi)東西進(jìn)行判斷分類(lèi)嗎,還可以搞個(gè)多智能體,讓幾個(gè)AI自己卷自己比誰(shuí)判斷的準(zhǔn)對(duì)吧。那我們可不可以換一個(gè)思路,讓判別網(wǎng)絡(luò)去卷一個(gè)所謂的生成網(wǎng)絡(luò)呢?

就比如這樣,我做一個(gè)畫(huà)圖的生成網(wǎng)絡(luò),先給生成網(wǎng)絡(luò)輸入一些隨機(jī)參數(shù),生成網(wǎng)絡(luò)就會(huì)生成一些初始圖片,有點(diǎn)類(lèi)似于玩游戲通過(guò)數(shù)據(jù)捏臉的過(guò)程,只不過(guò)一開(kāi)始生成網(wǎng)絡(luò)還很懵懂,生成的東西都是四不像。

然后把我們已有的美女照片和生成的四不像照片都做好標(biāo)記,用這兩類(lèi)帶標(biāo)記的圖像去訓(xùn)練判別網(wǎng)絡(luò)的參數(shù),讓它自己學(xué)習(xí)怎么畫(huà)線,能把美女的圖片和亂畫(huà)的圖片分出來(lái)。

接下來(lái),生成網(wǎng)絡(luò)可以根據(jù)判別網(wǎng)絡(luò)給出的結(jié)果差距來(lái)學(xué)習(xí)提升,它畫(huà)出來(lái)的美女就越來(lái)越像那么回事兒了。

于是判別網(wǎng)絡(luò)的判斷準(zhǔn)確率會(huì)下跌,逼得它去提升判別能力,它又逼著生成網(wǎng)絡(luò)生成更逼真的照片去騙判別網(wǎng)絡(luò),不斷循環(huán),卷起來(lái)。

到最后判別網(wǎng)絡(luò)分不出來(lái)了,它判斷成功概率會(huì)穩(wěn)定在50%,這時(shí)候我們說(shuō)生成網(wǎng)絡(luò)已經(jīng)做到了“以假亂真”。

生成網(wǎng)絡(luò)就像是熱血?jiǎng)勇踯?chē)尾的男主角,判別網(wǎng)絡(luò)就像是自帶外掛的天才男二,隨著劇情的發(fā)展,男主最終能和男二五五開(kāi)了。

我們甚至還能通過(guò)調(diào)節(jié)生成網(wǎng)絡(luò)的輸入?yún)?shù),來(lái)對(duì)贗品畫(huà)作的細(xì)節(jié)或者風(fēng)格進(jìn)行修改。

比如把畫(huà)面中的普通馬變成斑馬;或者把我的照片變成抽象派油畫(huà)風(fēng)格甚至梵高莫奈的風(fēng)格,以及我們喜聞樂(lè)見(jiàn)的ai換臉。也就是我們既可以生成劉亦菲的各種角度各種表情,也可以把條件放寬一點(diǎn),生成劉亦菲這種風(fēng)格的美女。

而且這個(gè)創(chuàng)作能力并不僅限于畫(huà)圖哦,寫(xiě)文章,寫(xiě)詩(shī),寫(xiě)劇本,作曲,做動(dòng)畫(huà)都是可以的。

07

到了這一步之后,我們?cè)賮?lái)看下AI它的能力是怎么回事,它既可以做判斷,做決策,也可以做創(chuàng)作,那這些正是元宇宙所需要的呀!

之前我們?cè)诘谝黄诠?jié)目當(dāng)中說(shuō)過(guò),在傳統(tǒng)的PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)當(dāng)中,其實(shí)我們的世界是被降維打擊過(guò)的。

無(wú)論是生活中去商店里購(gòu)物,去跟人聊天吹水,去劇院看戲去茶館聽(tīng)書(shū),所有這些3D場(chǎng)景都被壓縮成了一張2D網(wǎng)頁(yè)或者App頁(yè)面,以適應(yīng)這塊屏幕,壞處是沒(méi)有代入感臨場(chǎng)感,好處是實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單。

而在元宇宙里面,他們將會(huì)實(shí)現(xiàn)三維展開(kāi),對(duì)應(yīng)的工作量也會(huì)提升一個(gè)維度。

就拿我們最常用的三類(lèi)app為例,社交:也就是微信,soul;電商:某寶,某東,某多多;以及短視頻;

在元宇宙里面的社交,咱倆在虛擬世界里面,面對(duì)面聊天,這相對(duì)于在一個(gè)對(duì)話框里面打字那種社交,是顛覆性的。因?yàn)檎f(shuō)白了包括我在內(nèi),很多比較內(nèi)向的人,是根本沒(méi)法跟一個(gè)不熟的人微信打字的,你不知道ta的背景ta的愛(ài)好,都不知道開(kāi)什么話題啊。

但是只要見(jiàn)了面坐在一起那還是可以尬聊的,尬著尬著就發(fā)現(xiàn),誒好像大家都對(duì)最近曼城踢利物浦的巔峰對(duì)決很敢興趣,或者大家都對(duì)新出的蝙蝠俠很感興趣,這就聊起來(lái)了呀,甚至可以開(kāi)個(gè)電影邊看邊聊。

但前提是,我得有一個(gè)我的形象吧?而且得是一個(gè)放在元宇宙場(chǎng)景里面并不違和的比較精細(xì)的,就好像老黃發(fā)布會(huì)那樣的虛擬形象吧?你也得有一個(gè)你的形象吧?

如果是正式場(chǎng)合商務(wù)會(huì)談的話,我可能就得用一個(gè)跟我現(xiàn)實(shí)中的形象比較接近的頂多稍微美顏一下的形象,在家里就沒(méi)必要那么正式了,喜歡什么形象都可以,比如可以是蝙蝠俠,在一些別的場(chǎng)景下,比如一起去打仗,那我就可以是一個(gè)巨型機(jī)器人。所以每個(gè)人需要好幾個(gè)不同的形象吧。

那像這樣的比較精細(xì)的人物模型都是畫(huà)圖師用Zbrush Blender扣幾個(gè)月才能扣出來(lái)的,而且很貴,便宜的也要幾萬(wàn),那些精致的虛擬網(wǎng)紅比如柳夜熙那是花上百萬(wàn)打造出來(lái)的,就連好一點(diǎn)的游戲捏臉師傅都要大幾千。假如十年之后全球有20億人登陸元宇宙,平均每人要有十個(gè)形象。

那這兩百億的形象怎么做???

再說(shuō)元宇宙里面的電商,那真的是一家店,它不是一個(gè)頁(yè)面哦,而且比如我要用我的虛擬人在元宇宙里面試一雙鞋,大致試一試肯定是沒(méi)有意義的,因?yàn)槲业每窟@個(gè)決定要不要買(mǎi)啊。

像現(xiàn)在得物的那個(gè)AR試鞋功能那樣是沒(méi)有用的,那是什么玩意兒,我本來(lái)看著一雙鞋覺(jué)得挺好的,用那個(gè)一試就不想買(mǎi)了。

所以不是隨便試一試那么簡(jiǎn)單,我這個(gè)虛擬人的腳的尺碼、腳的受力結(jié)構(gòu)得是跟現(xiàn)實(shí)中的我的腳一樣的,同理鞋也要一樣,這樣才能試出合不合腳好不好看。

那這么多深度的數(shù)字孿生人和商品,誰(shuí)來(lái)做???

再比如說(shuō)短視頻。現(xiàn)在的移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們這種短視頻用戶主要優(yōu)點(diǎn)就是勤奮好學(xué),學(xué)穿搭、學(xué)瑜伽、學(xué)化妝、特別是喜歡學(xué)跳舞。我想人性的這個(gè)需求應(yīng)該不會(huì)隨著平臺(tái)的變遷而發(fā)生太大的變化。

那元宇宙里面怎么學(xué)跳舞呢?其實(shí)就是你坐那兒然后那個(gè)dancer在你邊上跳唄,然后你可以語(yǔ)音交互“換一個(gè)”,然后就換了。

這不僅是人要換哦,跳舞那個(gè)場(chǎng)景是不是也要換啊,什么場(chǎng)景里面的擺設(shè),場(chǎng)景里的貓貓狗狗也要換啊。我們每天刷那么多短視頻,那么多場(chǎng)景,那么多擺設(shè),那么多貓貓狗狗怎么做啊?

只能靠AI,元宇宙里面的這些高級(jí)基礎(chǔ)設(shè)施只能靠AI才能完成啊。

08

然后就是,當(dāng)我們?cè)谠钪胬锩嬗辛朔浅>?xì)的3D形象之后,當(dāng)像商店,咖啡廳,游樂(lè)場(chǎng)這些場(chǎng)景都實(shí)現(xiàn)了三維展開(kāi)之后,那這些地方的服務(wù)人員、NPC他們得像人才行吧?如果人的形象非常真實(shí)場(chǎng)景也無(wú)比自然,你湊上去跟一個(gè)美女打招呼結(jié)果她頭上突然彈出一個(gè)對(duì)話框,這就太出戲了。

所以在元宇宙里面我們需要非常像人的AI來(lái)提供各種服務(wù)。

而這些都正在發(fā)生。

比如這個(gè)“此物不存在”網(wǎng)頁(yè)當(dāng)中,這些貓,這些房間,這些人像,你打開(kāi)這個(gè)網(wǎng)頁(yè)就好像在看一些人的自拍照,唯一的區(qū)別是這些人是AI生成的,他們并不存在于我們的世界。

當(dāng)2D的人物、場(chǎng)景和物件的生成可以被完美實(shí)現(xiàn)的時(shí)候,其實(shí)3D也就不遠(yuǎn)了,比如這個(gè)PIFuHD算法 ,可以直接從2D圖片生成真人的3D模型,并自動(dòng)補(bǔ)全背面的信息。

但這還不夠,到這一步你得到的小姐姐也只是個(gè)雕塑而已,得讓她動(dòng)起來(lái)呀。于是,就有了I2L-MeshNet,可以從2D圖像生成人物動(dòng)作相關(guān)的骨骼和3D建模,導(dǎo)入動(dòng)作參數(shù),于是小姐姐就真正來(lái)到了你的身邊。

這還不是終點(diǎn),因?yàn)槲覀兊脑钪嫣摂M小姐姐還得多才多藝,更要會(huì)互動(dòng)才行,也就是要實(shí)現(xiàn)類(lèi)似失控玩家里面的效果。

有幾個(gè)朋友在做一個(gè)項(xiàng)目叫做RCT-AI,是一個(gè)北京的團(tuán)隊(duì),他們?cè)谧鲆粋€(gè)事情就是用AI去自動(dòng)生成游戲里面的人物腳本,比如這個(gè)“搶銀行”的Demo。AI會(huì)學(xué)習(xí)自行判斷的如何配合玩家,有時(shí)會(huì)很慫,有時(shí)則會(huì)跟劫匪硬剛到底。

配合玩家?如果換一個(gè)場(chǎng)景,訓(xùn)練一個(gè)女仆或管家型的AI是不是變得可行了呢?

實(shí)際上,在服務(wù)型AI方面,OpenAI公司的GPT-3,現(xiàn)在不僅可以和人聊天,甚至還能按照人的要求寫(xiě)代碼。

也就是若干年以后當(dāng)我們?cè)谠钪胬锩鎰?chuàng)作的時(shí)候,我們大概率扮演的是一個(gè)導(dǎo)演或者宏觀設(shè)計(jì)師的角色,那些具體的工作將由AI完成。

而今天的動(dòng)畫(huà)游戲作品中,與一個(gè)紙片人小姐姐、小哥哥交往,你還需要腦補(bǔ),但當(dāng)你明白今天AI的發(fā)展程度,就會(huì)發(fā)現(xiàn),你所幻想的一切獨(dú)一無(wú)二的美好,正在通過(guò)一行行代碼,走近現(xiàn)實(shí)。

這就是為什么AI毫無(wú)疑問(wèn)是支撐元宇宙的基礎(chǔ)設(shè)施之一,如果沒(méi)有AI去輔助人類(lèi)制造各種數(shù)字產(chǎn)品以及擔(dān)當(dāng)NPC,元宇宙的應(yīng)用場(chǎng)景,元宇宙的豐富程度勢(shì)必受到嚴(yán)重的限制。3D區(qū)不能沒(méi)有蒂法,也不能只有蒂法。

而且我認(rèn)為更有意思的是,元宇宙也會(huì)成為AI起飛的重要推力。

09

剛才我們有講到,AI是需要大量數(shù)據(jù)去喂養(yǎng)的,現(xiàn)在AI產(chǎn)業(yè)發(fā)展遇到的最大障礙就是,容易獲得大數(shù)據(jù)領(lǐng)域?qū)嵲谑翘邢蘖耍切┎蝗菀撰@得大數(shù)據(jù)的領(lǐng)域即便有巨大的需求也會(huì)發(fā)展緩慢,比如自動(dòng)駕駛汽車(chē)。

我們固然可以用計(jì)算機(jī)模擬去訓(xùn)練自動(dòng)駕駛算法,但這里面缺乏一個(gè)關(guān)鍵的因素,那就是人。就算我們可以完美的模擬路況和車(chē)況,路上別的司機(jī)行人的各種奇葩舉動(dòng)怎么模擬?。?/p>

而元宇宙不僅能提供更大的數(shù)據(jù)量,更關(guān)鍵的是它是有大量人類(lèi)生活在其中的3D虛擬世界。在這樣的一個(gè)世界AI的應(yīng)用場(chǎng)景會(huì)被大大拓寬,然后現(xiàn)實(shí)世界當(dāng)中的AI產(chǎn)品就可以用元宇宙版本先跑到80分,再去現(xiàn)實(shí)中進(jìn)一步發(fā)展。

就比如大家知道我們?cè)?D電影和游戲當(dāng)中用到的人物表情是個(gè)很難做的東西,要做到鮮活真實(shí),就得做真人表情采集,就得找演員用專(zhuān)業(yè)設(shè)備專(zhuān)業(yè)團(tuán)隊(duì),否則就會(huì)很假。

而到了元宇宙里面,我們天然就有用虛擬人去呈現(xiàn)自己的表情去嬉笑怒罵的需求啊,在之前的節(jié)目中我們說(shuō)過(guò),facebook的下一代VR一體機(jī)設(shè)備Project Cambria有內(nèi)置的表情傳感器,于是乎facebook將獲取所用用戶表情的大數(shù)據(jù)。

在這里我可以下一個(gè)判斷,在Project Cambria發(fā)售一年之內(nèi),AI虛擬人表情假這個(gè)問(wèn)題將會(huì)被徹底的解決。

再比如剛才說(shuō)的自動(dòng)駕駛,在元宇宙里面我們可以舉辦公路拉力賽,把場(chǎng)地設(shè)定在北京城,然后觀眾可以走到賽道上,可以往賽道上扔?xùn)|西,甚至可以把自己家的車(chē)開(kāi)上賽道,這個(gè)場(chǎng)景下訓(xùn)練出的自動(dòng)駕駛AI應(yīng)對(duì)突發(fā)狀況的能力絕對(duì)炸裂。

我之前跟一個(gè)做自動(dòng)駕駛的朋友提過(guò)一個(gè)廣告營(yíng)銷(xiāo)的策劃,就是你別像馬斯克那樣整天推特上說(shuō)自己的AI出事故概率是人類(lèi)的五分之一十分之一,這沒(méi)用,大家不會(huì)信的。

你干脆拍一條廣告,在一個(gè)漆黑的雨夜,主角的豪華轎車(chē)緩緩駛?cè)胍淮笃幧某菂^(qū),這時(shí)候暗中埋伏的幾輛車(chē)突然亮起車(chē)燈,敵人要開(kāi)車(chē)撞死他進(jìn)入一段追車(chē)戲。

但是撞了半天發(fā)現(xiàn)主角的控車(chē)技術(shù)太靈活,根本就撞不到,只能眼睜睜看著他突圍而出。最后主角的車(chē)行駛到陽(yáng)光燦爛的開(kāi)闊公路上,鏡頭拉近發(fā)現(xiàn)駕駛座上竟然沒(méi)有人。這時(shí)候屏幕中間出現(xiàn)他們公司的logo。

如果自動(dòng)駕駛AI能做到這樣,那用戶自然會(huì)明白,我們安心玩手機(jī)就可以了,開(kāi)車(chē)不是我們?cè)摴艿氖聝骸?/p>

再比如其實(shí)很多人都很想要那種非常接近人類(lèi)能幫我們干各種活的通用型AI機(jī)器人,就好像銀翼殺手里面的高司令那樣,但是在現(xiàn)實(shí)當(dāng)中這種機(jī)器人不僅受到智能水平限制,還受到硬件水平的限制,說(shuō)白了就是它的身體也實(shí)現(xiàn)得不好,波士頓動(dòng)力花了30年才讓機(jī)器人能像人一樣走路。

在元宇宙里面就沒(méi)有這個(gè)限制了,機(jī)器人只需要一個(gè)模型和一些代碼就能行動(dòng)自如,到時(shí)候再把訓(xùn)練好的AI導(dǎo)出來(lái)裝在現(xiàn)實(shí)中的機(jī)械軀體上,人與機(jī)器的界限就徹底模糊了。

元宇宙作為下一代互聯(lián)網(wǎng),人類(lèi)信息技術(shù)手段的集大成者,傳播與生成的數(shù)據(jù)勢(shì)必呈指數(shù)級(jí)增長(zhǎng),AI也將受益于這樣的數(shù)據(jù)海洋,進(jìn)化速度遠(yuǎn)非今天可比。

我經(jīng)常聽(tīng)到一種說(shuō)法,就是人工智能它只能做一些機(jī)械式的操作,而人的想象力創(chuàng)造力是人工智能無(wú)法取代的。

聽(tīng)完我剛才的分析大家也能看出來(lái),這個(gè)說(shuō)法是完全錯(cuò)誤的。

10

事實(shí)上無(wú)論是掃地?cái)Q螺絲這種機(jī)械式的勞動(dòng),還是下棋打游戲這種競(jìng)技運(yùn)動(dòng),亦或是畫(huà)畫(huà)譜曲這種創(chuàng)造性工作,充分發(fā)展之后的人工智能干什么都會(huì)比人類(lèi)干得好,而且是多快好省,全方位的優(yōu)勢(shì)。

如果說(shuō)我們做事情的套路是先形成欲望,然后在我們所掌握的能力或者資源范圍當(dāng)中去尋找滿足這種欲望的方法,最終形成決策,向前推進(jìn)。

人工智能缺少的不是任何的能力或者方法,它缺的是左邊這塊,欲望。

也就是說(shuō)AI無(wú)法成為最終的決策者,它提供的只是達(dá)成目的的執(zhí)行力,或者說(shuō)他只是個(gè)工具人,這才是人與AI的根本區(qū)別所在。AI做的任何事情背后都必然有人的推動(dòng),哪一天AI真的殺了人,你最終肯定能找到一個(gè)幕后的始作俑者。

AI會(huì)帶來(lái)生產(chǎn)力的碾壓,在AI近乎無(wú)限復(fù)制的生產(chǎn)力面前,我們現(xiàn)在的那些自動(dòng)控制技術(shù),什么996007壓榨工人的操作,都會(huì)變成毛毛雨。

AI會(huì)帶來(lái)戰(zhàn)斗力的碾壓,在遮天蔽日的智能無(wú)人機(jī)蜂群面前,再?gòu)?qiáng)大的人類(lèi)飛行員都會(huì)成為小可愛(ài)。

AI會(huì)使得人類(lèi)變得更加自由,因?yàn)樗鼤?huì)放大每一個(gè)人的能力。同時(shí)它也會(huì)使怎個(gè)社會(huì)的價(jià)值創(chuàng)造向頭部集中,就是當(dāng)高端玩家的決策能力被AI無(wú)限放大的時(shí)候,當(dāng)你們單位聯(lián)歡會(huì)都能找張藝謀來(lái)導(dǎo)演的時(shí)候,低端玩家就找不到活兒干了。

這也是很多人在提全民基本所得背后根本性的原因,因?yàn)閷?duì)于絕大多數(shù)人我們目前理解的那種勞動(dòng)價(jià)值將會(huì)不復(fù)存在。

人工智能的發(fā)展提速無(wú)法阻擋,必然會(huì)對(duì)社會(huì)造成沖擊,而真正重要的是誰(shuí)能控制人工智能產(chǎn)業(yè)。

就像當(dāng)年的工業(yè)革命,我們現(xiàn)在活著的幾乎每一個(gè)人都因?yàn)楣I(yè)革命而過(guò)得更好了,但在它展開(kāi)的過(guò)程當(dāng)中,有些人借著風(fēng)口扶搖直上,另一些人則成了發(fā)展的墊腳石,甚至有些民族直接沒(méi)了,作為學(xué)習(xí)過(guò)中國(guó)近代史的中國(guó)人,我相信大家都明白這是什么意思。

這就是為什么AI產(chǎn)業(yè)是我們必須要盡全力掌握和領(lǐng)先的領(lǐng)域,而這確實(shí)也是我們的國(guó)策。在十四五規(guī)劃當(dāng)中出現(xiàn)最多次的專(zhuān)業(yè)術(shù)語(yǔ),就是人工智能,如果我沒(méi)記錯(cuò)的話,出現(xiàn)了18次。

而在那之后會(huì)發(fā)生什么,就看我們是否能夠砥礪前行不忘初心了。

 

作者:酷玩實(shí)驗(yàn)室

來(lái)源:https://mp.weixin.qq.com/s/MFtaz5efzfCZreDuXuiu3w

本文由 @酷玩實(shí)驗(yàn)室 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

作者:Deway;公眾號(hào):欲望職場(chǎng)(iWorkOn)

來(lái)源:https://mp.weixin.qq.com/s/oo1nIlKK6BnlLd3IWZul2w

本文由 @欲望職場(chǎng) 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 讀不懂的元宇宙,最重還是要靠人工智能來(lái)搭橋

    回復(fù)
  2. 哇,整篇文章也太長(zhǎng)了吧,看得我有點(diǎn)迷迷糊糊的說(shuō)實(shí)話

    來(lái)自江西 回復(fù)