ChatGPT是如何“煉成”的?
在人工智能的浪潮中,ChatGPT的橫空出世標(biāo)志著一場(chǎng)顛覆性的技術(shù)革命。然而,背后的故事和人物卻鮮為人知?!秺W爾特曼傳》為我們揭開(kāi)了這位“AI革命家”的神秘面紗,從硅谷的焦慮氛圍到OpenAI的誕生,再到GPT模型的發(fā)展歷程,書(shū)中詳細(xì)記錄了山姆·奧爾特曼和他的團(tuán)隊(duì)如何引領(lǐng)這場(chǎng)技術(shù)變革。本文摘編自《奧爾特曼傳》,帶您一探究竟,感受那些在創(chuàng)新道路上勇往直前的探索者們的非凡旅程。
雖然ChatGPT已在全球掀起顛覆性的AI革命,然而很少有人了解ChatGPT背后誕生的秘辛。
近日,湛廬文化推出“ChatGPT之父”山姆·奧爾特曼的全新傳記《奧爾特曼傳》。本書(shū)作者周恒星基于與奧爾特曼近10年的交流,首次全方位、近距離地揭秘了這位科技巨頭的Ai帝國(guó)、權(quán)力之路和未來(lái)藍(lán)圖。
在ChatGPT發(fā)布2周年之際,讓我們共同走進(jìn)書(shū)中的世界,跟隨奧爾特曼的腳步,探尋GPT模型“從零到一”的誕生歷程,致敬那些在創(chuàng)新道路上勇往直前的探索者們!
以下內(nèi)容,引自周恒星《奧爾特曼傳》。?一、西部世界
2016年初的硅谷,空氣中彌漫著焦慮的氣息。公開(kāi)和私下里,人們都在討論科技泡沫是不是要破了。
一方面,整個(gè)2015年科技公司IPO(首次公開(kāi)募股)的比例跌至過(guò)去7年來(lái)最低點(diǎn),一些小型科技公司(如yelp)的市值遭受了重創(chuàng);另一方面,科技巨頭(如蘋(píng)果和谷歌)的股價(jià)卻屢創(chuàng)新高。
這年秋天,在硅谷的一處豪宅里,舉行了一場(chǎng)私人放映活動(dòng),播放的是探討人工智能意識(shí)的科幻電視劇《西部世界》。
這場(chǎng)活動(dòng)的召集人是時(shí)年31歲的奧爾特曼?;顒?dòng)地點(diǎn)在奧爾特曼的朋友、俄羅斯籍猶太裔風(fēng)險(xiǎn)投資家尤里·米爾納(Yuri Milner)位于洛斯阿爾托斯山上的豪宅里。
受邀參加活動(dòng)的嘉賓都收到了這樣一封邀請(qǐng)函:山姆·奧爾特曼和尤里·米爾納邀請(qǐng)您參加《西部世界》首播集上映前的觀影會(huì),這是一部HBO發(fā)行的,探索人工意識(shí)和人工智能未來(lái)的新連續(xù)劇。
參加放映活動(dòng)的嘉賓都是硅谷赫赫有名的人物,包括谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林,以及許多從YC孵化器中脫穎而出的年輕創(chuàng)始人。
作為硅谷社交圈的中心,奧爾特曼希望通過(guò)這場(chǎng)放映活動(dòng),一方面引起人們對(duì)AI技術(shù)和安全性的關(guān)注,另一方面,他希望引導(dǎo)人們將注意力從對(duì)互聯(lián)網(wǎng)轉(zhuǎn)移到對(duì)硬科技(hard tech)上。
“硬科技”指的是依靠科學(xué)技術(shù)的突破和工程能力的發(fā)展,帶來(lái)重大創(chuàng)新和變革的高科技領(lǐng)域。而AI毫無(wú)疑問(wèn)是硬科技“皇冠”上的“明珠”。
奧爾特曼認(rèn)為并不存在科技泡沫,當(dāng)時(shí)是處在科技低迷期。在一篇名為《硬科技回來(lái)了》(Hard
Tech is Back)的博客文章中,奧爾特曼寫(xiě)道:
把那些關(guān)于股市何時(shí)崩盤以及融資環(huán)境受到影響的無(wú)聊文章留給其他人寫(xiě)吧,歷史也會(huì)忘記那些人?,F(xiàn)在是采取長(zhǎng)期主義并利用技術(shù)解決重大問(wèn)題的最佳時(shí)機(jī),我們比以往任何時(shí)候都更需要這些問(wèn)題的解決方案。
在這篇文章的最后,奧爾特曼特別提到了AI:AGI和特定場(chǎng)景下的AI,在當(dāng)前創(chuàng)業(yè)領(lǐng)域中似乎是最明顯的贏家。
他顯然是在暗示OpenAI將成為贏家之一,雖然當(dāng)時(shí)它還默默無(wú)聞。?二、打造現(xiàn)代版施樂(lè)PARC
2016年1月4日,新年伊始的第一個(gè)周一,OpenAI創(chuàng)始團(tuán)隊(duì)的10個(gè)人就開(kāi)始在布羅克曼的家中工作了。
第一次開(kāi)會(huì)的時(shí)候,蘇茨克弗轉(zhuǎn)身想在白板上寫(xiě)些東西,卻發(fā)現(xiàn)布羅克曼家中并沒(méi)有白板。布羅克曼只好趕快去購(gòu)置了一些辦公用品。
OpenAI 前員工皮特·阿貝爾(Pieter
Abbeel)回憶稱:
舊金山市中心的房?jī)r(jià)很高,布羅克曼的公寓也不算大,只有一個(gè)較大的廚房和一間帶沙發(fā)的客廳。有時(shí)團(tuán)隊(duì)成員找不到地方,只好坐在臥室的床上工作。但團(tuán)隊(duì)的氛圍非常好,這10個(gè)人可以說(shuō)是世界上最聰明的群體。
接下來(lái)的一個(gè)月里,布羅克曼的帶領(lǐng)下,團(tuán)隊(duì)就愿景、工作方式和目標(biāo)進(jìn)行了深入討論,并制定了一套面試流程。
接下來(lái),他們購(gòu)置了服務(wù)器,創(chuàng)建了一系列的賬號(hào)。剩余時(shí)間,布羅克曼拼命學(xué)習(xí)深度學(xué)習(xí)的教材。布羅克曼說(shuō):我只是一個(gè)解決問(wèn)題的人,花上幾周時(shí)間找到一個(gè)工程問(wèn)題,然后成為這個(gè)問(wèn)題的解決者。
在OpenAI成立的頭兩年,布羅克曼和蘇茨克弗共同做出了大部分日常決策,布羅克曼管理初創(chuàng)公司的軟件工程師,蘇茨克弗則帶領(lǐng)研究人員開(kāi)展研究。
與此同時(shí),布羅克曼一直在與奧爾特曼通過(guò)電話保持溝通。奧爾特曼說(shuō):
布羅克曼具有很強(qiáng)的能力,既能洞察技術(shù)問(wèn)題每一部分的細(xì)枝末節(jié),又能把握每個(gè)層面的重點(diǎn),然后還能從戰(zhàn)略層面思考如何將所有部分整合在一起。
布羅克曼必須解決的一個(gè)難題是,如何讓研究人員和工程師從同樣的角度出發(fā)進(jìn)行工作。據(jù)內(nèi)部人士透露,一些OpenAI的工程師低估了研究人員貢獻(xiàn)的重要性,研究人員則有時(shí)將工程師視為技術(shù)人員而非科學(xué)家。
同為OpenAI董事會(huì)成員的Quora的CEO亞當(dāng)·丹吉洛(Adam D’Angelo)說(shuō),過(guò)去的AI研究大多在實(shí)驗(yàn)室里進(jìn)行,要把技術(shù)轉(zhuǎn)化為產(chǎn)品很難,布羅克曼是那個(gè)讓AI成功產(chǎn)品化的人。
馬斯克和奧爾特曼每周都會(huì)來(lái)探班。阿貝爾回憶稱,馬斯克經(jīng)常一進(jìn)客廳就往沙發(fā)上一坐,然后說(shuō):“好吧,最近都發(fā)生了什么?”布羅克曼便會(huì)向他介紹最近一周的工作進(jìn)展。
自從跟施樂(lè)的計(jì)算機(jī)科學(xué)家艾倫·凱共進(jìn)晚餐后,布羅克曼和蘇茨克弗就開(kāi)始計(jì)劃打造一家現(xiàn)代版的施樂(lè)PARC:PARC的開(kāi)放和自由研究催生了從圖形用戶界面到激光打印機(jī)再到面向?qū)ο缶幊痰纫幌盗袆?chuàng)新;盡管PARC雖然屬于施樂(lè)公司,但它的研究成果也惠及了包括蘋(píng)果在內(nèi)的眾多公司,史蒂夫·喬布斯也能夠接觸PARC的研究成果。
布羅克曼也希望每個(gè)人都能接觸到OpenAI的研究成果。
布羅克曼說(shuō)道:
RARC真正特別的地方在于,他們聚集了一群聰明人,并賦予他們自由發(fā)揮的空間。我們希望構(gòu)建一個(gè)共同的愿景,同時(shí)避免中央控制。
放棄控制是開(kāi)源理念的核心。
秉持開(kāi)源理念的人相信,如果有足夠多的人致力于一個(gè)共同目標(biāo),最終的成果將超過(guò)任何封閉性環(huán)境中構(gòu)思出來(lái)的東西。?三、“OpenAI”是最好的去處
2016年4月,團(tuán)隊(duì)終于告別了布羅克曼的家,搬進(jìn)了位于舊金山教會(huì)區(qū)的一家小型巧克力工廠的樓上。這間辦公室是奧爾特曼從紅杉資本那里租來(lái)的。
搬進(jìn)新辦公室后,奧爾特曼做的第一件事是在墻上寫(xiě)下美國(guó)海軍上將海曼·里科弗(Hyman
Rickover)的名言:
生命的偉大之處不在于知識(shí),而在于行動(dòng)。
在《硬科技回來(lái)了》這篇博客中,奧爾特曼并沒(méi)有提到OpenAI,因?yàn)樵诋?dāng)時(shí)的環(huán)境下,OpenAI顯然不是贏家。在與科技巨頭爭(zhēng)奪人才的戰(zhàn)爭(zhēng)中,OpenAI處于下風(fēng)。
早在2014年,微軟副總裁彼得·李(Peter Lee)就表示,一位頂級(jí)AI研究員的成本已經(jīng)超過(guò)了美國(guó)國(guó)家橄欖球聯(lián)盟(NFL)中一位頂級(jí)四分衛(wèi)的成本。
作為一家非營(yíng)利性組織,OpenAI的資金有限,不能像許多創(chuàng)業(yè)公司那樣提供股權(quán)激勵(lì)。在OpenAI成立當(dāng)月,奧爾特曼接受媒體采訪時(shí)承認(rèn),自己在營(yíng)利性的初創(chuàng)企業(yè)方面積累了豐富的經(jīng)驗(yàn),而在非營(yíng)利性組織方面的經(jīng)驗(yàn)很少。
但他相信,即使是一家非營(yíng)利性組織,組織的質(zhì)量也是由人才決定的。
由于奧爾特曼和馬斯克都有全職工作,蘇茨克弗將主要重心放在了研究上,招聘的重任便落在了布羅克曼肩上。
奧爾特曼曾形容布羅克曼是“世界級(jí)”的招聘高手:“他會(huì)精心策劃面試的每個(gè)細(xì)節(jié),深入研究候選人的背景,并進(jìn)行周到而持久的后續(xù)跟進(jìn)?!?/p>
“他非常愿意接受反饋。無(wú)論是大事小情,他總是樂(lè)于傾聽(tīng),從不生氣,并且能夠迅速處理?!眾W爾特曼在自己的博客中對(duì)布羅克曼大加贊賞。
而且布羅克曼工作非常勤奮。他的同事回憶說(shuō),即使在OpenAI搬出他家的公寓后,他依然幾乎住在辦公室里。一位前員工說(shuō),當(dāng)他們?cè)缟系竭_(dá)辦公室時(shí),布羅克曼已經(jīng)在伏案工作,當(dāng)他們晚上離開(kāi)時(shí),他仍在敲擊鍵盤。
2016年5月,當(dāng)時(shí)在谷歌大腦工作的頂尖人工智能研究員達(dá)里奧·阿莫代(Dario Amodei)到OpenAI的辦公室拜訪。
奧爾特曼試圖說(shuō)服他加入,但阿莫代告訴奧爾特曼和布羅克曼,沒(méi)有人理解他們?cè)谧鍪裁矗篛penAI籌集了10億美元并雇用了一個(gè)有30名研究員的團(tuán)隊(duì),這令人印象深刻——但這是為了什么?
“AI領(lǐng)域內(nèi)有二三十個(gè)人,還有哈佛大學(xué)哲學(xué)家尼克·博斯特羅姆(Nick Bostrom)和維基百科的文章都在說(shuō),OpenAI的目標(biāo)是構(gòu)建友好型AI然后將源代碼發(fā)布給全世界?!卑⒛苫蟮乜粗鴬W爾特曼和布羅克曼。
“我們不打算發(fā)布所有的源代碼,”奧爾特曼說(shuō),“但請(qǐng)不要試圖在維基百科上糾正這一點(diǎn)。通常情況下,這只會(huì)讓事情變得更糟?!?/p>
“那你們的目標(biāo)是什么?”阿莫代繼續(xù)追問(wèn)。
布羅克曼有點(diǎn)無(wú)奈地回答說(shuō):“我們現(xiàn)在的目標(biāo)是……盡最大的努力。這有點(diǎn)模糊?!?/p>
阿莫代走后,奧爾特曼和布羅克曼開(kāi)始思考,如果想招募最優(yōu)秀的團(tuán)隊(duì),就必須有清晰的使命和價(jià)值觀。
“我們應(yīng)該傳達(dá)一個(gè)足夠大膽的愿景。”奧爾特曼建議說(shuō)。
2016年6月,在一篇名為《我們的技術(shù)目標(biāo)》(OpenAI Technical Goals)的公告中,OpenAI詳細(xì)列出了公司的使命和幾大技術(shù)目標(biāo)。其中第一句就是:
OpenAI的使命是構(gòu)建安全的AI,并確保AI的好處盡可能廣泛而平等地分布。
這篇文章的署名是OpenAI的4位創(chuàng)始人:蘇茨克弗、布羅克曼、奧爾特曼、馬斯克。
《紐約時(shí)報(bào)》記者凱德·梅茨(Cade Metz)評(píng)論說(shuō):
從一開(kāi)始,他們就設(shè)立了非常崇高的目標(biāo),這些目標(biāo)容易衡量、容易理解,并保證能夠吸引注意力,即使他們實(shí)際上還沒(méi)有做任何實(shí)質(zhì)性的事情。
OpenAI聯(lián)合創(chuàng)始人、研究員沃伊切赫·扎倫巴(WojciechZaremba)回憶說(shuō),來(lái)自科技巨頭的工作邀約金簡(jiǎn)直高到離譜。
盡管他對(duì)谷歌和Facebook等公司非常尊重,但那些近乎瘋狂的報(bào)價(jià)實(shí)際上讓他感到厭惡。他更加傾向于加入OpenAI這樣具有宏偉使命的創(chuàng)業(yè)公司。
“我意識(shí)到,”扎倫巴說(shuō),“OpenAI是最好的去處?!?/p>
在OpenAI的官網(wǎng)上,這家初創(chuàng)組織的網(wǎng)頁(yè)設(shè)計(jì)顯得有些過(guò)于花哨,并且公告更新頻繁,每一篇文章都配有精美的插圖——我相信這些插圖至少在早期是手工繪制的,而非AI所作。
在當(dāng)時(shí),OpenAI的官網(wǎng)上每隔幾天就會(huì)發(fā)布新成員加入的公告,公告中會(huì)詳細(xì)列出新成員的名字和簡(jiǎn)介,連實(shí)習(xí)生也未遺漏。這很可能是奧爾特曼的主意。
一方面,這種儀式感增強(qiáng)了團(tuán)隊(duì)的凝聚力;另一方面,也吸引了潛在的招聘對(duì)象。(“哇,又一個(gè)行業(yè)大咖加入了OpenAI,我是不是也應(yīng)該考慮一下?”)
比如2016年3月,他們公布了4位全職研究員的加入,這些研究員都是在華盛頓瑰麗酒店的一次晚宴上招募的,其中就包括機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物伊恩·古德費(fèi)洛(Ian Goodfellow);還有一位華人實(shí)習(xí)生范林曦(Linxi “Jim” Fan),他后來(lái)成了英偉達(dá)的AI科學(xué)家,在社交媒體上非?;钴S。
5月加入的員工中,有幾位是布羅克曼在Stripe的舊部,包括設(shè)計(jì)團(tuán)隊(duì)主管路德維格·彼得松(Ludwig Pettersson)和工程師喬納斯·施奈德(Jonas Schneider)。
8月的公告顯示,奧爾特曼一直想招募的達(dá)里奧·阿莫代加入了公司,出任首席研究員。他的妹妹丹妮拉·阿莫代(Daniela Amodei)之前就與布羅克曼合作過(guò),兩年后,在布羅克曼的邀請(qǐng)下,丹妮拉也加入了團(tuán)隊(duì)。
2017年1月的公告顯示,前谷歌科學(xué)家、機(jī)器學(xué)習(xí)領(lǐng)域的重量級(jí)人物雅羅斯拉夫·布拉托夫(Yaroslav Bulatov)加入了團(tuán)隊(duì),還有幾位YC的骨干成員也加入進(jìn)來(lái)。
這篇公告還透露,OpenAI團(tuán)隊(duì)現(xiàn)在有45名成員,團(tuán)隊(duì)的目標(biāo)是:
齊心協(xié)力,不斷推進(jìn)AI能力的發(fā)展前沿——無(wú)論是驗(yàn)證新的想法、創(chuàng)建新的軟件系統(tǒng),還是在機(jī)器人上部署機(jī)器學(xué)習(xí)。?四、“我們從零開(kāi)始”
OpenAI看似目標(biāo)明確,實(shí)則缺乏方向。
奧爾特曼在YC的經(jīng)歷似乎并沒(méi)有派上用場(chǎng)。在YC,奧爾特曼總是告訴創(chuàng)始人,要打破常規(guī)快速行動(dòng),迅速推出產(chǎn)品。然而,他后來(lái)承認(rèn):
OpenAI做了很多與YC建議的標(biāo)準(zhǔn)相反的事情。成立之初,我們對(duì)產(chǎn)品沒(méi)有任何概念,也沒(méi)有與用戶進(jìn)行交流。
奧爾特曼擅長(zhǎng)向投資人推銷項(xiàng)目,但在OpenAI這里卻行不通,因?yàn)镺penAI靠的是捐贈(zèng)而非投資。要持續(xù)獲得捐贈(zèng),就必須拿出實(shí)實(shí)在在的研究成果,而不是承諾投資回報(bào)。
由于缺乏明確的方向,團(tuán)隊(duì)在布羅克曼和蘇茨克弗的帶領(lǐng)下,確定了幾個(gè)關(guān)鍵的研究方向來(lái)探索AI的可能性。
第一,OpenAI推出了“Universe”平臺(tái),旨在創(chuàng)建一個(gè)虛擬世界,讓AI可以像人類一樣操作電腦,通過(guò)虛擬的鍵盤和鼠標(biāo)來(lái)玩游戲、瀏覽網(wǎng)頁(yè)和觀看視頻。
這個(gè)平臺(tái)的靈感來(lái)源于成功推動(dòng)圖像識(shí)別技術(shù)發(fā)展的ImageNet。Universe提供了一個(gè)通用接口,通過(guò)VNC服務(wù)器連接無(wú)限的互聯(lián)網(wǎng)環(huán)境,使AI能夠在多種游戲和應(yīng)用中進(jìn)行訓(xùn)練,包括EA、MicrosoftStudios和Valve等公司授權(quán)的游戲。
第二,OpenAI在機(jī)器人技術(shù)方面取得了顯著進(jìn)展。
沃伊切赫·扎倫巴帶領(lǐng)的團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)能夠自學(xué)還原魔方的五指機(jī)械手。這個(gè)項(xiàng)目通過(guò)數(shù)字仿真,在虛擬現(xiàn)實(shí)中訓(xùn)練機(jī)器手,讓它在相當(dāng)于一萬(wàn)年的時(shí)間里學(xué)會(huì)了還原魔方的各種動(dòng)作。這種方法的巨大優(yōu)勢(shì)在于,機(jī)器人能夠在虛擬環(huán)境中學(xué)習(xí)技能,然后將這些技能應(yīng)用到現(xiàn)實(shí)世界中,處理各種不確定性。
第三,他們嘗試在復(fù)雜的游戲環(huán)境中訓(xùn)練AI。
布羅克曼認(rèn)為,DOTA(《魔獸爭(zhēng)霸》)是一個(gè)極佳的訓(xùn)練場(chǎng),因?yàn)樗婕皥F(tuán)隊(duì)合作、實(shí)時(shí)策略、不完全信息以及龐大的英雄和物品組合。
布羅克曼領(lǐng)導(dǎo)的DOTA2項(xiàng)目幫助打破了僵局。為了推動(dòng)這項(xiàng)工作,布羅克曼與DOTA2的開(kāi)發(fā)人員進(jìn)行了數(shù)小時(shí)的電話交談,以弄清楚如何讓玩游戲的軟件工作,這是一個(gè)技術(shù)挑戰(zhàn),因?yàn)橛螒蚝蚈penAI的算法是用不同的編程語(yǔ)言編寫(xiě)的。
OpenAI的AI首次亮相是在2017年的DOTA 2國(guó)際邀請(qǐng)賽上,它在1v1的對(duì)決中戰(zhàn)勝了頂尖選手登迪(Dendi)。
如果我們回頭看,實(shí)際上OpenAI的方向是錯(cuò)的:當(dāng)時(shí)OpenAI內(nèi)部以及業(yè)內(nèi)的普遍觀點(diǎn)是,要想做出強(qiáng)大的AI,有時(shí)需要從瑣碎的事情開(kāi)始。
電子游戲和機(jī)器人手臂,將為自動(dòng)駕駛汽車和治愈癌癥的AI鋪平道路。
所以當(dāng)時(shí)這些系統(tǒng)都是窄領(lǐng)域的,非常有針對(duì)性——下圍棋的系統(tǒng)甚至不能下國(guó)際象棋,更不用說(shuō)理解語(yǔ)言了。預(yù)測(cè)機(jī)票價(jià)格波動(dòng)的系統(tǒng),卻不能處理文本。
因此,每次有一個(gè)新的應(yīng)用程序,都需要訓(xùn)練一個(gè)新的系統(tǒng)。這需要很長(zhǎng)時(shí)間以及大量標(biāo)注數(shù)據(jù)等。
OpenAI的前員工回憶當(dāng)時(shí)的情景:
我們?cè)谧鲆恍╇S機(jī)的事情,看看會(huì)發(fā)生什么。有時(shí)感覺(jué)構(gòu)建的東西和想象的目標(biāo)之間有很大的差距。上班時(shí)大家編程讓機(jī)器人玩電子游戲,午餐時(shí)則圍坐在桌旁,談?wù)撝绾握热祟悺?/p>
客觀地說(shuō),通過(guò)在虛擬世界和復(fù)雜游戲環(huán)境中訓(xùn)練AI,OpenAI展示了其在AI領(lǐng)域的野心和創(chuàng)新。但他們并沒(méi)有取得突破性的進(jìn)展,最初捐贈(zèng)的資金也在一點(diǎn)點(diǎn)耗盡。雖然團(tuán)隊(duì)的干勁非常高漲,但馬斯克和奧爾特曼卻在暗暗著急。
奧爾特曼承認(rèn):
我們什么都不順利,而谷歌擁有一切:所有的人才、所有的人力、所有的資金。
布羅克曼后來(lái)回憶說(shuō):
我們已經(jīng)成立了兩年,我們做了什么?
我們?nèi)〉昧耸裁闯删??我們有一支很棒的團(tuán)隊(duì),但是我們有出色的結(jié)果嗎?
我認(rèn)為我們都非常雄心勃勃。我們都真誠(chéng)地希望能在這個(gè)領(lǐng)域產(chǎn)生影響。我們都渴望感覺(jué)到自己能夠引導(dǎo)它,讓情況與沒(méi)有我們時(shí)有所不同。這就是我們聚集在這里的原因。然而,當(dāng)時(shí)我們還不清楚這一切能否實(shí)現(xiàn)。
這種焦慮甚至讓布羅克曼開(kāi)始練習(xí)舉重,他開(kāi)玩笑說(shuō),即使OpenAI倒閉了,至少在這段時(shí)間里還能有個(gè)可以交代的事情。
在那段時(shí)間,OpenAI還進(jìn)行了一次小規(guī)模的裁員,暫停了機(jī)器人手臂的項(xiàng)目。機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)軍人物伊恩·古德費(fèi)洛也在這段時(shí)間重新回到了谷歌。奧爾特曼后來(lái)回憶道:
我們太早開(kāi)始研究機(jī)器人了,所以不得不擱置那個(gè)項(xiàng)目。
那個(gè)項(xiàng)目也因?yàn)殄e(cuò)誤的原因而變得困難,無(wú)助于我們?cè)跈C(jī)器學(xué)習(xí)研究的困難部分取得進(jìn)展。我們一直在處理糟糕的模擬器和肌腱斷裂之類的問(wèn)題。
隨著時(shí)間的推移,我們也越來(lái)越意識(shí)到,我們首先需要的是智能和認(rèn)知,然后才能想辦法讓它適應(yīng)物理特性。從我們構(gòu)建這些語(yǔ)言模型的方式來(lái)看,從那兒開(kāi)始更容易。但我們一直計(jì)劃回到這個(gè)問(wèn)題上來(lái)。
與谷歌的競(jìng)爭(zhēng)漸漸演變成了一場(chǎng)軍備競(jìng)賽。資金難題并不是蘇茨克弗和布羅克曼可以解決的,于是問(wèn)題拋到了奧爾特曼和馬斯克兩位聯(lián)合主席這里。
奧爾特曼后來(lái)坦誠(chéng),“我們并沒(méi)有直觀意識(shí)到這個(gè)項(xiàng)目會(huì)有多昂貴”,他補(bǔ)充道,“我們現(xiàn)在仍然不知道”。
在YC的經(jīng)歷讓奧爾特曼更善于傾聽(tīng)并想方設(shè)法解決問(wèn)題。他明白,為了提高算力必須籌措更多的資金。為此,奧爾特曼研究了多種為OpenAI籌集資金的方案,例如獲得美國(guó)政府的資金支持和推出新的加密貨幣。
然而,他也承認(rèn):“沒(méi)有人愿意以任何方式資助這個(gè)項(xiàng)目,那段時(shí)間真的很艱難?!?/p>
布羅克曼有些無(wú)奈地說(shuō):
想象一下——我們從零開(kāi)始,“我們只是有這樣一個(gè)理想,希望AGI能夠順利發(fā)展?!?/p>
就在此時(shí),他們的競(jìng)爭(zhēng)對(duì)手谷歌給了他們一次關(guān)鍵助攻。?五、Transformer論文和GPT-1發(fā)布
2017年初,蘇茨克弗與OpenAI的研究科學(xué)家亞歷克·拉德福德(Alec Radford)開(kāi)展了一系列關(guān)于神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理領(lǐng)域的研究。
拉德福德很年輕,當(dāng)時(shí)只有23歲。拉德福德的模型足夠直觀,當(dāng)他審視模型的隱藏層時(shí),他意外地發(fā)現(xiàn)了一個(gè)專門用于分析評(píng)論情感的特定神經(jīng)元。
以往的神經(jīng)網(wǎng)絡(luò)雖然也能進(jìn)行情感分析,但它們需要明確的指示并接受特殊訓(xùn)練,還要使用標(biāo)記了情感的數(shù)據(jù)。然而,拉德福德的神經(jīng)網(wǎng)絡(luò)卻自發(fā)地學(xué)會(huì)了這項(xiàng)技能。
他們的第一個(gè)實(shí)驗(yàn)是掃描20億條Reddita的評(píng)論,用神經(jīng)網(wǎng)絡(luò)訓(xùn)練一個(gè)語(yǔ)言模型。像OpenAI早期的很多實(shí)驗(yàn)一樣,這個(gè)實(shí)驗(yàn)失敗了。這個(gè)模型只能偶爾生成一個(gè)通順的句子,而且要很費(fèi)力才能理解它。蘇茨克弗和布羅克曼鼓勵(lì)拉德福德不要泄氣,繼續(xù)嘗試。
“我們覺(jué)得亞歷克斯很棒,就讓他按自己的想法去做吧。”布羅克曼說(shuō)。
后來(lái)拉德福德收集了大約1億條亞馬遜購(gòu)物網(wǎng)站上的產(chǎn)品評(píng)論,訓(xùn)練了另一個(gè)語(yǔ)言模型。這次的結(jié)果比上次要好很多。
于是,蘇茨克弗想,如果在更廣泛的語(yǔ)言數(shù)據(jù)上訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),是否能夠揭示出更豐富的世界意義結(jié)構(gòu)。如果其隱藏層能積累足夠多的概念知識(shí),它們或許能成為超級(jí)智能形成的基礎(chǔ)學(xué)習(xí)模塊。
蘇茨克弗鼓勵(lì)拉德福德將視野擴(kuò)大,不應(yīng)僅限于亞馬遜的評(píng)論。他提議,他們應(yīng)該培養(yǎng)一個(gè)AI,讓它從全球最大、最多樣化的數(shù)據(jù)源,也就是互聯(lián)網(wǎng)中進(jìn)行學(xué)習(xí)。
但在2017年初,基于當(dāng)時(shí)的神經(jīng)網(wǎng)絡(luò)架構(gòu),這個(gè)想法看上去顯得不切實(shí)際,因?yàn)檫@可能需要數(shù)年的時(shí)間來(lái)實(shí)現(xiàn)。
然而,恰恰在這時(shí),谷歌的“Transformer論文”出現(xiàn)了。
2017年6月,一篇由8位谷歌研究人員合著、具有里程碑意義的論文橫空出世,它的正式標(biāo)題是《我注意力是你所需要的全部》(Attention Is All You Need)。
這篇論文所提出的Transformer模型是一個(gè)超級(jí)高效的學(xué)習(xí)者,它不僅能夠一次性把整句話都看進(jìn)去,還能理解每個(gè)詞和句子中其他詞之間的關(guān)系。
就像是有一個(gè)超級(jí)記憶力的人,不僅記得每個(gè)人說(shuō)的每句話,還理解他們之間的關(guān)系。它賦予了計(jì)算機(jī)類似人類的語(yǔ)言理解能力。
Transformer模型用了一種特別的技巧——“自我注意力”,它能夠一眼就看到句子中所有的詞,并且理解它們之間的聯(lián)系。這樣,它就能夠很好地處理那些需要長(zhǎng)時(shí)間記憶的信息,并且學(xué)習(xí)速度飛快。
Transformer模型做了一件對(duì)當(dāng)時(shí)來(lái)說(shuō)非常重要的事情。在過(guò)去,AI系統(tǒng)需要輸入非常具體的數(shù)據(jù),每條數(shù)據(jù)必須被標(biāo)注:這個(gè)是正確的,這個(gè)是錯(cuò)誤的;這個(gè)是垃圾郵件,這個(gè)不是垃圾郵件;這個(gè)是癌癥,這個(gè)不是癌癥……
但Transformer模型允許AI接收混亂的、未標(biāo)記的數(shù)據(jù)。而且它可以比預(yù)期更高效地做到這一點(diǎn),使用的算力更少。
Transformer模型的出現(xiàn),極大地提升了計(jì)算機(jī)處理語(yǔ)言的能力,使得機(jī)器翻譯、語(yǔ)音識(shí)別和文本摘要等任務(wù)變得更加高效和精確,這對(duì)整個(gè)行業(yè)來(lái)說(shuō)是一個(gè)巨大的飛躍。
現(xiàn)在,這些基于Transformer的模型可以自我學(xué)習(xí)。于是業(yè)內(nèi)領(lǐng)悟到:最好的AI并不來(lái)自最專業(yè)的訓(xùn)練技術(shù),而是來(lái)自擁有最多數(shù)據(jù)的技術(shù)。
然而,Transformer模型剛開(kāi)始并沒(méi)有馬上征服世界,甚至連谷歌都沒(méi)有征服。當(dāng)時(shí)只有少數(shù)幾個(gè)人理解這一突破有多么強(qiáng)大,蘇茨克弗就是其中之一。
在OpenAI的早期,蘇茨克弗就一直有一個(gè)預(yù)感,即AI的重大進(jìn)展不會(huì)來(lái)自某個(gè)特定的調(diào)整或新發(fā)明,而是來(lái)自更多的數(shù)據(jù),就像是向引擎中倒入越來(lái)越多的燃料。現(xiàn)在,Transformer論文支持了他的這個(gè)預(yù)感。
“當(dāng)這篇論文發(fā)布的第二天,我們就意識(shí)到,這正是我們所需要的,”蘇茨克弗回憶道,“它具備了我們所追求的一切特性?!闭缢睦蠋熜令D所說(shuō),蘇茨克弗有非常好的技術(shù)直覺(jué)。
而布羅克曼把這看作是運(yùn)氣和努力的結(jié)合:“這一直是我們的策略——努力解決問(wèn)題,然后相信我們或者領(lǐng)域內(nèi)的某個(gè)人將設(shè)法找到缺失的要素。”
蘇茨克弗建議拉德福德開(kāi)始嘗試使用Transformer架構(gòu)。結(jié)果不出所料,在接下來(lái)的兩周里,取得的進(jìn)展比過(guò)去兩年還要多。
就像奧爾特曼在2023年所說(shuō)的那樣:“Transformer論文發(fā)表時(shí),我覺(jué)得谷歌沒(méi)人意識(shí)到它會(huì)產(chǎn)生怎樣深遠(yuǎn)的影響?!?/p>
2018年6月,在Transformer論文發(fā)表的一年后,OpenAI發(fā)布了GPT-1,“GPT”是“generatively
pretrained transformer”(生成式預(yù)訓(xùn)練變換器)的首字母縮寫(xiě)。
最終,這個(gè)模型被普遍稱為“生成式人工智能”(generativeAI)。
為了開(kāi)發(fā)出這個(gè)模型,他們收集了7000本未出版的書(shū)籍,其中有很多屬于浪漫、奇幻、冒險(xiǎn)的類型,并根據(jù)Quora網(wǎng)站上的問(wèn)答以及從初中和高中考試?yán)镎浀臄?shù)千篇文章對(duì)其進(jìn)行了完善。
總而言之,這個(gè)模型包含了1.17億個(gè)參數(shù)或變量。它在理解語(yǔ)言與生成答案方面超越了之前的所有產(chǎn)品。
GPT-1模型最令人驚奇的是它的廣泛適用性,它是一個(gè)“通才”。
無(wú)論哪個(gè)話題,你都可以向它提問(wèn),而它總能給出令人驚嘆的高質(zhì)量答案。這是因?yàn)镚PT-1經(jīng)過(guò)了廣泛的訓(xùn)練,涵蓋了人類可用的整個(gè)文本語(yǔ)料庫(kù),包括數(shù)十億個(gè)句子。
無(wú)論是你閱讀過(guò)的文件、備忘錄、瑣事,還是《哈利·波特》系列小說(shuō),所有這些內(nèi)容都被納入了模型的訓(xùn)練之中。
這是我們第一次擁有這樣一個(gè)系統(tǒng)。這標(biāo)志著人工智能正在從狹窄領(lǐng)域向通用領(lǐng)域轉(zhuǎn)變。?六、規(guī)模法則:大力出奇跡
OpenAI團(tuán)隊(duì)很快發(fā)現(xiàn),充分發(fā)揮Transformer新模型潛力的關(guān)鍵是擴(kuò)大規(guī)模——在龐大的數(shù)據(jù)集上訓(xùn)練模型。這一事實(shí)證明OpenAI已經(jīng)找到了突破點(diǎn)。蘇茨克弗說(shuō):
我們已經(jīng)找到了進(jìn)步的公式,現(xiàn)在每個(gè)人都知道——深度學(xué)習(xí)的氧和氫就是大規(guī)模神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)計(jì)算。
而奧爾特曼后來(lái)在與比爾·蓋茨對(duì)話時(shí)這樣總結(jié)道:
構(gòu)建GPT-1的那個(gè)人(拉德福德)基本上是獨(dú)立完成的,他獨(dú)自解決了這個(gè)問(wèn)題,這在某種程度上是令人印象深刻的,但他并沒(méi)有深入理解GPT-1是如何工作的或者為什么有效。隨后我們掌握了規(guī)模法則(Scaling Law)。
我們能夠預(yù)測(cè)它會(huì)變得多么出色。這就是為什么,當(dāng)我們告訴你我們可以做一個(gè)演示時(shí),我們相當(dāng)有信心它會(huì)成功。我們還沒(méi)有訓(xùn)練模型,但我們相當(dāng)有信心。
這導(dǎo)致我們進(jìn)行了一系列的嘗試,并逐漸獲得了更好的科學(xué)理解,了解到底發(fā)生了什么。但這確實(shí)首先來(lái)自于經(jīng)驗(yàn)結(jié)果。
后來(lái),OpenAI專門發(fā)表了一篇論文《神經(jīng)語(yǔ)言模型的規(guī)模法則》(Scaling Laws for Neural Language Models)來(lái)系統(tǒng)闡述規(guī)模法則。
此后,規(guī)模法則成為AI領(lǐng)域的第一性原理,這個(gè)詞也成為這波AI浪潮中最常被提及的關(guān)鍵詞。
規(guī)模法則其實(shí)就是俗話說(shuō)的“大力出奇跡”,依靠的是從量變到質(zhì)變,它之所以能成為AI時(shí)代的第一性原理,主要基于以下兩個(gè)方面:
首先是足夠通用,不管是文本、音頻還是視頻,所有的問(wèn)題都可以被轉(zhuǎn)換為“預(yù)測(cè)下一個(gè)token”。這里的“token”指的是文本數(shù)據(jù)的基本單位。
在一次播客中,蘇茨克弗詳細(xì)闡述了他為何認(rèn)為像大型語(yǔ)言模型這樣本質(zhì)上只是預(yù)測(cè)下一個(gè)字符的工具,卻能夠產(chǎn)生超越人類智慧總和的智能。他解釋說(shuō):很多人認(rèn)為,大模型只是通過(guò)像統(tǒng)計(jì)學(xué)一樣的方式來(lái)模仿人類現(xiàn)有的知識(shí)和能力,沒(méi)有辦法超越人類。
但是,如果你的基礎(chǔ)神經(jīng)網(wǎng)絡(luò)足夠聰明,你只需問(wèn)它——一個(gè)具有偉大洞察力、智慧和能力的人會(huì)怎么做?也許這樣的人并不存在,但神經(jīng)網(wǎng)絡(luò)很有可能能夠推斷出這樣的人的行為方式。
其次是可規(guī)?;灰度胱銐蚨嗟乃懔Α?shù)據(jù),模型就會(huì)變得更強(qiáng)大。只要在較小的參數(shù)規(guī)模上驗(yàn)證了效果,就可以通過(guò)增加計(jì)算資源和數(shù)據(jù)量,以“大力出奇跡”的方式獲得更好的性能。
這進(jìn)一步使得我們能夠模擬整個(gè)物理世界——無(wú)論是自動(dòng)駕駛還是機(jī)器人等場(chǎng)景,都可以一并得到解決。
正如蘇茨克弗總結(jié)的那樣:
只要能夠非常好地預(yù)測(cè)下一個(gè)token,就能幫助人類達(dá)到AGI。
2017年12月,奧爾特曼在一篇博客里暗示了這一改變:
硬件正在以指數(shù)級(jí)的速度改進(jìn),在OpenAI工作期間,最令我驚訝的發(fā)現(xiàn)是:計(jì)算能力的增強(qiáng)與AI突破之間有著密切關(guān)聯(lián),從事AI研究的聰明人的數(shù)量也在呈指數(shù)級(jí)增長(zhǎng)。
這種方法還要求OpenAI改變公司文化。任OpenAI董事、Quora創(chuàng)始人亞當(dāng)·丹吉洛表示:“為了充分利用Transformer,你需要將其擴(kuò)大規(guī)模?!?/p>
他還說(shuō):“你需要像一個(gè)工程組織一樣運(yùn)行它。不能讓每個(gè)研究人員都各自為戰(zhàn),訓(xùn)練自己的模型,制作那些只為了發(fā)表論文的漂亮東西。你必須進(jìn)行更加繁瑣、不那么優(yōu)雅的工作?!彼a(bǔ)充說(shuō),這正是OpenAI能夠做到而其他人無(wú)法做到的事情。
但這一改變帶來(lái)了一個(gè)新問(wèn)題,奧爾特曼和馬斯克很快發(fā)現(xiàn),光有人才遠(yuǎn)遠(yuǎn)不夠,還需要有大量的算力。
就在OpenAI和行業(yè)內(nèi)其它公司都在為缺乏算力發(fā)愁時(shí),一個(gè)傳奇創(chuàng)業(yè)者敏銳捕捉到了其中的機(jī)會(huì)。七、黃仁勛押注AI,英偉達(dá)迎接挑戰(zhàn)
黃仁勛,這位手臂上有刺青、愛(ài)穿黑色皮衣的創(chuàng)業(yè)者,自30歲那年創(chuàng)立英偉達(dá)以來(lái),20多年間,經(jīng)歷了芯片半導(dǎo)體領(lǐng)域的起起落落。
截至目前,在美國(guó)市值一萬(wàn)億美元以上的公司里,英偉達(dá)是唯一一家曾兩次從高點(diǎn)下跌超過(guò)85%的公司。
在標(biāo)準(zhǔn)計(jì)算機(jī)架構(gòu)中,一個(gè)被稱為“中央處理單元”(central processing
unit,CPU)的微芯片承擔(dān)了大部分工作。程序員編寫(xiě)程序,這些程序?qū)?shù)學(xué)問(wèn)題交給CPU,后者一次產(chǎn)生一個(gè)解決方案。
幾十年來(lái),CPU的主要制造商是英特爾,英特爾曾多次試圖將英偉達(dá)逼出市場(chǎng)。黃仁勛說(shuō):“我絕不接近英特爾”。他形容他們之間的關(guān)系就像貓和老鼠,“每當(dāng)他們靠近我們,我就抓起我的芯片跑掉?!?/p>
黃仁勛決定用差異化的產(chǎn)品與巨頭競(jìng)爭(zhēng),那就是“圖形處理單元”(graphics-processing
unit,GPU)。
1999年,英偉達(dá)在上市后不久推出了一款名為GeForce的顯卡,也就是后人常說(shuō)的GPU。與通用的CPU不同,GPU將復(fù)雜的數(shù)學(xué)任務(wù)分解為小計(jì)算,然后以并行計(jì)算的方法同時(shí)處理所有任務(wù)。
CPU就像一輛遞送貨物的卡車,一次只能送出一個(gè)包裹;而GPU更像是一個(gè)遍布整個(gè)城市的摩托車隊(duì)。
正是基于這種特性,GPU可以完成復(fù)雜的運(yùn)算,這是加密貨幣市場(chǎng)、深度神經(jīng)網(wǎng)絡(luò)以及大屏幕上呈現(xiàn)絢麗色彩所必需的。
同樣,這些技術(shù)可以讓殘酷的射擊游戲無(wú)比逼真,讓自動(dòng)駕駛汽車在沒(méi)有協(xié)助的情況下做出S型拐彎。它們可以賦予計(jì)算機(jī)視力、聽(tīng)力、理解能力和學(xué)習(xí)能力。
很快,一群人工智能研究員發(fā)現(xiàn)了英偉達(dá)GPU在訓(xùn)練神經(jīng)網(wǎng)絡(luò)過(guò)程中的潛力。
2012年,辛頓帶領(lǐng)兩位愛(ài)徒亞歷克斯·克里澤夫斯基和伊利亞·蘇茨克弗推出AlexNet,相比谷歌用了16000顆CPU,AlexNet只用了4顆英偉達(dá)GPU,在學(xué)術(shù)界和產(chǎn)業(yè)界引發(fā)了轟動(dòng)。
AlexNet完成了計(jì)算機(jī)視覺(jué)領(lǐng)域的巨大突破,它成功證明了深度神經(jīng)網(wǎng)絡(luò)(DNN)可以有效地對(duì)許多對(duì)象進(jìn)行分類,而增加訓(xùn)練數(shù)據(jù)量可以提高DNN的有效性。
開(kāi)發(fā)和訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)需要大量計(jì)算資源,并且如果使用大規(guī)模并行性的GPU,可以比單獨(dú)使用多核CPU實(shí)現(xiàn)更短的訓(xùn)練周期。
黃仁勛敏銳地意識(shí)到,英偉達(dá)的下一個(gè)增長(zhǎng)點(diǎn)在人工智能領(lǐng)域。黃仁勛打賭英偉達(dá)的計(jì)算機(jī)芯片可以成為人工智能的大腦,他決定將自己所有的籌碼放上賭桌。
黃仁勛后來(lái)回憶說(shuō):
我們有幸退后一步,問(wèn)自己這對(duì)計(jì)算機(jī)未來(lái)意味著什么。我們得出了正確的結(jié)論,這將改變計(jì)算方式,這將改變軟件編寫(xiě)方式,這將改變我們可以編寫(xiě)的應(yīng)用程序類型。
黃仁勛開(kāi)始積極布局面向人工智能的GPU。英偉達(dá)差不多花了5年時(shí)間制作出了DGX,這個(gè)GPU重達(dá)31.75千克,黃仁勛把它形容為一輛電動(dòng)汽車。馬斯克聽(tīng)說(shuō)這個(gè)消息后,找到了黃仁勛,表示OpenAI想要一個(gè)這樣的GPU。
于是,在2016年8月的一天,黃仁勛造訪了OpenAI在舊金山的辦公室。他在一間會(huì)議室里將這臺(tái)超級(jí)計(jì)算機(jī)(屬于最新推出的DGX-1系列)親手交給了馬斯克。
那一刻,黃仁勛突發(fā)奇想,隨手拿起一支馬克筆,在這臺(tái)超級(jí)計(jì)算機(jī)的機(jī)身上寫(xiě)道:
為了埃隆和OpenAI團(tuán)隊(duì)!為了計(jì)算機(jī)和人類的未來(lái)!我將世界上第一臺(tái)DGX-1作為禮物送給你們!
寫(xiě)完后,他把筆交給馬斯克和圍過(guò)來(lái)的OpenAI團(tuán)隊(duì)成員,所有人逐一在機(jī)箱上簽了名。
當(dāng)天晚上馬斯克在X上寫(xiě)道:
十分感謝英偉達(dá)和Jensen(黃仁勛英文名)將第一臺(tái)DGX-1超級(jí)計(jì)算機(jī)捐贈(zèng)給OpenAI,以推動(dòng)AI技術(shù)的普及。
DGX-1超級(jí)計(jì)算機(jī)擁有高達(dá)170TFLOPS的半精度浮點(diǎn)運(yùn)算能力,相當(dāng)于250臺(tái)傳統(tǒng)服務(wù)器,可以將深度學(xué)習(xí)的訓(xùn)練速度加快75倍,使CPU性能提升56倍,報(bào)價(jià)12.9萬(wàn)美元。
據(jù)黃仁勛介紹,這是由3000人耗時(shí)3年時(shí)間研發(fā)出的,開(kāi)發(fā)成本巨大?!叭绻@個(gè)項(xiàng)目只為打造一臺(tái)這樣的超級(jí)計(jì)算機(jī),那么這個(gè)項(xiàng)目的成本將高達(dá)20億美元。”
當(dāng)時(shí)OpenAI和英偉達(dá)均未解釋這臺(tái)超級(jí)計(jì)算機(jī)的準(zhǔn)確用途。但英偉達(dá)稱,DGX-1是為處理深度學(xué)習(xí)等AI問(wèn)題而量身打造的超級(jí)計(jì)算機(jī)。黃仁勛稱:
世界上第一臺(tái)專為AI打造的超級(jí)計(jì)算機(jī)即將落戶于一家專注于開(kāi)放式AI研究的實(shí)驗(yàn)室,這簡(jiǎn)直是天作之合。
此后幾年,隨著利用GPU訓(xùn)練大模型成為行業(yè)共識(shí),越來(lái)越多的公司開(kāi)始追逐高端GPU,導(dǎo)致GPU稀缺。馬斯克曾說(shuō),現(xiàn)在它們“比毒品還難搞”。這些芯片成為了一場(chǎng)淘金熱的鎬和鏟。
2022年,黃仁勛第一次嘗試使用ChatGPT,他讓它寫(xiě)一首關(guān)于他的公司的詩(shī)。ChatGPT返回的結(jié)果讓他很滿意:
英偉達(dá)迎接挑戰(zhàn)。
憑借強(qiáng)大的GPU和人工智能,
它正在推動(dòng)技術(shù)邊界。
看到這首詩(shī),黃仁勛開(kāi)心的笑了,他知道自己賭對(duì)了。
隨著最大規(guī)模的AI訓(xùn)練規(guī)模大約每6個(gè)月翻一番,英偉達(dá)成為了這場(chǎng)戰(zhàn)爭(zhēng)里唯一的“軍火商”。
幾年后隨著ChatGPT的走紅和英偉達(dá)市值突破2萬(wàn)億美元,馬斯克和黃仁勛出神的看著這臺(tái)超級(jí)計(jì)算器的照片在網(wǎng)上流傳,背后是奧爾特曼寫(xiě)在墻上的那句名言。那句名言的后半句是:
我們每個(gè)人都有責(zé)任把世界的命運(yùn)寄托在自己身上。
時(shí)代的鐘聲從遠(yuǎn)處傳來(lái),當(dāng)算法(Transformer模型)、算力(英偉達(dá))和數(shù)據(jù)(互聯(lián)網(wǎng))都萬(wàn)事俱備的時(shí)候,一個(gè)新時(shí)代的大門敞開(kāi)了。
奧爾特曼后來(lái)回憶,在一個(gè)夏日涼爽的黃昏時(shí)分,OpenAI研究團(tuán)隊(duì)完成了一個(gè)關(guān)于規(guī)模法則的實(shí)驗(yàn),這個(gè)實(shí)驗(yàn)揭示了用于訓(xùn)練人工智能的計(jì)算能力與其結(jié)果能力之間的關(guān)系,并產(chǎn)生了一系列“完美、平滑的曲線”,這些指數(shù)曲線看起來(lái)更像是宇宙基本定律而不是實(shí)驗(yàn)數(shù)據(jù)。
奧爾特曼和一群研究人員走到辦公室外,望著遠(yuǎn)處的夕陽(yáng)。他們共同意識(shí)到,AGI不僅是可能實(shí)現(xiàn)的,而且它的來(lái)臨可能比他們先前所預(yù)期的要快得多。
奧爾特曼后來(lái)回憶說(shuō):
我們都在想,這一切真的會(huì)發(fā)生,不是嗎?
這就像是科學(xué)史上的一個(gè)轉(zhuǎn)折點(diǎn)。我們已經(jīng)洞悉了一種全新的事物,即將向全人類宣告它的來(lái)臨。
*文章為作者獨(dú)立觀點(diǎn),不代表筆記俠立場(chǎng)。
本文由人人都是產(chǎn)品經(jīng)理作者【筆記俠】,微信公眾號(hào):【筆記俠】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!