大模型前傳:一場拍賣會與巨頭間的人才戰
大模型這一概念在2023年發揮出了巨大的能量,互聯網巨頭更是在這一領域里頻頻動作。那么如果將時間往回撥并追根溯源,到底是哪些事件或因素的驅動,決定了當下的人工智能競爭格局?不妨來看看本文的解讀。
2012年12月,AI領域的一場頂級會議NIPS在美國內華達州太浩湖舉辦,會議酒店里的一場秘密拍賣拍出了4400萬美元的高價。拍賣的是一家在會議前緊急成立的公司,公司成員只有3人,沒有發布任何產品。參與拍賣的有谷歌、微軟、DeepMind以及百度。
這是一場既豪橫又簡陋的拍賣,競拍方通過Gmail郵件遠程出價,每一個小時出價一次,每次加價不少于100萬美元。60多歲的主辦方成員因患有頸椎疾病無法久坐,他在酒店的桌子上倒扣一個垃圾桶,把電腦放在垃圾桶上遙控科技巨頭出價。
競拍價一路攀升,2000萬美元以后,場內只剩百度和谷歌,兩家公司都勢在必得。出價4400萬美元后,主辦方意外暫停了拍賣,時間被拖到第二天。第二天拍賣開始前,主辦方告訴百度,他們更希望加入谷歌。
這個故事被科技記者Cade Metz放在《深度學習革命》一書開頭,用來說明科技巨頭在人工智能領域對人才的激烈爭奪。被拍賣的這家公司是DNNResearch,三名員工是被稱為“深度學習之父”的Geoffrey Hinton、AlexNet卷積神經網絡創始人Alex Krizhevsky和現任OpenAI首席科學家IIya Sutskever。
這場拍賣之前,“人工智能”還只是科幻小說和電影里的事物,“深度學習”的概念就連前沿的科技巨頭內部都少有人知。這場拍賣之后,一切開始發生變化。拍賣3年后,AlphaGo橫空出世。5年后,還是同一場NIPS會議中,谷歌8位研究員帶著Transformer模型架構技驚四座。10年后,美國幾乎所有的頂尖AI實驗室里都有來自谷歌的身影。
一、Google Brain的第一個成功和失敗
數學公式組織著從微觀粒子世界到宏觀宇宙的廣闊圖景,同時也是人們構建現代計算機和人工智能算法的工具——現代計算機底層邏輯運算的原理是形成于19世紀中期由George Boole發明的布爾計算。20世紀40年代,人們開始嘗試把生物神經元的功能抽象化為數學模型,50年代末誕生了第一個Neural Network神經網絡算法(NN算法)。
Geoffrey Hinton是George Boole的玄孫,在70年代進入NN算法領域,并成為推動NN算法發展的主要人物之一。到21世紀初,GPU的使用和分布式計算大大提升了算法運行的效率,NN算法成為熱門領域。Hinton在2006年提出深度信念網絡的概念,讓訓練深度神經網絡成為了可能,“深度學習”成為神經網絡算法的代名詞。
谷歌在當時有一個神秘實驗室Google X,專門研究智能駕駛、增強現實等前沿尖端項目,這些項目往往都與人工神經網絡有關。2011年,斯坦福大學人工智能教授吳恩達(Andrew Ng)加入Google X,希望把自己的神經網絡研究推廣開來。
然而即便在谷歌,當時也少有人認識到神經網絡可以帶來的改變,多次碰壁的吳恩達遇到了Jeff Dean,雙方一拍即合,很快把一些研究轉化出成果,這次的合作項目最終成為獨立的部門Google Brain。
2012年夏天,《紐約時報》詳細報道了吳恩達和Jeff Dean合作的“小貓論文”,他們用16000臺計算機組成了一個有10億連接的大型神經網絡系統。系統從來自YouTube的1000萬張圖片中學會了“貓”的概念,并找出了其中含有貓的圖片。這讓谷歌的科學家大為震驚并深受鼓舞。
神經網絡自學識別的貓的圖像 (圖源:紐約時報)
不過,吳恩達兩人的方法并不是當時最高效的。在當年秋天的ImageNet圖像識別大賽中,Hinton領導的三人組使用AlexNet深度卷積神經網絡奪得第一,他們的成績比第二名高出41%。這是ImageNet賽事的高光時刻,也是科技行業的“決定性瞬間”之一?!渡疃葘W習革命》一書的作者Cade Metz認為,AlexNet是深度學習的轉折點,也是全球科技行業的轉折點,推動了后來的人工智能熱潮。
這次比賽也直接催生了文章開頭提到的拍賣會,Hinton團隊因此加入到Google Brain。
在這之后,學術投資成為谷歌具有戰略高度的投資方向。雖然深度學習在當時是一個極小的領域,但谷歌創始人Larry Page認為它將會重塑行業,要求尋找其中的人才。在收下Hinton的同時,谷歌開始著手下一個目標。
二、驕傲的DeepMind和谷歌的豪賭
DeepMind主理人同樣有三位,主要創辦人Demis Hassabis從小智力超常,8歲開始編寫電腦游戲,13歲就獲得國際象棋大師的頭銜。20歲時,Hassabis在劍橋大學計算機科學專業獲得雙第一,畢業后成功經營了一家60人的游戲公司。后來,Hassabis轉向攻讀認知神經科學,最終投入人工智能浪潮。
2010年決定創辦DeepMind時,資金問題是重要的考量之一。Hassabis通過一場棋局獲得了第一筆投資,來自Peter Thiel。Thiel是Paypal的創始人,通過他,DeepMind又獲得了來自馬斯克的投資。創辦兩年內,DeepMind先后完成了兩輪融資。
Hassabis首先提出了AGI的概念,DeepMind以AGI為目標保持獨立運作。創辦早期,DeepMind訓練了一個玩游戲的神經網絡系統,系統通過觀看學會了玩《太空侵略者》《乒乓球》《越獄》等游戲,在很多游戲中的表現超過人類玩家。馬斯克在飛機上觀看DeepMind的演示視頻時,剛好被谷歌的Larry Page注意到,《Wired》報道稱,馬斯克向Larry Page介紹了DeepMind。
對于DeepMind這樣的機構,注定無法獨立完成燒錢的AGI豪賭,它需要持續不斷的輸血,成立后很快陷入到窘境。幸運的是,Hinton團隊的拍賣會一舉抬高了AI領域人才的身價,同時谷歌正在不計成本的投入其中。
2013年,谷歌團隊乘坐專機去到倫敦與DeepMind接洽,在第二年以6.5億美元買下DeepMind。谷歌同意了DeepMind提出的要求:雙方合作技術不能用于軍事目的,并成立獨立道德委員會監督。
DeepMind虧損壓力來到谷歌,電廠根據《CNBC》和《Bloomberg》媒體報道測算,2016年到2019年,DeepMind平均每年虧損4.6億美元。報道顯示,2019年,DeepMind所有公司間貸款和應計利息共計15億美元,被谷歌一筆免除。
三、Facebook的開源力量
跟Hassabis一樣,Zuckerberg在哈佛大學校園里創辦Facebook時,第一筆天使投資也來自Peter Thiel。在DeepMind尋找買家時,Thiel促成了兩人的首次接洽。Facebook比谷歌更想要DeepMind,愿意支付更高的收購金額。然而這是一場失敗的收購,據《深度學習革命》一書記錄,Hassabis認為,他跟Zuckerberg之間沒有“化學反應”,更重要的是在AI安全方面沒有共同的認知。
2013年是Facebook認識到深度學習重要性的第一年,Zuckerberg決定招攬前沿的研究人才。但跟DeepMind一樣,這些來自學界的研究者認為Facebook缺少吸引力。與財務收入相比,學者們看重自己的研究能不能在Facebook持續,卻發現后者根本沒有設置實驗室。
Zuckerberg找到了楊立昆(Yann LeCun)。楊立昆發明了卷積神經網絡,在深度學習領域跟Hinton有同樣的地位,手下學生眾多,如果由他運營實驗室,Facebook將能夠逆轉局面。
楊立昆信奉技術開放,會公布自己最新的研究成果,他認為這一領域的進步由一代代研究人員接力推動。在《Popular Science》的一次專訪中,楊立昆談到同意這次合作的原因——他對實驗室的想象與Facebook的開放理念一致。Facebook社交帝國的基礎是開源軟件,Zuckerberg對開放的理解打消了楊立昆的擔憂。
楊立昆幫助Facebook經營FAIR實驗室,同時仍然擔任在紐約大學的職務。有了實驗室的Facebook也有了從谷歌、微軟挖掘人才的優勢。
開放開源讓Facebook保持著在AI領域的領先地位。2022年,來自獨立實驗室OpenAI的ChatGPT一飛沖天,Zuckerberg選擇開源Llama大模型應對,從而迅速占據生態優勢。促進這次開源決定的正是楊立昆。
四、不被看好的OpenAI
深度學習領域有三位學術巨頭,除了Hinton和楊立昆,另一位是Yoshua Bengio。谷歌和Facebook掀起AI人才爭奪戰后,Bengio收到了無數來自科技公司的邀約,但他都一一回絕,這些公司中就包括OpenAI。
當時的OpenAI還沒有成立,Greg Brockman和Sam Altman正在召集人才。他們認識到科技公司內部的實驗室正在迅速擴張,必須采取行動,這得到了馬斯克的支持。根據《Wired》報道,Bengio給了他們一份名單,列出了他所認為的這個領域最有前途的年輕研究人員,其中就包括Ilya Sutskever。
谷歌開出高薪挽留Sutskever,第一年接近200萬美元,是OpenAI的兩到三倍,這讓Sutskever產生了動搖?!渡疃葘W習革命》書中詳細記錄了這個故事,OpenAI原本計劃在當年的NIPS會議上宣布成立,但Sutskever的猶豫打亂了計劃,最后一天的會議結束之后,他才確定“上車”。
OpenAI作為非盈利組織在2015年12月成立,它把自己定位為科技巨頭技術擴張的對抗力量,宗旨是確保AI技術造福人類。然而,秉持類似理想的DeepMind卻認為,OpenAI只會加速行業里的技術對抗,從而帶來更多風險,OpenAI初創團隊的技術人員當中,有5個曾在DeepMind工作。不看好OpenAI的也包括楊立昆,楊立昆告訴Sutskever,他的選擇是在犯錯,并給出了10多條理由。
五、谷歌的一團火和滿天星
人工智能技術的理論突破幾乎全部來自校園里的學術團隊,谷歌、Facebook的實驗室承擔了高校與商業公司之間的紐帶,培養了大批學術力量,推動了科研成果的誕生。隨著時間推移,很多科研人員意識到事情發生了變化。
Ilya Sutskever在后來的采訪中談到自己離開谷歌的原因,他表示,人工智能的神經網絡變得越來越龐大,未來將會是更大的、更有組織的的工程項目。研究人員需要用更宏觀的視角研究它們,實驗室能夠提供舒適的環境和優越的回報,但無法給他們調動更多的資源。
OpenAI的成立開啟了一種趨勢。很快,過去幾年加入科技巨頭實驗室的研發人員開始陸續出走。其中最具代表性的,應當是谷歌發明了Transformer模型架構的8位作者。
2017年,谷歌8位研究員完成的《Attention is All You Need》論文橫空出世,推動AI行業進入到大模型時代,Transformer成為幾乎所有AI大模型的核心。但從2017年至今,8位作者已經全部從谷歌出走,進入到各個領域的“OpenAI”當中。
2012年以來,谷歌的實驗室成了AI技術和人才策源地。過程中,AI研究經歷了從論文到落地的階段,開始走向應用??粗嗄陮W術投資成果散落各地,谷歌終于幡然醒悟。隨著Geoffrey Hinton在2023年退休,谷歌一方面宣布不再公布最新的科研成果,另一方面把DeepMind和Google Brain合并成Google DeepMind,由Hassabis擔任CEO。
過去幾年一直處在弱勢地位的微軟,卻因為OpenAI的崛起重新拿到先發優勢。谷歌的戰略調整也決定了,始終擔心AI安全問題的Hassabis將不得不加快他的“曼哈頓計劃”。而先后失去了DeepMind和OpenAI的馬斯克,不得不X上繼續呼吁人們警惕AI技術擴張帶來的威脅。
作者:肖余林;編輯:高宇雷
原文標題:電廠 | 大模型前傳:一場拍賣會與巨頭間的人才戰
來源公眾號:電廠(ID:wonder-capsule),探索科技公司的未知,為你充電。
本文由人人都是產品經理合作媒體 @電廠 授權發布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!