日本乱人伦片中文三区 ,黄网站高清无码

搜索

APP

起點課堂會員權益

職業(yè)體系課特權

線下行業(yè)大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

OpenAI和谷歌，AI對線中的飛馳人生

腦極體

2024-02-27

0 評論 2316 瀏覽 2 收藏

17 分鐘

在過去一年左右的時間，OpenAI的發(fā)展備受外界關注，那么，什么時候才能有一家公司可以趕超OpenAI？谷歌是外界所認為的最有希望的選手之一。這里，我們不妨跟著作者的腳步，來看看這兩大巨頭之間的“對壘”和“競速”。

到底什么時候，才能有一家公司趕超OpenAI？這句問題，想必是過去一年多來，縈繞在不少讀者心中的困惑。

如果全世界只有一家公司能趕超OpenAI，谷歌應該是最有希望的選手。

同為北美AI巨頭的谷歌，與OpenAI有著相同的AGI目標、世界級的技術人才、全球資金資源，就連OpenAI大模型的核心Transformer架構，都是谷歌原創(chuàng)發(fā)明的。

然而2023年至今，AI領域風云迭起，OpenAI永遠快谷歌一步。谷歌每次拿出一個“復仇大殺器”，想一雪前恥的時候，總會被OpenAI搶走風頭。

比如最新推出的核彈級多模態(tài)大模型Gemini 1.5，只在科技話題榜上“炸裂”了幾個小時，就因為緊隨其后推出的Sora過于炸裂、更吸引眼球，而變得無人在意。

毫無疑問，AI領域正在進行著一場世界上最精彩的“速度與激情”，領先的OpenAI贏得漂亮，緊隨其后的谷歌也輸得體面。我發(fā)現它們的境遇，被龍年春節(jié)檔的熱門電影，給精準拿捏了。

如果說OpenAI是驚艷四座、激動人心的《熱辣滾燙》，那谷歌就像是《飛馳人生2》中艱難追夢的中年賽車手，鼓起勇氣全速前進，結果不是贏，而是來了個大翻車。

誰能摘下賽道終點AGI的圣杯，結果還未可知，這一年多來，僅僅是欣賞這一長程賽事的初始賽段，都已經令人極為振奮了。

谷歌與OpenAI的AI對線，可謂是屢戰(zhàn)屢敗、屢敗屢戰(zhàn)。我們就從這場精彩的“雙雄競速”，來整體看一看北美AI巨頭的產業(yè)對壘形勢。

一、谷歌三連敗，北美AI巨頭的激情對線

目前，在爭奪AGI通用人工智能圣杯的賽場上，分別有三支北美AI巨頭：OpenAI、谷歌、Meta。

其中，Meta走的是開源路線，其大模型系列LLaMA是目前全球最活躍的AI開源社區(qū)。而OpenAI和谷歌則在同一條賽道上，主要打造“閉源”大模型。

盡管OpenAI被嘲諷“不再Open”，谷歌工作人員也大膽諫言“我們和OpenAI都沒有護城河”。但換個角度，閉源的業(yè)務策略要說服用戶付費，必須提供高質量模型、具備難以替代的能力優(yōu)勢，這也會驅動模型廠商持續(xù)創(chuàng)新，保持競爭優(yōu)勢，是AI產業(yè)中一股不可缺少的商業(yè)力量。

所以，北美AI三巨頭的對壘格局，就是Meta卷生態(tài)，OpenAI與谷歌卷模型。

那么，把目光聚焦到模型賽道上，比賽情況如何呢？

2023一整年，和OpenAI同一賽道的谷歌，深深品嘗到了peer pressure同輩壓力的滋味。

這場競速，可以分為三個賽段：

Round1.ChatGPT VS Bard.

結果不用多說，這是一場谷歌被OpenAI“摘了桃子”而開啟的競賽，從此就只能一路跟在OpenAI的尾氣后面。

2022年11月，OpenAI發(fā)布ChatGPT一鳴驚人，開啟了全球大語言模型的熱潮。

其中，ChatGPT的基礎技術Transformer是谷歌推出的，大語言模型的涌現現象是谷歌研究員Jason Wei發(fā)現的（后來跳槽到了OpenAI）。用谷歌的技術，搶谷歌的人，沖擊谷歌的AI領導地位，OpenAI可謂是一通“騎臉輸出”。

谷歌的應對，是“一怒之下怒了一下”。

2023年3月，谷歌緊急發(fā)布了Bard。但這個模型本身的性能就比較弱，上線時功能有限，只支持英文，只針對少數用戶，跟ChatGPT完全不能打。

Round2.GPT-4 VS PaLM2.

有人說，谷歌采用的是“田忌賽馬”策略，第一局故意放出了比較弱的機器學習模型Bard。這話有一定道理，但架不住OpenAI的每匹馬都是好馬。

OpenAI很快推出了升級版的GPT-4，并開放了 GPT-4 的 API，把谷歌甩得更遠了。

5月的谷歌I/O 2023大會，派出來對打GPT- 4的PaLM 2，也是一個“過渡產品”。谷歌研究副總裁Zoubin Ghahramani對外表示，PaLM 2是對早期模型的改進，僅僅縮小了谷歌與OpenAI在AI方面的差距，但并沒有整體超越GPT-4。

這一輪，谷歌仍然落后。谷歌顯然也清楚這一點，在這場大會上同時宣布，正在訓練PaLM的繼任者，名為Gemini，押注了上億身家，準備在年底上演“王子復仇記”。

Round3.Gemini家族VS Sora+GPT-5。

2023年底的12月，谷歌Gemini“雖遲但到”，這個谷歌目前最強大、最通用的AI模型，被媒體稱為“復仇殺器”。這期間，OpenAI上演了一出“甄嬛回宮”的宮斗大戲，沒有特別炸裂的產品。這一次，谷歌能奪回屬于自己的一切嗎？

很遺憾，谷歌并沒能上演AI領域的“龍王歸來”。

三個尺寸的Gemini：Nano、Pro和Ultra，其中Gemini Pro在常識推理任務中落后于OpenAI的GPT模型，Gemini Ultra對于GPT-4僅有幾個百分點的優(yōu)勢，而GPT-4是OpenAI一年前的產品。而且，Gemini還被爆出，宣稱打敗GPT-4的多模態(tài)視頻，有后期制作和剪輯的成分，用中國模型產生的中文語料進行訓練，自稱是文心一言。

谷歌一鼓作氣，一腳油門，Gemini Ultra發(fā)布還沒幾天，就推出了多模態(tài)大模型Gemini 1.5，能夠穩(wěn)定處理高達100萬token，創(chuàng)下了最長上下文窗口的紀錄。

這是一個激動人心的成果，如果沒有Sora的話。

OpenAI幾個小時之后，就推出了文字視頻生成模型Sora，用前所未有的視頻生成性能，以及世界模型的產品化，再一次驚艷了世人，搶走了本應屬于Gemini 1.5的話題度，也強化了自己的AI領導地位。目前人們傾向于認為，OpenAI還是領先谷歌一籌。

此前大家都猜測是GPT-5已經訓練得差不多了，面對谷歌目前最強的模型Gemini 1.5，已經有人隔空喊話奧特曼，問他還要把寶貝捂到什么時候，還不快點放出GPT-5。

至此，為期約一年的北美AI“田忌賽馬”，以谷歌的三連敗，暫時告一段落。

二、AGI的殊途，難以飛馳的谷歌

AGI是一場長長的賽事。拉長時間軸，谷歌與OpenAI的一年對壘與一時成敗，或許未來看都不算什么。有資格走上頂級賽道，本身就是谷歌AI實力的一種證明。

比起輸贏結果，更值得討論的是，谷歌變成“卷王”卷了一整年，為什么會一直被OpenAI甩在身后，怎么折騰都跟不上？

田忌賽馬，輸一次是戰(zhàn)術失誤，次次都輸，可能就能關注一下，是不是從馬種、馬圈、草料等源頭，就已經存在問題了。

回到源頭，谷歌和OpenAI可謂是同歸、殊途。

同歸，是雙方都以實現通用人工智能，摘下AGI圣杯作為目標；

殊途，是雙方選擇的技術路線不同。OpenAI將更為通用的語言能力，作為實現AGI的基礎，因此采用了對NLP領域至關重要的Transformer架構，打造了一系列GPT模型，才有了ChatGPT的驚艷亮相。

而谷歌則不然。多年來，谷歌的AI研發(fā)機構DeepMind，將強化學習、深度學習用于解決各種人工智能問題，技術積累非常廣泛。比如石破天驚的AlphaGo、徹底改變生物學的AlphaFold，以及Transformer等NLP技術。

這就相當于，兩個車手在為比賽準備賽車，OpenAI為AGI選了一個場地，比如“方程式賽車”，然后以語言為核心進行模型的開發(fā)制造，對賽車（模型）的結構、長寬、發(fā)動機、汽缸等進行優(yōu)化改造（工程化）。而谷歌的DeepMind則不確定哪種車能終結AGI比賽，手里的技術工具又很多，于是方程式賽車、跑車、摩托車都造一下試試。

兩種路線原本并沒有什么優(yōu)劣之分。但隨著大語言模型的“智能涌現”，證明了OpenAI選擇的技術路線更有希望實現AGI，谷歌DeepMind的技術路線就暴露出了明顯的短板：

1.方向分散，成本高昂。在各個技術方向上投入的泛創(chuàng)新，消耗了大量資金，DeepMind與谷歌母公司AlphaBeta在商業(yè)化上的矛盾日趨加深。在OpenAI大幅融資加速的時候，谷歌為了加大對AI的投資，通過裁員來節(jié)省成本。

2.選型太多，難以聚焦。谷歌開創(chuàng)了許多技術，但每個技術的重視程度、持續(xù)深入強度也被分散了，四處打井不出水。最典型的就是Transformer架構，由谷歌發(fā)明，但被OpenAI發(fā)揚光大。ChatGPT的涌現現象，也是研究員在谷歌發(fā)現之后，但得不到重視，出走OpenAI后向前推進。

3.落地遲緩，成果太慢。谷歌內部對AI的保守也是出名的，導致其即使掌握了先進的技術，成果轉化的效率也很低下。有前谷歌員工曾吐槽，谷歌的項目一般都是先吹一陣牛，然后什么也不發(fā)布，一年后再把這個項目給砍了。這一點在Sora的爆火上就能看到，訓練Sora使用的擴散模型（diffusion model）、文生圖模型，谷歌都有相應的技術儲備和成果，但就是沒能先搞出Sora這樣的產品。

可以看到，由于一開始就押注錯了賽道，等到大語言模型成為AGI最有潛力的實現路徑，OpenAI領先的大勢已成。這時的谷歌再要回到OpenAI所在的技術賽道上，當然就處于劣勢身位了。

三、一步錯，步步錯的“人生”，挺住意味著一切

坦誠地說，谷歌已經在積極解決問題，包括技術戰(zhàn)略選擇失誤、內部的管理效率人事冗余、AI技術人才的外流等。

去年4月，谷歌將自己的兩個AI“扛把子”團隊——谷歌大腦和DeepMind合并，共同進行Gemini的開發(fā)。從最終效果來看，Gemini的表現是很優(yōu)秀的，1.5版本是目前全球最領先的大模型之一。內部資源也大幅度向AI領域傾斜，一些外流的AI人才回歸谷歌。

實際行動表明，谷歌在明確了賽道之后，追趕OpenAI的決心和速度都是一等一的。

但持續(xù)落后的現實也充分詮釋了一點：自己的失敗固然可怕，朋友的成功更讓人揪心。

盡管谷歌竭力解決自身的種種弊病，全力推動大模型，但架不住OpenAI的加速度更強大。

一方面，OpenAI的研發(fā)團隊可謂是全力以赴，而谷歌新合并的團隊還需要磨合。Sora核心研發(fā)人員Bill Peebles曾透露，團隊每天基本不睡覺高強度工作了一年。而谷歌大腦和DeepMind合并之后，很多員工不得不放棄自己原本熟悉的軟件，放棄原本開展的項目去開發(fā)Gemini，這些內部磨合導致的項目延遲、停滯，必然會給谷歌追趕OpenAI帶來阻礙。

另外，相比谷歌亡羊補牢式地招回人才，OpenAI虹吸全球頂級AI人才的氣勢如虹。就在2月份，Altman公開在社交媒體上表示，“所有關鍵資源都已到位，非常專注于AGI”，在線誠聘人才。AI的競爭歸根結底是人才的競爭，因為AGI最重要的是智力資源，而最頂尖最優(yōu)秀的人才一共只有那么多，這也讓人為谷歌能否追趕上OpenAI捏了一把汗。