GPT-4o重磅發(fā)布,但AI已經(jīng)進(jìn)入泡沫前期

0 評論 384 瀏覽 1 收藏 19 分鐘

這段時(shí)間,AI科技圈的消息有很多,從OpenAI發(fā)布了GPT-4o,到谷歌召開開發(fā)者大會……AI賽道的發(fā)展圖景,正在我們面前展開。

一、GPT-4o很強(qiáng),但沒到顛覆世界的程度

前段時(shí)間OpenAI發(fā)布了GPT-4o(“o”代表“omni”)。簡單來說它可以實(shí)現(xiàn)文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出的任意組合。且有諸多驚艷應(yīng)用。

GPT-4o 的主要升級點(diǎn)在于打通任何文本、音頻和圖像的輸入,相互之間可以直接生成,無需中間轉(zhuǎn)換;此外 GPT-4o 語音延遲大幅降低,能在 232 毫秒內(nèi)回應(yīng)音頻輸入,平均為 320 毫秒,這與對話中人類的響應(yīng)時(shí)間相似。

GPT-4o 不僅能通過視覺 AI 能力理解攝像頭中發(fā)生的事情,同時(shí)還能夠?qū)⒗斫獾膬?nèi)容通過語音與舊版本 ChatGPT 交互,進(jìn)行更加豐富有趣的互動(dòng)。同時(shí)還支持中途打斷和對話插入,且具備上下文記憶能力。

而且 GPT-4o 對廣大用戶來說它有個(gè)遠(yuǎn)超 GPT-4 的優(yōu)點(diǎn):免費(fèi)。體驗(yàn) GPT-4 級別的智能、從模型和網(wǎng)絡(luò)獲取響應(yīng)、分析數(shù)據(jù)并創(chuàng)建圖表、聊一聊你拍的照片、上傳文件以獲取摘要、寫作或分析幫助、使用 GPTs 和 GPT Store、通過 Memory 構(gòu)建更加有幫助的體驗(yàn),這些功能全部可以免費(fèi)獲得。要知道 GPT-4 Plus 版本就因?yàn)槭召M(fèi)貴、付款麻煩,使用門檻高讓絕大部分人望而卻步,能讓更多的人用上便是 GPT-4o 的最大亮點(diǎn)。

但是現(xiàn)在能用上GPT-4o只有GPT-4 Plus版本,其他版本需要后續(xù)開放而且免費(fèi)的GPT-4o次數(shù)有限,過了次數(shù)會直接轉(zhuǎn)為GPT-3.5。

有業(yè)內(nèi)人士認(rèn)為,特別是在預(yù)告中 OpenAI 公司的 CEO Altman 甚至用上了 ” 魔法 ” 二字,相比之下 GPT-4 的神通廣大、Sora 那種神筆馬良的既視感,GPT-4o 顯然稱不上魔法。而且從多模態(tài)能力方面考察,GPT-4o 的能力并沒有比上代有明顯提升。哪怕是和 GPT 的老對手 Anthropic 的 Claude 3 相比也沒有拉開差距,可以說從模型能力來看 GPT-4o 和 GPT-4 沒有本質(zhì)區(qū)別。

所以GPT-4o的發(fā)布更多像是一種搶跑,展現(xiàn)一種領(lǐng)先的姿態(tài),也是維持熱度刺激購買需求的一種方式。

有意思的是,就在GPT-4o發(fā)布24小時(shí)之后,谷歌也緊跟著發(fā)布產(chǎn)品頗有對陣叫板的意味。谷歌CEO桑達(dá)爾·皮查伊發(fā)布數(shù)十款Google和AI 結(jié)合產(chǎn)品,堪稱“全家桶”級別,全面圍剿Open AI。其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash,對標(biāo)Sora的Veo,開源模型Gemma 2,支持生成式搜索的AI Overviews、第六代TPU等。

整場開發(fā)者大會最大的看點(diǎn)為,谷歌推出的AI語音助手——Astra,它能夠通過攝像頭識別物體、代碼和各種東西?,F(xiàn)場演示視頻中,用戶要求Astra在看到發(fā)出聲音的東西時(shí)告訴她,助手回答說,它可以看到一個(gè)發(fā)出聲音的揚(yáng)聲器。對于一閃而過的蘋果,Astra居然也能夠準(zhǔn)確回答出在眼鏡旁邊。除Astra外,谷歌還推出基于Gemini的多款通用AI Agent子系列產(chǎn)品。如音頻的NotebookLM、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3,直接對標(biāo)OpenAI發(fā)布的GPT-4o、Dall-E和Sora。

但問題也跟OpenAI類似,目前還不足以讓開發(fā)者構(gòu)建更加原生和殺手級應(yīng)用,從推理能力到多模態(tài)能力都是如此。兩家更像是你追我趕的算術(shù)級競爭,誰也沒有拉開太多,自然就很難貢獻(xiàn)震驚世界的應(yīng)用。

也難怪馬斯克在看過發(fā)布會后表示,GPT-4o的演示讓他感到“不適、尷尬”。Andrej Karpathy大佬也用十分平靜的語氣給出技術(shù)總結(jié),得到了馬斯克的附議:他們發(fā)布的是一個(gè)在同一神經(jīng)網(wǎng)絡(luò)中結(jié)合文本-音頻-視頻三種模態(tài)并同時(shí)處理的模型,僅此而已。

二、大模型也要“精打細(xì)算”

去年生成式AI與大語言模型這一撥科技熱潮在去年席卷了全球科技圈。無論是科技巨頭還是新興獨(dú)角獸,都在爭先恐后研發(fā)規(guī)模更大、性能更強(qiáng)的模型,進(jìn)而引發(fā)了圍繞AI芯片的軍備競賽,并讓身為AI軍火商的英偉達(dá)比前一年多賺了340億美元。

但今年的情況已經(jīng)顯然沒有那么樂觀,務(wù)實(shí)謹(jǐn)慎的風(fēng)格傳遍了科技圈??萍济襟wThe Information報(bào)道稱,「包括微軟、亞馬遜和Google在內(nèi)的云廠商和其他銷售該技術(shù)(指生成式AI)的公司,正在降低自己的預(yù)期」。一些人已經(jīng)在擔(dān)憂生成式AI吹出來的泡泡會不會已經(jīng)太大了,它是未來,但可能不是現(xiàn)在,就像互聯(lián)網(wǎng)如今已經(jīng)是一門萬億美元級別的生意,但并不妨礙千禧年時(shí)吹出的互聯(lián)網(wǎng)泡泡的爆炸結(jié)局。

關(guān)于OpenAI公司去年的營收,目前有兩種說法,The Information稱其2023年最后一個(gè)月的年化收入是16億美元,而《金融時(shí)報(bào)》給出的數(shù)字是20億美元。這個(gè)收入水平在AI行業(yè)絕對是第一梯隊(duì),但是跟微軟每年提供給OpenAI公司不低于10億美元的費(fèi)用相比,仍然不算多,更何況Sam Altman雄心勃勃計(jì)劃7萬億美元自建芯片工廠打造軟硬一體呢?或許上市能解決OpenAI的投資難題,但是作為非營利性組織的OpenAI轉(zhuǎn)為正常的私人盈利公司尚存在諸多問題,短期來看并不現(xiàn)實(shí)。

一大批剛剛在2023年晉升為獨(dú)角獸的美國生成式AI公司,已經(jīng)落入理想難以兌現(xiàn)的窘境。曾經(jīng)在AI獨(dú)角獸上排名前3的初創(chuàng)公司Inflection兩位聯(lián)合創(chuàng)始人跳槽微軟,因?yàn)橥谧吡薎nflection大部分員工,包括其創(chuàng)始人,微軟同意向Inflection支付約6.5億美元,以獲得其模型授權(quán),并補(bǔ)償Inflection的投資人。

排名僅次于Inflection的另一家AI獨(dú)角獸Cohere也被傳出融資困境。這家公司自去年12月就開始尋求以60億美元估值融資5億美元,迄今沒有確定交易,而它上一輪融資還停留在去年6月。按照大模型的燒錢速度,這些無法自我造血的獨(dú)角獸原本每半年甚至每個(gè)季度都要有新的融資才能為繼。

更為尷尬的是這些公司并沒有明顯推出強(qiáng)于GPT-4的大模型,雖然宣傳上都是“各種領(lǐng)先”但實(shí)際體驗(yàn)下來差距不小。而且這些公司基本不具備盈利能力,成為資本棄兒,缺少后續(xù)輸血也就不難理解了。

金沙江主管合伙人朱嘯虎認(rèn)為,大模型是很差的商業(yè)模式。問題是技術(shù)沒有差異點(diǎn),而且每一代技術(shù)比如3.5可能就要幾千萬美金,4.0可能要幾億美金,5.0可能要幾十億美金,每一代模型你都要重新去砸錢,而且你變現(xiàn)周期可能就兩三年,這比發(fā)電廠還要差。

比如發(fā)電廠,在投了基建以后,基本上不需要再投入很多錢,但大模型是要每兩三年就要砸更多的錢去升級,而且變現(xiàn)的周期可能就兩三年。說實(shí)話這個(gè)商業(yè)模式是非常差的商業(yè)模式。

所以不管國內(nèi)外AI投資都已經(jīng)進(jìn)入了要認(rèn)真考慮成本收益的階段,如果AI已經(jīng)進(jìn)入終局那么行業(yè)第二第三將變得價(jià)值極低,現(xiàn)階段OpenAI領(lǐng)導(dǎo)者的地位仍然牢不可破,對于初創(chuàng)公司來說可能隨時(shí)在“死亡邊緣”。

三、去年的“宮斗”仍沒有結(jié)束

去年 11 月,Ilya 與另外三名董事會成員一道,迫使該公司高調(diào)的首席執(zhí)行官 Sam Altman 辭職,但后來他表示后悔。據(jù)報(bào)道,雙方爭論的焦點(diǎn)是對 OpenAI 方向的分歧:Ilya 對 Altman 以犧牲安全工作為代價(jià)而急于推出人工智能產(chǎn)品感到沮喪。Altman 在被趕下臺的五天后就回到了 OpenAI,重申了自己的控制權(quán),并繼續(xù)推動(dòng)越來越強(qiáng)大的技術(shù),這讓他的一些批評者感到擔(dān)憂。Ilya 仍然是 OpenAI 的員工,但他再也沒有回去工作。

今年5月17日,在公司聯(lián)合創(chuàng)始人兼首席科學(xué)家伊利亞·蘇茨克沃(Ilya Sutskever)周二宣布離職后幾個(gè)小時(shí),其超級對齊團(tuán)隊(duì)負(fù)責(zé)人之一詹·萊克(Jan Leike)也在社交平臺X上發(fā)帖宣布辭職。

OpenAI超級對齊負(fù)責(zé)人Jan Leike,自曝離職的真正原因,以及更多內(nèi)幕。一來算力不夠用,承諾給超級對齊團(tuán)隊(duì)的20%缺斤少兩,導(dǎo)致團(tuán)隊(duì)逆流而行,但也越來越困難。二來安全不重視,對AGI的安全治理問題,優(yōu)先級不如推出“閃亮的產(chǎn)品”。

這里先解釋一下“對齊”是什么意思,由于GPT大模型的生成是黑盒機(jī)制產(chǎn)生內(nèi)容是隨機(jī)可控性弱的,難免產(chǎn)生不符合人類價(jià)值觀的東西。所以他們在構(gòu)建一個(gè)能與人類水平相媲美的自動(dòng)對齊研究器,盡可能將相關(guān)工作交由自動(dòng)系統(tǒng)完成,同時(shí)確保人工智能系統(tǒng)的行為與人類價(jià)值觀和目標(biāo)保持一致。

離開的也不只是對齊團(tuán)隊(duì)的人,OpenAI前工程負(fù)責(zé)人,曾領(lǐng)導(dǎo)過ChatGPT, GPT-4, DALL·E和APIs上線的Evan Morikawa也宣布離開,將與前波士頓動(dòng)力高級機(jī)器人學(xué)家Andy Barry和Deep Mind研究科學(xué)家Pete Florence 和 Andy Zeng共同開展一個(gè)全新項(xiàng)目,并認(rèn)為“這是在全球范圍內(nèi)實(shí)現(xiàn) AGI 所必需的”。

有網(wǎng)友表示這聽起來像是OpenAI想繼續(xù)燒錢商業(yè)化,而不是確保前進(jìn)步驟的安全。他們想成為大亨,而不是英雄。

對Jan Leike的長文開炮,奧特曼當(dāng)然是不會就此作罷的了。很快他便發(fā)文“反擊”:“我非常感謝 Jan Leike 對 OpenAI 對齊研究和安全文化的貢獻(xiàn),也非常難過看到他離開。他說得對,我們還有很多事情要做,我們承諾會做到。我會在接下來的幾天里發(fā)一篇更長的文章?!辈怀鲆馔獾脑挘磥韼滋爝€會像去年一樣,小作文反轉(zhuǎn)不斷。至于真相是什么,或許只有躬身其中的少數(shù)人知道,是非曲直其實(shí)對網(wǎng)友來說并不太重要。

重要的是此次“離職潮”表明了去年以來的內(nèi)部矛盾并沒有消弭,反而是隱藏轉(zhuǎn)移爆發(fā)。歸根結(jié)底的來說,Ilya Sutskever跟Sam Altman之爭主要是技術(shù)原教旨主義者和市場激進(jìn)派之間的矛盾。Jan Leike表示:“我相信,我們應(yīng)該將更多的帶寬花在為下一代模型做準(zhǔn)備上,關(guān)注安全、監(jiān)控、對抗性穩(wěn)健性、超級對齊、保密性、社會影響等相關(guān)話題。這些問題很難解決,我擔(dān)心我們還沒有走上正軌?!?/p>

但Sam Altman一直以來在強(qiáng)調(diào)AI會如何顛覆世界創(chuàng)造出令人驚訝的產(chǎn)品,在瘋狂地積累芯片甚至要自建芯片廠,來加速技術(shù)的發(fā)展。筆者認(rèn)為兩者之爭是幾乎所有AI從業(yè)者都要考慮的事情,技術(shù)當(dāng)然可以促進(jìn)社會生產(chǎn)力發(fā)展,但也會帶來一系列安全問題和風(fēng)險(xiǎn)。

Sam Altman未必真的是唯利是圖一心只想賺錢,他所說的重視AI安全不一定是謊言。但作為管理者要考慮公司的長久運(yùn)營,能兼顧是最好不能兼顧那就需要有優(yōu)先級。目前AI對齊所需算力并不小而且對齊之后的AI性能下降明顯,這可能是Sam Altman無法給對齊團(tuán)隊(duì)滿意安排的重要原因之一。當(dāng)然真實(shí)情況可能更復(fù)雜,但邁向下一個(gè)時(shí)代的科技生產(chǎn)力,如果沒有足夠的商業(yè)利益一切都會是空談。

如果OpenAI完全放棄對齊或者不重視,那對未來的GPT-5來說將是巨大的風(fēng)險(xiǎn),商業(yè)化被迫戛然而止也有可能??傊?,我們希望出現(xiàn)一個(gè)更好更開放的OpenAI,而不是把問題都丟給社會。

四、中國大模型也無需自卑

近一個(gè)月國產(chǎn)大模型讓市場產(chǎn)生了正在追平美國的印象,很多亮點(diǎn)也來自初創(chuàng)企業(yè)。月之暗面將上下文長度擴(kuò)展至200萬token;Minimax出海陪聊應(yīng)用Talkie日活接近 Character.AI;發(fā)布了Vidu的生數(shù)科技,提出U-ViT架構(gòu)比Sora還早;開源模型DeepSeek在保證性能的前提下,讓成本降至1塊錢百萬token輸入。

有些文章說國內(nèi)AI都在卷價(jià)格只有國外在卷功能,其實(shí)并不客觀。推理需求已經(jīng)真實(shí)存在了。去年底發(fā)布以來,阿里巴巴近1.7萬中小外貿(mào)商家訂購了AI生意助手,發(fā)布了上百萬商品,搜索量提升近四成。字節(jié)跳動(dòng)將豆包大模型接入了抖音、飛書等業(yè)務(wù),日均處理1200億token文本,但沒有公布參數(shù)等細(xì)節(jié),可能是因?yàn)榕cTiktok用了類似的推薦算法。百度文心大模型日處理文本2500億token,日均調(diào)用量為去年底的4倍。騰訊已經(jīng)把混元大模型用在了會議、讀書與游戲客服上;AI支持的廣告服務(wù)的點(diǎn)擊率與交易量也在上升。

開源大模型通義千問已經(jīng)火到國外去了,有太多外國人在討論和使用(通義千問)Qwen大模型。

通義發(fā)布1100億參數(shù)開源模型Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基準(zhǔn)測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B沖上榜首,再度證明通義開源系列業(yè)界最強(qiáng)的競爭力。

或許有人會質(zhì)疑跑分成績,但是面向C端主打全功能免費(fèi)的通義,卻是真香了。同時(shí)通義千問 APP 還升級為「通義 APP」,集成文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等全棧能力,想成為用戶的「全能 AI 助手」。

寫在最后

無論是OpenAI還是國內(nèi)的AI企業(yè),都離不開金融資本和產(chǎn)業(yè)資本的運(yùn)作,過于排斥商業(yè)化并不是好事,但也應(yīng)該有底線取得安全與效益的平衡,只有這樣才能實(shí)現(xiàn)科技創(chuàng)造美好未來。歷史上的重大技術(shù)進(jìn)步往往伴隨著金融泡沫,這是新技術(shù)推廣的自然組成部分。AI有泡沫并不可怕,可怕的是技術(shù)的基石不牢,難以解決現(xiàn)實(shí)中的種種問題,最終難以落地變成“全都是泡沫”。

參考資料:

  • OpenAI重磅發(fā)布GPT-4o 來源:Founder Park
  • GPT-4o搶先測 來源:DoNews
  • GPT-4o很好但最大亮點(diǎn)只有免費(fèi) 來源:ZAKER
  • 大模型的泡沫來了嗎?來源:NewNewThing
  • 中美巨頭的AI差距 來源:未盡研究
  • OpenAI保護(hù)人類的團(tuán)隊(duì)分崩離析 來源:硅星人Pro
  • OpenAI的元老科學(xué)家都跑光了 來源:AI前線
  • Ilya離開OpenAI內(nèi)幕曝光 來源:量子位
  • 通義千問2.5正式發(fā)布 來源:阿里云

作者:做鏡觀天

來源公眾號:首席商業(yè)評論(ID:CHReview),深究商業(yè)邏輯,助力價(jià)值成長。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @首席商業(yè)評論 授權(quán)發(fā)布。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash ,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!