大模型降溫背后的難點、卡點、節(jié)點

1 評論 482 瀏覽 1 收藏 15 分鐘

大模型技術在2024年似乎遭遇了發(fā)展的瓶頸,資本市場對此概念的熱情降溫,消費市場的新產品推出和更新速度減緩,民眾的關注度也隨之降低。盡管如此,大模型領域的競爭依然激烈,特別是在價格和營銷方面。本文深入探討了大模型技術發(fā)展中的難點、卡點和潛在的突破節(jié)點。

進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;

消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……

熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型“價格戰(zhàn)”的第一槍,百度文心、訊飛星火、阿里通義、騰訊元寶等紛紛跟進;

同時,地鐵、寫字樓、機場等白領人群密集區(qū)域,百度文心、訊飛星火、阿里通義、騰訊元寶、華為盤古的Slogan,你方唱罷我登臺,貼臉營銷如槍林刀樹。

“海水”與“火焰”交融的場面,不得不讓人思考,大模型的出路究竟在哪里?難點、卡點、節(jié)點又是什么?

一、難點:盈利難&落地難

強如OpenAI,也面臨“恰飯”的難題。

援引外媒報道,OpenAI預估虧損50億美元,全年運營總成本高達85億美元,照此估算,其現(xiàn)金流大概率在一年內耗盡。

而在一篇題為《How does OpenAI Survive》的長文中,作者對OpenAI的商業(yè)模式產生了質疑:  

“OpenAI的營收在35億至45億美元之間,但其運營虧損可能高達50億美元,其收入遠遠無法覆蓋成本。而為了推出下一代的大模型GPT5,OpenAI需要更多的數(shù)據和算力,這又是一大筆花費。”

說千道萬,靠著“碎鈔式”的大力出奇跡后,大模型卻仍未找到一條合理的盈利路徑。

據《節(jié)點財經》觀察,市面上的大模型,大部分都采取To C+To B,即會員訂閱+開發(fā)者API調用“兩條腿”走路。

但無論是To C,還是To C,能一上來就產生付費的寥寥無幾,若再刨除重負的減項,多半是鼻子大過臉。

以本土大模型先行者百度為例,2024年Q1,其云業(yè)務收入為47億元,同比增長12%,其中6.9%來自外部客戶使用大模型及生成式AI相關服務,約為3.24億元。

而在2023年Q4,大模型為百度云貢獻了6.6 億元增量收入。

這是國內唯一披露大模型收益的廠商,本身又是家大業(yè)大,有底氣拼到底的巨擘。但只談創(chuàng)收,忽略創(chuàng)利,就是耍流氓。

可想而知,其余不敢明示賬目的選手,內心有多迷茫、煎熬。

不掙錢,難掙錢的背后,是大模型落地難的窘境。

雖然大佬們高呼“ChatGPT”的問世是“iPhone時刻”,第四次工業(yè)革命,新一代的“火”和“電”,但坦率地講,當下大模型還有很多局限性,包括認知偏差、能動性欠缺、泛化性能弱、幻覺等。

比如,數(shù)值運算就是大模型明顯的弱項,或者說大模型是妥妥的“文科生”,做數(shù)學題的智商可能連二、三年級的小學生都不如。

《節(jié)點財經》親測,在Kimi輸入:“9.11和9.8哪個大?”一頓啰嗦后,Kimi給出了完全不正確的答案。  

圖源:Kimi官網

比如,大模型資料更新不及時,必須外掛知識庫才能在一定程度上緩解這個痛點,并且還是無法完全解決“一本正經地胡說八道”的尷尬。

前幾天刷屏的SearchGPT,就在各地網友興致勃勃等待灰測展現(xiàn)AI搜索的“洪荒之力”時,《大西洋月刊》澆了一盆冷水,眼尖的記者發(fā)現(xiàn):  

問的是關于“八月份北卡羅來納州的布恩音樂節(jié)”的細節(jié),SearchGPT的回答分為5條,3條里包含事實錯誤——有的是把舉辦日期弄錯,有的是把距離和車程搞混,有的是把場館網址張冠李戴。

再如,大模型絕對是“健忘癥”患者,我們在和它對話時,尤其是多輪對話時,難免要化身“復讀機”,一遍一遍重復相同的話術。

而在B端,因為實戰(zhàn)經驗不足,生分于對方的Know-How,加之環(huán)境的復雜多變性,大模型面臨的挑戰(zhàn)更艱巨。某業(yè)內人士表示,迄今大模型在行業(yè)中尚沒有一個成熟的案例。

二、卡點:數(shù)據、算力、成本

深入肌理地分析,大模型的“落地難”又與自身的三大卡點:數(shù)據、算力、成本息息相連。

? 卡在數(shù)據

如果把大模型比作一頭巨獸,那它的顯著特征之一便是“不停進食”:需要高質量、大面積的語料做長久期、高頻次地投喂、催肥。

換言之,“食物”的品質、多寡、新鮮度、多樣性等,決定了大模型的迭代進度和學習效果。

無疑,這對數(shù)據的挖掘、獲取提出嚴峻考驗,關系到各方的權益保障、利益分配、版權歸屬等,通常涉及到敏感信息時,數(shù)據的清洗、標注、脫敏又會很繁雜。

前陣,免費網文APP番茄小說因一份“AI協(xié)議”引發(fā)軒然大波。根據該份協(xié)議,平臺可以將簽約作品,含名稱、大綱、簡介、章節(jié)等,作為“哺育”AI大模型的素材,用于各種應用場景,如智能對話、智能文本創(chuàng)作等。

不過,這一舉動遭到作者的普遍反對,認為其不僅威脅網絡寫手的生計,還損害了原創(chuàng)內容的價值,甚至發(fā)起聯(lián)合斷更以示抗議。

? 卡在算力    

如果把AI鏈路比作一間工廠,那么算力便是維持工廠運轉,量級夸張且進價不菲的“燃料”(煤、石油、電力等)。

公開資料顯示,初始ChatGPT匹配的算力是1萬塊英偉達A100(AI芯片),花費超過7億元。后續(xù)調優(yōu)每天消耗的算力大概是3640PFLOPS,即7至8個算力達500PFLOPS的Data Center的支撐,整體基建開支以百億計。

按照廣發(fā)證券的測算,在暫不考慮軟件層面算法優(yōu)化的前提下,本土AI大模型在訓練與判斷、預測階段所需算力,相當于1.1萬臺或3.8萬臺(樂觀假設下)高端AI服務器,大致對應約126億元到434億元的資金體量。

進一步地,隨著大模型規(guī)模狀大,算力需求會倍數(shù)遞增,已然超越硬件的摩爾定律。據悉,ChatGPT從1.0到3.0,參數(shù)量從1.17億狂飆到1750億。

而目前,我們在算力這塊既面臨外部“卡脖子”,內部建設又相對落后,碎片化、傳輸慢、協(xié)同難、人才緊缺等“痼疾”亟待突破,導致大模型的實效遜于國外。

“大模型只有兩個梯隊,OpenAI和Others,國產用哪家都一樣”,多位AI從業(yè)者談道。

? 卡在成本

大模型“桎梏”于算力,實際也是“桎梏”于成本。

計算機飛入千家萬戶,售價下探,變得親民、接地氣,很關鍵;智能手機能人手一部,物美價廉的小米功不可沒;新能源汽車的熱賣,離不開動力電池的“跳水式”降價……    

從人類歷史的進程看,任何一項新技術的推廣、普及,都離不開對成本的有效、大力壓縮、控制。

硬幣的背面,是科技發(fā)展和工業(yè)文明進步共同作用下,制造效率、運算精度提升,人均產值拔高,各類物料愈發(fā)便宜等因素集結的強大驅動力,進而減輕C端、B端“太貴了,買還不買”的糾結。

大模型同理,浩大的開支也是其成長途中的“絆腳石”。試想,當生態(tài)里只有唯一的“賣鏟人”(英偉達)賺錢,賺頭還不小,怎么可能持續(xù)呢?

好消息是,今年2月末,李彥宏透露,自發(fā)布以來,百度不斷降低文心大模型在推理方面的成本,已降至去年3月版本的1%。

三、節(jié)點:在產業(yè)里“種植”大模型

毋庸置疑,大模型仍有諸多“短板”和缺陷,但新技術的魅力向來在于探索“無人區(qū)”,跋涉“深水區(qū)”。

很多眼下看似微弱的“火種”,往往都孕育著日后“納須彌于芥子”的宏壯。盡管迄今為止的大模型,大家都是拿著錘子找釘子,但我們已經看到,其正逐步向產業(yè)邁進,嘗試扮演了一些淺層的Agent的角色。

最醒目的標識便是,大模型不再坐而論道,只會聊天、寫詩、作畫,而是起而動之,走出實驗室,去往礦區(qū)、政務、金融、醫(yī)藥、金融、物流等具體領域,努力兌現(xiàn)自己的終極使命。

比如,在礦區(qū),下井工人常年深陷光線昏暗、浮塵彌漫的環(huán)境,疊加經年累月高強度的勞碌,使不少人都患上了風濕、耳鳴等職業(yè)病,更甚者,還可能遭遇瓦斯、透水等意外,但礦區(qū)作業(yè)又十分依賴人力,特別是主運系統(tǒng)巡檢。

華為的盤古礦山大模型這時候便派上用場了。其覆蓋煤礦的采、掘、機、運、通、洗選等流程下的1000多個細分場景,用AI取代人成為主運智能監(jiān)測系統(tǒng)的眼睛,能夠精準識別大塊煤、錨桿等異常情況,異物識別準確率達98%,動作規(guī)范識別準確率超過95%,且全時段巡邏助力工作人員,避免因漏檢造成的安全事故,縮短停機時間。  

京東表示,基座大模型是靠卡訓出來的,企業(yè)大模型是靠人用出來的。

物流領域,攬收、派送、分揀、輔助,應對突發(fā)事件等,快遞員每天都背負著繁重的任務,還要熟悉貨物處理規(guī)程、安全操作標準、客服要求等多達上百個規(guī)范,把這些統(tǒng)統(tǒng)記牢,肯定要耗費大把功夫,還容易混淆。

京東言犀大模型的小哥終端助手大大化解了上述煩惱。它告別了只“動腦”的境界,能直接“下手”,快遞員動動嘴,小哥終端助手就能立即將送貨通知發(fā)給客戶。如今,小哥終端助手為JD商城近35萬自有配送員“效勞”。

再如,零售行業(yè),基于京東言犀大模型的AIGC營銷工具“京點點”,不僅可以幫助商家一鍵出商品圖,還支持了超過2000種視覺元素道具;不僅可以豐富吸睛資源和表現(xiàn)力,還能依循商品屬性、特點和宣傳想要的個性化布局,實時、自主撰寫創(chuàng)意賣點、種草文案、直播腳本等。

總的來說,把大模型“種植”在產業(yè)里,讓大模型在產業(yè)里生長、發(fā)芽,儼然是現(xiàn)在大廠的共識,必須攻克的難關。長遠看,該共識亦如“星星之火”終會燎原曠野。   寫在最后

當喧囂過后,大模型這場豪華游戲,能留在牌桌的玩家,注定只是少數(shù)。

面對數(shù)據、算力、成本等現(xiàn)實問題,供需兩端漸漸回歸理性??梢灶A見,在真“好用”和能“吸金”之間,大模型還有很長的路要走。

作者:崔大寶
本文由人人都是產品經理作者【節(jié)點財經】,微信公眾號:【節(jié)點財經】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 大模型技術在2024年似乎遭遇了發(fā)展的瓶頸,資本市場對此概念的熱情降溫,消費市場的新產品推出和更新速度減緩,民眾的關注度也隨之降低。盡管如此,大模型領域的競爭依然激烈,特別是在價格和營銷方面。這篇文深入探討了大模型技術發(fā)展中的難點、卡點和潛在的突破節(jié)點,對我很有幫助和啟發(fā)。

    來自中國 回復