淺談國產大模型的過去、現在以及未來

0 評論 313 瀏覽 0 收藏 10 分鐘

國產大模型技術自ChatGPT爆火之后迅速發展,但隨著時間的推移,熱潮逐漸降溫。本文將探討國產大模型從誕生至今的演進歷程,分析當前市場狀況及其面臨的挑戰,并展望未來的發展方向。文章通過深入分析,揭示了大模型技術在商業化和差異化方面的局限,同時指出了技術發展與市場需求之間的差距。

怎樣去衡量一款AI產品是否成功?

這個問題如果放在兩年前,很多人給出的答案會集中在AI的狹義領域,AlphaGo、Siri、Google Assistant,或是用于解鎖手機的圖像識別技術,能夠在某個特定的領域完成特定的任務。

但從2023年開始,也就是ChatGPT火了之后,人們對AI的看法發生了一些轉變,學習、適應、推理的自主決策的能力,不免讓人產生AGI會成為現實的錯覺。

所以我們能看到,在ChatGPT發布后的不到兩年里,國內就上線了數百個大模型,里面既有互聯網大公司,也有各種垂類公司,還有一批跑在風口上的初創企業。

毫無疑問,AI大模型的研發需要投入大量的資金和人才,這也導致了絕大部分初創公司的估值被嚴重透支,他們在短期內獲得了大量融資,后續卻無法持續燒錢維持迭代和商業落地,隨著投資人信心下降,不免有一些機構選擇清倉或撤資。

大浪淘沙,伴隨無休止的套殼和再生的游戲,當下市面上能夠接觸到的模型主要分為兩類。一是基礎通用大模型,比如文心一言、通義千問、元寶這類大廠產品,它們應用場景廣泛,功能包括但不限于文本生成、語言理解、問答系統、摘要提取、機器翻譯等。某種程度上,它們可以作為下游任務的基礎模型,通過微調或遷移學習,適應不同的應用場景和需求。

其次是行業專用,各類細分賽道的產出,像金山的政務大模型,多家公司的醫療、金融等大模型,應用場景主要集中在各自的專業領域內。例如,醫療大模型可以應用于電子病歷分析、疾病預測、藥物研發等多個環節;金融大模型則可以應用于風險評估、投資策略制定、客戶畫像構建等多個方面。

如果僅從數字上看,國產大模型在技術上的確成長很快,根據SuperCLUE的評測結果,國內絕大部分閉源模型已超過GPT-3.5Turbo。但事實上,這樣的比較意義并不大,大模型雖然多,技術代差也在縮小,但商業化、差異化但效果并不明顯,以至于大多數投資人回歸到觀望的態度。

前段時間圈子里比較熱的幾個話題,Kimi母公司月之暗面在2C業務之外,官宣了Kimi企業級API的正式發布,比通用模型有更高等級的數據安全保障和并發速率;智譜AI發布“Z計劃”,開始、轉型投資人的身份。

縱觀五虎里剩下的百川智能、零一萬物、MiniMax三家公司,推出的產品也很難打出真正的差異化,C端主要提升聽說讀寫技能,產業端則作為私有數據平臺和簡化復雜需求的工具。一股勁兒地都在鉆技術,較量百萬,頂多千萬級的日活,但市場一直缺乏能夠承載AI的殺手級應用。

這樣一來,逐漸聚焦于一個關鍵議題:盡管我們不斷追求更大的數據量、更強的計算能力以及更復雜的模型訓練,以期構建出更加智能的大模型,但這一過程中往往忽視了一個至關重要的前提:這些高級模型的有效運用與推進,離不開專業人員的深度參與和專業方法的精準實施。

當我們試圖將這些大模型直接應用于具體場景,如新聞資訊平臺或金融領域時,面臨的挑戰便顯現出來。比如在面對如抖音、快手等已高度優化用戶畫像的平臺時,大模型似乎并未能帶來顯著的變革性影響。這并非因為大模型本身不具備潛力,而是其在實際應用中的定制化與精準化需求遠未被充分滿足。

進一步來講,如果將大模型應用于傳統制造業或低門檻工作領域,同樣面臨嚴峻挑戰。

過去人們以為,通過大模型的指導,即便是非專業人士也能輕松勝任高技能要求的崗位。然而,現實卻遠非如此。社會的工作分工與評價體系依然根深蒂固,強調經驗積累與行業專業性。這意味著,僅憑大模型的短期培訓,很難讓一個普通人迅速跨越行業門檻,達到專業水準。

一個無法忽視的問題是,不同企業、不同業務應當如何設定合理且科學的增長標準,以及在缺乏直接參照對象時,如何衡量并規劃業務的未來增長。

在觀察當前市場上的AI大模型產品時,起初,這些技術可能憑借其新穎性和創新性吸引了大量關注,但隨著技術的成熟和市場的飽和,增長動力逐漸減弱。

事實上,許多高估值的產品往往是在某個小眾領域進行了深度挖掘和創新。這些問題極具普遍性,橫跨了不同企業和業務領域,例如,拼多多通過重塑電商體驗,為消費者帶來了全新的購物感受;京東則憑借其強大的物流體系,構建了難以復制的供應鏈壁壘。

對于當前的大模型技術而言,發展方向應當更加注重用戶體驗和市場需求的結合。當這些技術被嵌入到如WPS這樣的辦公軟件,或是美團這樣的服務平臺中時,核心問題在于,如何讓AI技術更好地服務于用戶需求,而不是僅僅停留在表面或淺層次的分析上。

舉個例子,用戶讓AI軟件猜測自己想吃什么,它們的確會通過語義分析來理解用戶的意圖,并給出一些建議或推薦。然而,這些推薦往往停留在較為寬泛的層面,沒有真正深入到用戶的個性化需求中。

換句話說,因為當前的AI技術還難以完全理解用戶的復雜情感和具體需求,只能基于已有的數據和模型進行大致的預測和推薦;另一方面,讓AI猜測人的已有目的,這件事本身就很浪費時間和技術資源。

再以翻譯為例,假設我們已經能夠將翻譯精度提升到99%,而市場上的需求僅需要95.6%的準確度。這時,再花費大量資源去將精度從99%提升至99.5%,是否真的有意義?尤其是當這種提升對于大多數用戶來說,并無顯著差別時。

這里的核心問題是,從商業角度來審視技術的ROI(投資回報率)和ROE(凈資產收益率)。在一個技術概念成為風口時,往往過分強調技術的先進性,而忽略了其在實際應用中的價值和可持續性。真正的挑戰在于,如何將技術轉化為實際的生產力,解決用戶的真實需求,而不是簡單地堆砌技術。

然而,能看到的卻是大量公司在盲目跟風,試圖通過增加數據量、提升算力等手段來打造所謂的“大模型”。但這種做法往往忽略了客戶成功(CSM)的重要性,如何確保技術能夠真正滿足客戶需求,為客戶創造價值?

更為嚴重的是,許多公司并沒有清晰的業務規劃和階段性目標,像無頭蒼蠅一樣四處亂撞,結果往往是資源浪費和失敗。大模型公司應該更加聚焦于實際場景的應用和落地,而不是僅僅停留在技術層面的自嗨,這樣的認知應該早已共識,只不過問題尚未解決,市場也難有突破性的故事。

作者|鹿堯
本文由人人都是產品經理作者【新眸】,微信公眾號:【新眸】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!