大模型狂飆半年,誰能勝出

0 評論 4044 瀏覽 5 收藏 14 分鐘

國內外科技巨頭或企業都在快速拿出舉措,以應對大模型時代的發展。那么在經歷了盛況之后,大模型行業又將進入怎樣的競爭格局?一起來看看文章的解讀和分析吧,或許會對你了解AI大模型行業的發展有所幫助。

毫無疑問,當前的科技圈已進入“大模型”時代。含“?!绷看蟮绞裁闯潭??但凡科技企業,基本都在做“大模型”。

“從去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,幾乎所有行業玩家都想抓住這根救命稻草。因為做成了就意味著抓住未來幾十年的趨勢?!毙袠I創業者夏先生對壹DU財經說道:“ChatGPT是生成式AI,是大模型的落地場景之一。理論上講,這條路的走通,加速了大模型在短期內的爆發?!?/p>

的確,ChatGPT的爆發,讓更多人看到了語言模型的魅力。微軟、谷歌、百度、阿里等國內外科技巨頭快速響應,相繼推出自家的AI聊天機器人,試圖以To C作為切入口,搶占市場。

風口在哪里,資金和人才就在哪里。隨后,先是廠商陸續宣布推出大模型,如百度的文心大模型、阿里的通義大模型、騰訊的行業大模型,后有科技圈曾經的風云人物也開始陸續入場,李開復、王小川、周伯文、王慧文等。出行、認知、辦公等一些垂直領域的大模型也相繼推出。

半年時間,國內呈現出“群模亂舞”盛況。而在經歷喧囂后,大模型或許是時候回歸現實了。

玩家們開始意識到,最初的熱鬧僅僅是熱鬧,他們最終的戰場在B端市場。此時,多家有著人工智能積累和云計算大廠登臺,相繼推出了AI大模型服務。

行業老炮和新手創業者的對決,也就此開始了。

一、熱情高漲,玩家們跑步入場

進入2023年,大模型技術讓科技圈沸騰起來??吹紺hatGPT爆發后,不少大廠抓緊時間推出相應產品,新老創業者們著急招兵買馬,生怕慢一步就錯過了這難得的風口。一級市場關于大模型的投融資熱度也在攀升,不少FA開始瘋狂補課。

一時間,整個行業熱鬧非常。

在OpenAI發布GPT4大模型后,第一個采取行動的是百度,在3月16日用“Demo演示”的形式正式發布文心一言。同樣在3月,已經沉寂許多的周鴻祎推出大模型產品,甚至連名字都沒來得及取。

在此之后,科技巨頭、創業公司和高校研究院們展開了一場關于“大模型”的競速賽。整個4月,都成了“大模型的發布月”,華為、商湯、阿里都在4月份亮出了自己的大模型產品。

到了5月,訊飛推出了自己的星火大模型,并公布了大模型在自己優勢領域的諸多應用場景。

創業者們也在火速入場。原美團聯合創始人王惠文(目前已退出)、創新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等開始招兵買馬。前搜狗CEO王小川的百川智能拿到5000萬美元融資后,甚至揚言:“今年年底做到國內最好的”。

“這波創業熱潮有點2000年左右的互聯網創業潮的意思?!币晃粯I內人士說道:“似乎每個創業者都想在這個時代找到第二春?!?/p>

總體來看,今年上半年,大模型幾乎成為所有科技企業的必選項。對于普通人而言,大模型或許是件很遙遠的事。畢竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行業。

但事實上,大模型的應用更多在B端市場。那么,在行業烈火烹油過后,擺在這些玩家眼前的,理應是他們對市場更多的理性思考。比如市場是否真的需要大模型?大模型真正走向成熟,需要越過哪些重要關卡?能否真正意義上實現商業化。

二、正式開打

大模型軍備賽的沖鋒號吹響后,整個行業開始“卷”起來。更多玩家已經將視線移至應用層面。因為行業“退燒”后,最終考驗的還是玩家們的“硬實力”。

此時,一些在人工智能、云計算上有積累的玩家則占據的先發優勢。尤其是模型的參數量。

就目前市場上發布的AI模型來看,雖然大家都自稱為“大模型“,但參數量實質是大模型和小模型的界定因素之一。

此前,百度集團副總裁侯震宇在接受媒體采訪時曾表示,2022年,10億參數的模型就叫大模型。但到了眼下,千億參數以上才會出現“智能涌現”,才會形成泛化能力,才能在各個場景下具備通用能力。

何為“智能涌現”?簡單地講,當模型規模、算力水平超過某個參數閾值后,AI效果將不再是隨機概率事件。比如初期語言大模型出現“圖不對文”“答非所問”等現象。

并且在通用領域,參數量越大,智能通常涌現的可能性就越大,AI準確率就越高。在垂直領域則更容易獲得精確的效果。

今年5月,科技部下屬的中國科學技術信息研究所發布的《中國人工智能大模型地圖研究報告》統計,截至5月28日,國內10億級參數規模以上基礎大模型至少已發布79個。

大模型狂飆半年,“群模亂舞”誰能勝出

但可以看到,10億級參數這個量級,很可能不是真正的“分界線”。因為現實的情況是,一些未能達到千億規模的模型,很難在當前市場的競爭具有競爭力。不過,也不排除一些在垂直領域深耕的玩家,最終能跑出來。

“大模型需要算力、算法和數據積累,絕對不是玩概念的事情,最終還是要市場買單?!毕南壬J為,目前來看諸如百度、騰訊、阿里無論是在資源還是積累上,都有一定的優勢,“他們在云市場深耕,并在自己擅長的領域積累多年,無論技術層面還是行業積累上,實質已經完成了搶跑,未來就看這些頭部玩家如何落地?!?/p>

而在投入層面,這會是一個天文數字。

以百度為例。據透露,過去10年,百度在AI方向的投入已超過1000億元。但大模型不是投一筆錢、做一個模型那么簡單,它需要有算力、有數據、有經驗豐富的AI工程師在好的研發平臺上長期積累。

而創業公司如果直接去做基礎大模型,除了上述投入之外,還需要能夠把模型、算力管理好的AI開發平臺。

這意味著,創業公司不論是自建開發平臺,還是采購外包平臺,其投入都不會是小數目。并且,大模型不是預訓練出來就好,更需要后續持續敏捷迭代。從這一點看,創業公司所受的限制明顯要高于大公司。

但大廠很難留住強算法人才的弊端也比較突出,因為大模型投入是一件長期主義的事,必定會面臨與既有業務之間的沖突。這一點,從大廠出走的大模型創業者的經歷,就說明了一點。長期主義對創業公司同樣重要,無論是創始人的背景背書,還是資源合作,抑或是客戶的拓展,都需要長期積淀。

三、行業競賽即將鳴槍

人工智能專家侯世達的學生梅拉妮·米歇爾《AI 3.0時代》一書中提到,研究人工智能與賽道中的創業者們都熟悉了一種模式——先是“人工智能的春天”,緊接著是過度的承諾和媒體炒作,接下來便是“人工智能的寒冬”。并且,他認為這一模式將以五到十年為周期不斷上演。

具體到2023年上半年的大模型賽道,顯然其正處于第二個階段——行業很火,市場很熱。這一周期往往是最短的,也通常意味著如此去泡沫化后,賽道競爭即將正式開始。

大模型比拼的不僅僅是技術,還應該將重點放在大模型應用、產業生態中去評估。

目前,市場上大模型的玩家主要分三類。

一是聚焦基礎層,主要對標OpenAI,發揮基礎設施的作用。

第二類是錨定中間層,不需要像OpenAI一樣花大錢做底層,只需要掌握通用化能力,就可以通過開源大模型做精調,讓模型具備差異化能力,最終可以形成垂直類模型。

第三類是調用大模型API的企業,專注開發大模型具體場景的應用,如Jasper。

相對而言,前兩類又是大模型的“基礎設施”,因為有極高的門檻,對技術、資金以及資源有嚴格的準入壁壘,往往是大公司布局的主要方向。

目前來看,百度、阿里和華為在大模型的構建上,不約而同地采用了“模型+工具平臺+生態”的三層共建模式。騰訊云則更專注于應用層而,6月19日公布的騰訊云MaaS服務解決方案即覆蓋了金融、文旅、政務、教育等10個行業、超50個解決方案。

大模型狂飆半年,“群模亂舞”誰能勝出

雖然巨頭們參與競爭的姿勢不同,但目標實質上只有一個,那就是打通應用層。在百度創始人李彥宏看來,應用層最具想象空間。

商湯科技聯合創始人楊帆認為,AI 基礎設施本質上還是算力、數據、基礎算法,包括算法相關的工具,本質上還是三位一體的東西。最后誰能把這三者的整合能力提供的好,提供更低成本、更低門檻的能力是決定整個競爭最重要的點。

結語

AI大模型是人工智能邁向通用智能的里程碑式技術,因為其可為各行各業的智能化升級提供強勁的生產力工具。在千行百業數字化轉型升級的當下,大模型的重要意義不言而喻。也因此,在當下,誰能率先在賽道里搶到更多籌碼,就非常關鍵了??梢灶A料,未來,拋開“基礎設施”層面的較量外,真正的戰場大概率是各行各業的切實落地上。

作者:Apple,編輯:亦可

原文標題:大模型狂飆半年,“群模亂舞”誰能勝出

來源公眾號:壹DU財經(ID:yiducaijing2021),多一度熱愛,深一度觀察。

本文由人人都是產品經理合作媒體 @壹DU財經 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!