大模型落地競逐,云計算大廠“百舸爭流”
經過一兩年的發展,大模型從通用到垂直,摸索過后,大家都開始進入落地的第二階段。這篇文章,我們選取阿里、百度、騰訊、華為這四個頭部云計算廠商,來看看他們大模型落地的分野,都是怎么做的。
從ChatGPT到Sora,從圖文到視頻,從通用大模型到垂直大模型……經過了1年多時間的探索,大模型進入到以落地為先的第二階段。
行業的躁動與資本的狂熱相交匯,既造就了信仰派的腳踏實地,也產生了投機者的渾水摸魚,如今回頭,大模型落地到底進行的怎樣了,大模型廠商們又是如何實踐的?
我們今天選取阿里、百度、騰訊、華為這四個頭部云計算廠商,從他們或明或暗的戰略路線,來窺視出大模型落地的路徑分野。
01?阿里云:閉源開源兩線并舉
不久前結束的阿里云AI智領者峰會·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持續做(大)模型開發,又做大量(大)模型開源的公司?!?/strong>
之所以會兩線并舉,周靖人的解釋是,為了滿足用戶和開發者生態對基礎模型的不通需求,這也是“模型即服務“的內涵之一。
具體實踐中,阿里云此次大會發布了閉源SOTA大模型通義千問2.5,根據權威基準OpenCompass的測評結果,通義千問2.5得分追平了GPT-4 Turbo,為國產大模型取得的最高排名。
開源路線上,自2023年8月以來,阿里云陸續開源了十數款模型,據官方公布數據顯示,目前通義開源模型下載量已經超過了700萬,最新開源的1100億參數模型在多個基準測評收獲最佳成績,超越Meta的Llama-3-70。
雖然有了基礎模型,但是各行各業的需求不同,即便是同一行業中的不同企業,他們之間的需求也很難被統一,因而標準化的基礎模型很難被直接用起來,為此,阿里云貼著開發者生態的場景需求,升級了AI Infra平臺——百煉,推出了百煉 2.0。
百煉 2.0依托阿里云AI基礎設施,同時對模型開發、應用開發和算力底座等工具進行了升級,引入更多模型,還率先兼容LlamaIndex等開源框架,企業可自由替換能力組件來適配自身系統。
作為國內最大的云廠商,阿里云擁有最為龐大的業務規模和覆蓋最全面的客戶群體,在AI路線還遠沒有收斂的行業背景下,一面是客戶需求的驅動,一面是對技術踏空的隱憂,阿里云在大模型上全面布局也就可以理解了。
如果再將阿里云3月份時的史上最大力度降價相關聯,可以看出,阿里云的種種動作都指向一個目標,即實現云和人工智能業務的螺旋上升,暗含著對未來業績增長的長遠考量。
02?百度云:以AI原生應用為矛
在幾家云計算大廠中,百度云的規模最小,但由于大模型與百度一直堅持的AI技術路線強關聯,加之去年3月推出文心一言后,又陸續在大模型工具平臺、大模型對自身應用重構、大模型生態建設等方面,進行了一系列體系化的出擊,使得其成為大模型行業中極為重要的一支力量。
百度的打法并不復雜,一方面通過對文心一言的持續進化,保證文心一言的能力始終處于第一梯隊,去年的百度世界大會上推出的文心大模型4.0版本的參數規模達到萬億級別,綜合能力不遜色于GPT-4。
另一方面強調原生應用重要性,李彥宏分析大模型應用競爭的本質是表示:“企業競爭,不是大魚吃小魚,而是快魚吃慢魚,比競爭對手更快決策,很可能你就贏了。”這事實上也是百度在大模型落地上的競爭策略:加速沖刺,多方探索應用可能,尤其看重“AI原生應用”。
百度首先用大模型對自己的產品進行了全面改造和煥新,基于現有的用戶基礎,獲得真實使用反饋后,反過來加速大模型的迭代;然后與云服務相結合,提供智能算力資源和訓練工具,幫助其他企業開發自己的模型。
為此,百度智能云推出了一系列平臺或工具產品,如幫助生成營銷材料的“擎舵”、文心大模型插件開發平臺“靈境”,企業級大模型生產平臺“千帆”等。
百度云今年春季召開的首屆生態大會中,宣布面向三類市場——頭部市場、價值市場和高潛市場,厘清與伙伴之間的分工協作邊界,實現協同作戰,其目的也是為了將場景快速閉環,加速大模型落地。
03?騰訊云:以實用主義落地實體經濟
騰訊入局大模型的時間比較晚,直到去年9月的騰訊全球數字生態大會上才正式發布自研的通用大語言模型混元大模型,在行業中一直是比較低調和另類的存在。
混元大模型發布之前,騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生曾闡述過騰訊的大模型價值觀,“通用大模型不一定是滿足行業場景需求的最優解。企業需要有針對性的行業大模型,結合自己的數據做訓練或精調,在合理的成本下,打造實用性更高的智能服務。”
實用主義由此被提煉出來。
一方面是關注大模型解決具體問題而不是參數大小,另一方面是用什么樣的技術組合更有效率的解決問題。
騰訊云副總裁、騰訊云智能負責人吳運聲曾表示:“幾億、幾十億、幾百億還是一千多億,我們并不關心模型參數的那個數字,我們更關注的怎么解決客戶的問題,希望用最有效,最低成本的手段去解決客戶的問題。”
在具體實踐上,騰訊云有著非常清晰的思考,第一步,鉚釘標桿客戶;第二部輻射整個上下游產業鏈的腰部企業,而破局的關鍵就是實體經濟。
目前,騰訊云已經攜手政務等行業的頭部企業,在20余個行業探索了超50個行業大模型的應用解決方案。以騰訊云數智人工廠為例,騰訊云MaaS能力可以讓數智人分身復刻縮短至24小時,大幅降低成本。在文旅領域推出的文旅大模型,金融領域打造的OCR大模型都是已經落地的案例。
04?華為云:以算力底座為基礎深入千行百業
與很多大模型廠商在剛入局時死磕技術,專注于對標ChatGPT的能力有所不通,華為云的大模型戰略一開始就是奔著落地去的,去年的世界人工智能大會上,華為輪值董事長胡厚崑演講時表示,人工智能的發展關鍵在于“走深向實”,華為的定位是賦能產業升級,服務好千行百業,服務好科學研究。
圍繞這個定位,華為的大模型戰略出現了兩條路徑,一是大模型領域,從通用大模型到行業大模型,讓人工智能使能行業,助力科研;二是算力領域,打造強有力的算力底座。
華為云盤古大模型3.0發布時,提出了“不作詩只做事”的口號,按照“5+N+X”三層架構,即基礎模型、行業模型和場景模型,目前已經落地金融、制造、政務、煤礦、鐵路等10多個行業,支撐400多個業務場景的AI應用落地。
一個最典型的場景,煤礦的智能化升級中,盤古礦山大模型只需導入海量無標注的礦山場景數據進行預訓練,即可進行無監督自主學習,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景的通用。目前,盤古礦山大模型已在全國8個礦井規模使用。
做強算力底座方面,華為的關鍵詞是“自研”和“開放”。
在相對底層的計算效率研究方面,華為的打法是架構創新,基于自研的達芬奇架構,推出昇騰處理器,圍繞昇騰芯片打造昇騰AI集群,國內建設的規模最大的AI計算集群深圳鵬城云腦II期不但實現了全棧軟硬件的自主可控,還蟬聯了多項全球AI性能榜單的冠軍,算力達到1000P。
不難看出,華為不但直接賣“魚”,還傳授“捕魚”技巧。
05?結語
綜上所述,這四家云計算大廠對于大模型的落地雖然在打法上各有側重,但目標還是非常一致,基本上都是在自身原有業務的基礎上進行延展,或繼續加長自己的長板,或開發出新的增量。
值得一提的是,除了在大模型的技術和業務層面進行競爭之外,這幾家大廠還廣泛參與到大模型創業公司的投資之中,目前中國估值前五的生成時AI獨角獸(月之暗面、智譜AI、Minmax、零一萬物和百川智能),阿里的參投率為100%,騰訊則投了百川智能、智譜 AI 、MiniMax 3家,此外深言科技、無問芯穹等大模型公司也曾進入到騰訊的投資名單。
這也是說,大模型的競爭不僅僅只停留在大模型上,資本層面的暗戰同樣激烈。
作者:辰紋
來源公眾號:洞見新研社(ID:DJXYS-0309),專注商業與科技,在沒人思考的地方,再深思五分鐘。
本文由人人都是產品經理合作媒體 @洞見新研社 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!