政企市場,「觀望」AI大模型

0 評論 3879 瀏覽 15 收藏 12 分鐘

數據安全等“剛需”下,私有化成為政企市場的準入門檻,然而私有化下,行業模型局限性尚未可知,加之信創化等因素,廠商仍需取長補短,為政企客戶提供全方位的解決方案。

政企領域,似乎正在成為AI落地的又一標的。

幾個最新的動態是:新華三針對政企客戶發布私域大模型“百業靈犀”LinSeer、中國電科發布專為黨政企行業用戶服務的AIGC大模型“小可”、百應科技發布政務行業專有大模型“萬機”……百度智能云、阿里云、三六零、科大訊飛、商湯等也都在針對政企客戶,發布了相關產品和解決方案。

這一趨勢同樣發生在海外。有消息稱微軟正在使用其 Azure 云服務把 OpenAI 的強大的語言生成模型引入政府機構,這些模型包括 OpenAI 最新、最先進的大型語言模型(LLM)GPT-4以及 GPT-3。

然而,從國內發布政企大模型的各大廠商的動作來看,并未有較多的落地案例。背后的原因有很多,一是產品發布時間短,無法及時得到較大反饋;二是由大模型引起的AI熱潮還處于爆發期,政企對于合作廠商的選擇還需考量。

除了這些因素之外,幾個關鍵的問題是,這些廠商針對政企客戶發布的AI產品,真的是政企所需要的嗎?再或者,于政企而言,其需要什么樣的AI產品與服務?

一、政企市場,“觀望”AI

“我們接觸的客戶都在探索這方面的內容,政企會有這方面的訴求?!蹦硺I內人士告訴產業家,“但對于AI大模型在政企領域的應用,大家都處于觀望+探索的階段。

在國內,政企普遍體量大、業務復雜、定制化要求高,有著沉重的IT建設包袱,各部門、業務之間難以協同,數據壁壘也難以打破,這使得政企的數字化轉型困難重重。

而大模型可以把人與人、人與機器之間的交互過程數據完整的沉淀下來,讓它自主學習進步,持續演進。杜絕了過去的煙囪式建設,降本增效的同時還能推動政企數字化進程。

這種技術應用的趨勢,推動著諸多廠商開始將自身的TOG產品與大模型結合。

不過客觀來看,當下雖然深耕AI產業鏈的玩家眾多,但在政企領域,出于對算力、行業專業度、數據安全、國產化等各方因素的考量,廠商難以給出合適的AI解決方案。

AI大模型作為數字化的新基建,如何賦能行業仍需不斷探索、實踐。很多企業也在不斷進行新的嘗試。

周鴻祎曾在微博上發文表示,“大型企業或者政府要私有化大模型。即在加入公有GPT知識和能力的基礎上,再訓練一個私有的GPT,只給企業自己或客戶使用?!?/p>

與周鴻祎有相同見解的,還有新華三安全產品研發總監韓小平。

“政企大模型一方面數據不能出域;一方面需要結合其業務場景數據進行喂養訓練,生成實際的業務場景App?!?/strong>

他認為,政企大模型技術本身其實不是唯一考量的因素,更重要的是對用戶業務的理解。政企AI服務,行業Know-how仍是關鍵,沒有政企業務服務經驗的廠商,難以結合大模型設計出個性化的解決方案。

兩人都將政企AI大模型的落地方式瞄準了私有化。

二、私有化,會是一個好的選擇嗎?

“全面禁止使用ChatGPT”這句話時不時就會喜提科技榜熱搜,最近一次的主角是三星。

具體源于三星允許半導體部門的工程師使用ChatGPT參與修復源代碼問題。 但在過程當中,員工們輸入了機密數據,包括新程序的源代碼本體、與硬件相關的內部會議記錄等數據。

起初三星全面禁止使用ChatGPT,自3月11日開始才部分開放給DS部門使用,卻沒想到在短短時間內就傳出機密外泄。

諸如此類機密數據泄漏事件,層出不窮。

在海外市場,蘋果、三星、摩根大通、花旗銀行等知名企業都曾明確表示,禁止或限制員工在工作場合使用ChatGPT等大模型產品。

事實上,大模型的底層邏輯是將行業數據標注出來進行深度學習,訓練出專注于某一行業的垂直模型。這也意味著,企業的數據要集成到通用大模型的數據池中。

然而,政企的數據大多涉及商業機密、個人隱私等問題,對數據安全要求甚高。

所以,數據不出域,成為關鍵。而私有大模型無疑是政企的必選項。

不過,私有化意味著需要政企客戶自己收集數據進行訓練。一般情況下,AI決策的及時性和準確性,取決于數據質量、數量以及算力。這意味著輸入預訓練模型的數據維度、數量越多,質量越高,才能真正發揮大模型真正價值。

一個有爭議的點是,專業廠商打造的私有模型,比起通用大模型的能力,能否滿足政企需求。

3月30日,彭博社創始人布隆伯格發布了一片論文,即BloombergGPT: A Large Language Model for Finance。

在論文中,介紹了其以模3630億token的金融領域數據集以及3450億token的通用數據集訓練出來的金融大語言模型。并進行金融領域評估與通用領域評估。

結果顯示,在金融領域任務上,該模型綜合表現最好;在通用任務上,該模型的綜合得分同樣優于相同參數量級的其他模型,并且在某些任務上的得分要高于參數量更大的模型。

這意味著,基于專業領域語料訓練的大模型,在領域內的理解要超過通用大模型。

一個啟示是,在其他特定領域,也可以開發專用的大語言模型,并且效果可能比通用大模型更好。

然而,這個評估實驗的結論仍無法代表所有行業,有些問題仍需要被正視,例如中外金融數據維度、質量其實有著較大的差距,該金融模型作為第一個行業模型,更換不同維度、質量的數據,能否保持其結論的準確性,還未得知。

另外,除政務系統、城市大腦以及金融等數據敏感的政企場景,其他終端場景,通用大模型的語料數據仍有很大優勢。

所以,對于政企而言,其需要的AI服務是能在保證數據安全的同時,還可以能集成通用大模型作為能力補充。

三、政企大模型,亦需“群戰”

術業有專攻,大模型能力同樣如此。

在政務AI大模型應用方面,周鴻祎曾直言,預測未來中國不會只有一個大模型,每個城市、每個政府部門都會有自己的專有大模型。

信創化的浪潮下,全技術棧的國產化已經成為服務政企客戶的準入門檻。所以對于政企而言,信創生態能力成為其選擇廠商的重要標準。

目前來看,能實現全技術棧國產化的AI大模型廠商屈指可數。能否吸引更多信創伙伴成為關鍵,取長補短,或將實現雙贏。

此外,在國產化的基礎上,不同的場景應用,也需要與不同的廠商合作,例如互聯網云廠商在終端軟件應用的優勢;運營商的網絡優勢;華為在芯片、系統上的優勢。

除了基于客戶需求的合作,還有來自算力等資源稀缺所帶來的壓力。

AI新一輪熱潮襲來,服務器需要配備大量GPU/NPU/FPGA/ASIC等芯片以支持高算力,但就目前來看,算力不僅價格高昂且資源緊張。

目前,支撐包括ChatGPT大模型在內的95%用于機器學習的芯片都是英偉達的A100(或者國內使用的替代產品A800),該芯片的單價超過1萬美元。此外,英偉達最新一代的H100芯片的性能也遠超A100,但價格也更高,約合25萬元人民幣。

而在取長補短的AI大模型產業生態下,將大幅度杜絕模型的重復搭建、實現數據的重復利用,大大節約算力資源利用率。同時還可以減少政企客戶的AI部署成本。

所以,對于布局政企大模型的廠商而言,在私有化的前提下,通過開源、API接口等形式,以通用大模型和客戶或自身集成的數據,幫助客戶調教模型,形成定制化的AI產品,或將推動政企大模型快速落地。

一些廠商也正在驗證了這種路徑的可行性。

例如中國電科面向黨政企,提供“通用智能模型大循環 + 行業智能模型小循環”雙循環、“模型訓練 + 測試評估 + 場景精調 + 可信增強”四階段的行業應用新范式。

再比如,新華三面向政企發布的百業靈犀LinSeer既支持“私域大模型+新華三ICT基礎架構”的模式保障數據安全,也支持“客戶自選大模型+新華三ICT基礎架構”的模式滿足多種需求。

政企AI服務的走向逐漸清晰,即政企或許更需要“自助餐”式的服務模式??蛻艨梢赃x擇適合自身需求的芯片、模型技術方、數據集成方、軟件廠商等。

經歷過多次寒冬的AI,能否抓住這次時代的機遇,仍需時間來驗證。

作者:斗斗;編輯:皮爺?

來源公眾號:產業家(ID:chanyejiawang),專注深度產業互聯網內容

本文由人人都是產品經理合作媒體 @產業家 授權發布,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!