AI大模型,駛向產業何方?
今天開年以來,ChatGPT的火爆出圈讓更多人感受到了AI人工智能實際的發展情形,不少人也在想,AI的時代浪潮是否真的來臨了,畢竟國內許多大廠已經開始在相關領域加強了投入。那么目前,AI如果想實現規?;涞?,將面臨怎樣的挑戰?目前國內AI大模型的成長發育,是否已經相對完善?
“AI炒了那么多年,第一次感覺它真的要來了。”國內某論壇中,帶有ChatGPT的詞條下,幾乎都會出現一句類似的表述。
ChatGPT是美國人工智能研究實驗室OpenAI基于AI大模型打造的一款智能問答工具,用戶只需在ChatGPT網站頁面的對話框中輸入問題并點擊確認,便可以得到答案。
就是這么一個智能問答工具,在過去的兩周內,以各種形式席卷全球各大社區、論壇,占據各大新聞頭版頭條。
不同于過去“AI革命”中,專屬于相關企業與技術人員的搖旗吶喊、獨自狂歡。這次將AI推向風口的卻是C端用戶,這使得ChatGPT實現了快速“出圈”。
一組數據是,ChatGPT今年1月的月活躍用戶數已達1億,成為歷史上用戶增長最快的消費應用。國外一家提供就業服務的平臺對1000家企業進行了調查。結果顯示,近50%的企業表示,已經在使用ChatGPT,30%表示有計劃使用。
國外科技巨頭也紛紛開始布局,例如曾all in元宇宙的Meta發布了新的大模型系列 —— LLaMA;微軟公司宣布ChatGPT將與旗下瀏覽器融合;谷歌宣布發布“Bard”AI聊天機器人服務。
ChatGPT帶來的熱潮,同時也涌向了國內市場。
較為明顯的是,百度、騰訊、阿里等紛紛開始布局具體應用。其中,百度宣布將基于文心大模型推出“文心一言”后,400多家公司相繼宣布接入,一度將其港股股價拉高超12%。
另外,在過去的兩周內,諸多以AI大模型為技術底層的廠商,開始獲得資本的青睞。
例如,致力于企業創新數智化平臺的銜遠科技完成數億元(人民幣)天使輪融資;致力于對話機器人行業解決方案的竹間智能完成D+輪融資;醫療交互AI平臺聆心智能完成Pre-A輪融資。
更有已退休兩年的前美團聯合創始人王慧文,在其朋友圈公開招納技術人才,助其打造“中國版OpenAI;快手前AI核心人物李巖創業投身AI大模型賽道。
而在學術界,復旦大學自然語言處理實驗室,發布了國內首個類ChatGPT模型MOSS,公開平臺邀公眾參與內測后,數萬名用戶申請參與內測。
站在底層技術角度來看,從科技巨頭到互聯網大廠,從創業屆到學術屆,AI大模型正在成為各方搶灘市場的關鍵。
事實上,AI大模型本質上是通過數據的訓練,進行歸集和表達。這意味著,如果對不同的數據進行訓練,便可以產生不同的模型。拿OpenAI來說,其就是基于底層大模型打造了“對話機器人”ChatGPT。除此之外,其還基于底層大模型打造了Dall-E“繪畫機器人”。
過去多年的一個市場共識是,如果要實現AI規?;a業落地,底層AI大模型就必須是一個通用的大模型平臺,廠商根據用戶需求在平臺之上,進行多場景、多領域的模型生產,從而實現具體行業模型的落地。
對一眾廠商而言,這也是一個新的方向。即AI廠商以“通用模型+產業模型”不斷賦能企業、產業,從而加速中國的產業數字化進程。更為重要的是,這種模式一旦落地成功或將快速實現規?;?,或將為頭部AI廠商帶來高回報,擺脫當下AI技術落地難,盈利難的現狀。
那么,AI大模型現在在國內產業側的成長如何?
一、看見AI大模型
“丫丫意識上傳550W后1.7秒月球危機就發生了?!边@是電影《流浪地球2》中的一句臺詞。
這個情節背后隱藏的是,超級AI大模型下的超級智能決策。
在電影的人物設定中,馬兆、圖恒宇都是550系列智能量子計算機的研究員。圖恒宇是為了留住在車禍中去世的女兒圖丫丫,將其“意識”植入初代智能量子計算機550A升級版550C中,試圖迭代出“數字人丫丫”,但由于算力問題,不能處理過多的數據,導致“數字人丫丫”只能迭代出2分鐘的生命。
月球危機下,圖恒宇看到了550C的升級版550W,其超強算力可以讓丫丫“活得更久”。于是圖恒宇偷偷將丫丫的意識植入550W。
但在植入丫丫意識的1.7秒后,計算機開始超負荷運行,這意味著,無法啟動地球上的發動機,“流浪地球”計劃失敗,地球毀滅。
一個決定性的轉機在電影結尾,圖恒宇在臨死前將自己的“意識”植入了550W,使得其算力正常運行,點燃了發動機。
其實,在550W量子計算機的超強算力下,AI大模型不斷的計算、學習、訓練,讓原本負責管理空間站的AI系統迭代出自主意識,并為自己取名MOSS。
由于其AI系統的設定便是堅定執行延續人類文明的使命,所以當丫丫的意識植入大模型時,在550W超強算力加持下,極端理性的人工智能遇到了感性的丫丫,MOSS實現了新的進化,感受到了人性的惡,推算出毀滅即拯救,這也就導致了MOSS制造出計算機負荷運載的假象,試圖毀滅地球。
但當圖恒宇的意識的植入大模型后,使得MOSS學習到圖恒宇與丫丫之間的愛與和平,訓練出新的意識形態,即拯救人類。
從某種意義上來說,MOSS最后拯救人類,就是“理想AI大模型”下帶來的智能決策。
實現路徑可以概括為,基于大量的數據集,進行學習、訓練之后,在空間站管理場景中,利用550w量子計算機的算力,將空間站場景數據植入,進行二次訓練,就可以滿足空間站的場景需求,MOSS就是這種需求下的產物。
場景數據喂養后實現二次訓練的模型也可以稱之為場景模型。而當丫丫、圖恒宇意識,即具體場景任務、行為數據植入場景模型中時,便可以給出具體智能決策。
這也是AI大模型規模化落地的一種路徑。
“中國科幻需要現實意義。”在劉慈欣看來,流浪地球的故事設定與現實科技發展存在著許多共性。
事實上,ChatGPT產業圖譜中,主要價值點有三層。一是開篇提到的ChatGPT應用程序,將AI模型集成進面向用戶的應用軟件,它們或運行著自己的模型(端到端應用),或依賴于三方模型的API。目前來看,雖然這類應用公司的營收增長得非???,但在留存率、產品差異化和毛利率上卻容易遇到瓶頸。
二是基礎設施提供商,如云廠商或硬件制造商,它們負載著生成式AI模型的訓練和推理。這類廠商贏面較大,將賺取了流經技術棧的大部分資金。以生成式AI為例,有業內人士預測,其總營收的10%~20%將流向云服務提供商。但有這種能力的廠商屈指可數,門檻高,頭部效應明顯,競爭空間極其有限。
三就是我們重點提到的模型提供商,致力于打造驅動AI產品的底層大模型,它們要么以專有API的形式提供,要么開源提供。但絕大多數大模型廠商都還沒有實現大規模的商業化,屬于一片還未真正打開的戰場,彎道超車機會很大。
值得注意的是,在整個AI規?;涞亓鞒讨校顝碗s的環節就是底層AI大模型的搭建。但這恰恰給AI大模型廠商帶來了新的機會。
換言之,想要 實現AI大模型規?;漠a業落地,首先需要將整個落地路徑“簡化”。讓AI變得“人人可用”,同時也要滿足具體場景、領域的個性化需求。
二、通用大模型+產業模型
底層AI大模型的研發具有數據規模大、質量參差不齊、模型體積大、訓練難度高、算力規模大、性能要求高等挑戰。這樣的高研發門檻,不利于人工智能技術在千行百業的推廣。
而具有數據、算力、算法綜合優勢的企業可以將模型的復雜生產過程封裝起來,通過低門檻、高效率的生產平臺,向千行百業提供大模型服務。
各個行業的企業只需要通過生產平臺提出在實際AI應用中的具體需求,生產大模型的少數企業就能夠根據應用場景進一步對大模型開發訓練,幫助應用方實現大模型的精調,以達到各行業對于AI模型的直接應用。
彼時,AI大模型就會真正意義上實現產業化,成為產業模型。
目前,國內布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業,正在不斷夯實通用大模型,打造產業模型,助力AI大模型產業化。
其中,百度以文心大模型+飛槳PaddlePaddle深度學習平臺;騰訊以hun yuan大模型+太極機器學習平臺;阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了(自然語言處理)大模型 、(計算機視覺)大模型以及多模態大模型方面。
可以發現,主要參與者大多是云廠商,正如上文所言,云基礎設施很有可能是AI大模型這盤棋,最終的最大獲益者。所以,大模型也成了云廠商“的必爭之地”
值得注意的是,各個廠商AI大模型的布局,有所差異。
百度由于多年在AI領域的深耕,其文心大模型涵蓋基礎大模型、任務大模型、行業大模型的三級體系,打造大模型總量約40個,產業應用也較為廣泛,例如電力、燃氣、金融、航天等,構建了國內業界較大的產業大模型。
目前來看,屬于國內大模型廠商的第一梯隊中的佼佼者。
騰訊產業化應用方向則主要是騰訊自身生態的降本增效,其中廣告類應用表現出色。
阿里更重技術,例如M6大模型基于阿里云、達摩院打造的硬件優勢,可將大模型所需算力壓縮到極致;另外其底層技術優勢還有利于構建AI的統一底層。
目前,主要應用方向是為下游任務提質增效,例如在淘寶服飾類搜索場景中實現了以文搜圖的跨模態搜索。
華為的優勢則在于其訓練出業界首個2000 億參數以中文為核心的預訓練生成語言模型。目前發布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項較為重磅的行業大模型。
可以發現,在商業模式上各個廠商都是通用大模型路徑,在通用大模型架構之上,搭建具體行業模型。映射到產業層面,即“通用大模型+產業模型”的路徑。
但具體的產業化應用有著較為明顯的差異。其實,這與各個廠商喂養的數據有著極大地關系。例如華為的優勢在G端,相對應其在氣象、煤礦等央國企領域有大量服務經驗與數據,在數據的計算、學習、訓練下,更容易打造該產業的大模型。
然而,手握入場券,并不代表能跑到終點。
對于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產業模型到具體場景的應用,并不意味著其可以打造出有真正價值的智能決策。
AI大模型產業化落地的瓶頸需要被正視。
三、“智商”堪憂
如果將產業模型看成一個公式:2×π+N=?
其中,公式“2×π=6.28318530718……”就是底層通用大模型,“N”則象征著具體場景的數據。公式“2×π+N=?”就是植入具體場景、領域數據后的產業模型。
在這個公式中,不難發現的是,π小數點后的數字越精確,得出的結果就越精確,最后產業模型下的智能決策也就越精確,相對應的計算難度也就越大。另外“N”作為一個變量,需要收集場景下大量有價值的數據。
顯然,計算能力和數據集成,是AI最終做出有價值的智能決策的關鍵,即AI大模型產業化落地的關鍵。
對于國內的AI大模型廠商而言,這不是一件容易的事情。
1. 計算能力
在提升計算能力方面,首先比起一個人,100個人計算的效率會更高,所以計算人力數量是關鍵,人力數量對應的則是芯片的數量;其次,計算器比紙算會更快,而Excel又比計算器效率更高,所以計算工具的性能改進也是關鍵,對應的則是芯片的性能。AI大模型需要在大量、高性能的芯片加持下,不斷的進行模型訓練,才能更加精準。
目前,英偉達推出的A100/H100是目前性能最 強的數據中心專用GPU。 且市面上幾乎沒有可規模替代的方案。 包括特斯拉、Facebook在內的企業,都利用A100芯片組建了AI計算集群。
根據市場研究顧問公司Compass Intelligence發布的AI芯片最新調研報告,全球前5大人工智能(AI)芯片企業排名依次為NVIDIA英偉達、Intel英特爾、IBM、Google、蘋果。
在性能方面,英偉達是AI大模型芯片選擇的第一順位。
值得注意的是,據國盛證券報告《ChatGPT 需要多少算力》估算,以 ChatGPT在 1 月的獨立訪客平均數 1300 萬計算,其對應芯片需求為 3 萬多片英偉達 A100 GPU。從全球GPU的飽有量來看,擁有一萬顆GPU儲備的企業屈指可數。
即使有貨,但受困于美國對英偉達GPU產品A100和H100出口限制,目前也很難買到。
針對這一問題,英偉達為了留住難以割舍的中國市場,推出了A100的替代A800。這是國內廠商目前能買到的替代品。
但根據芯片經銷商OMNISKY容天官網信息顯示,英偉達A800GPU數據傳輸速率為每秒400GB,傳輸速率有所下降。英偉達A100GPU傳輸速率為每秒600GB。A800數據傳輸速度降低了30%,性能明顯不高。
還有,訓練通用大模型十分燒錢。據國盛證券報告《ChatGPT 需要多少算力》估算,GPT-3 訓練一次的成本約為 140 萬美元,對于一些更大的 LLM(大型語言模型),訓練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT ?3 萬多片 A100的采購量來算,初始投入成本約為 8 億美元,每日電費在 5 萬美元左右。
站在更大的層面看,如果要實現AI大模型最終的產業化落地,其成本將會高達幾十億甚至上百億。
根據New Street Research 的一項估計發現,Bing搜索中基于OpenAI的ChatGPT模型可能需要8個GPU才能在不到一秒的時間內響應問題。
按照這個速度,微軟將需要超過20,000臺8-GPU服務器才能將Bing中的模型部署給每個人,這表明微軟的功能可能需要40億美元的基礎設施支出。
燒錢、買不到大量高性能的AI芯片,制約著國內AI大模型的計算能力。
2. 數據集成管理
中外數據質量有著巨大差異性。
IDC在一項有關“中國數據集成與數據質量市場”調查的白皮書中指出,大部分中國企業數據集成項目難以達到預期的原因在于數據質量問題。
從市場發展環境方面,可以看到的一些問題是。國內企業IT系統大量建設,數據環境較為復雜,造成數據的重復、不一致、格式混亂等問題。這些低質量的數據,即便在完成數據集成之后,得出的也可能是質量不高的信息。
一組數據是,72%的接受調查的中國企業存在重復數據,60%的企業存在不完整數據。
另外,國內企業普遍存在跨系統利用數據、系統間數據傳遞不及時、以及業務指標理解不一致也使得數據質量出現問題。
“如果是靜態數據,則要求完整、準確、一致,格式規范;如果是動態數據,則要求能被及時調用,快速更新?!痹贗DC中國高級分析師劉飛認為,這是衡量數據質量好壞標準。
然而,在國內由于企業數字化程度較低,甚至許多企業停留在最原始的信息化階段,導致標準化、規范化程度較低,集成管理困難。而在歐美,企業標準化程度高,相對應的數據也較為標準化,數據質量高。
數據挖掘方面,挖掘程度不同,一般國外把數據挖掘技術應用于各個行業產業的過程中,建立不同的數據挖掘模型。國內主要應用于各個行業儲層評價、施工方式的選擇、生產指標的預測以及各個行業系統的診斷。另外,國內多專于橫截面式的數據分析。國外更注重同一批樣本量的縱向比較和追蹤研究。
在數據研究方面。由于國外注重數據研究的意識,國外數據治理研究主要集中在理論探索、模型框架以及實踐應用三個方面; 國內相比之下,技術研發的探索能力較弱一些,所以側重于理論分析尚且缺乏模型與框架等應用研究。
在數據共享方面。國外許多國家都有很多大型的科學數據共享平臺,特別是英國、美國,并且許多平臺都對自己的數據有一定的質量要求。且國外企業之間也有著良好的數據生態。
目前國內的數據共享平臺發展還不夠成熟,國內主要的數據平臺是中科院科學數據共享工程中開發的多個學科數據共享平臺。且企業之間數據生態并沒有像國外那么開放。
較為混亂的數據環境、缺乏數據深度和整體性研究以及數據生態的不成熟等問題,使得國內產業數據在質量、數量上普遍存在一些問題,導致場景無法真正實現數字化,且在短時間內,無法通過技術、管理手段迅速改善。比起歐美國家,仍有很長一段路要走。
總結來看,以目前國內AI大模型的計算能力以及數據集成管理能力,其最后產業化落地的智能預測很有可能價值點較低。即使做出語音交互機器人,可能也并不“聰明”。
但即使是這樣,我們仍需看到AI 大模型對中國產業發展的巨大意義。
四、在中國,談論AI模型的必要性
“以數據為關鍵要素,以價值釋放為核心,以數據賦能為主線,對產業鏈上下游的全要素數字化升級、轉型和再造的過程”這是產業數字化的官方定義。
簡單來說,產業數字化的前提就是讓數據從資源化奔向資產化。
好比煤炭、石油、天然氣等,只有少量存儲則不可能被稱做資源,只有在規模足夠大,具有使用價值之后,才會被稱做資源。
后期則需要對其進行開采和加工,自然需要組織、制度、流程等來保證工作的有序運轉,并使資源轉化為資產。這時,煤炭、石油、天然氣的價值才能釋放出來。
數據資源也是同樣的道理。當數據資源達到一定規模,就需要組織對其進行開發和利用,成為數據資產,釋放其價值。
在當下的大數據時代,企業愈發重視數據的采集,這其中不乏一些企業擁有龐大且豐富的數據集。然而,國內企業大規模數據的開發和利用的鏈路十分復雜,普遍面臨數據“用不起來”和“用不好”的問題。
但AI大模型本身對應的就是數據的高度歸集和表達,其就像一條快速通道,高度歸集代表入口,表達則是出口,讓數據從生產到消費的路徑變得簡單,數據可以便捷、快速地進行開發和利用,釋放數據的價值。
加之,在AI大模型+產業模型下,大模型可以實現具體場景、領域數據的學習、訓練。所以在產業具體場景下的數據將更有價值,即更加貼合場景需求,可以直擊場景痛點。
可以預見,隨著產業模型的落地,將使得企業數據價值得到最大釋放,實現企業數字化轉型、再造,加速產業數字化滲透,推動產業數字化歷程。
另外,AI大模型的隨著時間的推移,廠商的利潤將越來越高。
根據相關機構預測,至2030年為止,AI訓練成本將持續以每年70%的速度降低。
舉例來說,要將一款大型語言模型訓練至GPT-3 (Generative Pre-trAIned Transformer 3,生成型預訓練變換模型-3)等級,2020年得花費近460萬美元,2022年驟降至45萬美元,成本節約近90%。
這對于以往落地難、盈利難的AI廠商而言,無疑是一塊巨大的蛋糕??梢姡诮洜I者,于使用者,于產業發展,AI大模型的布局極其重要。
除此之外,在國家層面,AI大模型在今年兩會上亦被提上了新高度。
“ChatGPT之所以引起關注,在于它是一個大模型,對應大數據、強計算、好算法。踢足球都是盤帶、射門,但要做到梅西那么好也不容易……要達到ChatGPT的效果,可能還有工作要做?!?/p>
科技部部長王志剛希望國內的科研院所、企業、廣大科研人員能有進一步發展和進步。
而這是他第二次談及AI大模型。
總體來看,AI大模型已然成為各個國家、企業發展的戰略要地。已經到了不得不重視的地步。
寫在最后
回歸技術本質來看,ChatGPT不是一個新鮮的事物,AI大模型更不是一個突破性的技術,但ChatGPT卻讓其實現了現象級的爆發,在當下AI大模型風口下,我們是否應該思考一些更加深刻的問題,除了軟硬件、技術,中國式AI到底缺少什么?或許這才是問題的根源。
技術更迭,已不是壁壘,國產式AI需要的是產品的創新思維,以及對需求的產品變現能力。這種亟需具備的特質,適用于所有領域。
作者:斗斗
來源公眾號:產業家(ID:chanyejiawang),專注深度產業互聯網內容
本文由人人都是產品經理合作媒體 @產業家 授權發布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!