國產大模型的100種可能
最近一段時間,市場上有關AI大模型的消息頻頻傳出,一眾國產大模型瘋狂涌現,科技企業與創業者們都想抓住這個風口,找到更多增量空間。那么在未來,國產大模型擁有哪些發展可能?一起來看看作者的分析與解讀。
4月以來,市場幾乎每天都有各種國產大模型的新信息,一眾科技大廠、創業公司陸續公布相關進展,加速入場。
爭相涌現的國產大模型,特別是科技大廠基于投入、算力、大數據等方面的優勢,為中國自主大模型的發展帶來了廣泛的可能性。
事實上,BTA、華為等大廠在該領域早有研發,并非新入局者。之所以在ChatGPT“教育全社會”前“隱而不發”,一是各家的核心業務不同,AI研發的側重點也有所不同。二是正如阿里云周靖人所言,在ChatGPT出現前講“預訓練大模型”,沒有人會感興趣。
當下,有人在琢磨如何快速推出自己的國產大模型搶占市場,也有人在以算力為代表的底層基礎設施層發力。更有人直言,相比于“神仙打架”,更關心國產大模型怎么落地應用,看看這個先進生產力工具究竟如何改變產業與生活方式,以及能否實現超越,由追隨到引領?
關于“與OpenAI差距”的討論也從未停止,如李彥宏的“2、3個月”,王小川的“不會低于兩年”,時間定義雖不同,但均表明了其并沒有領先到難以追趕的程度。
大戲,才剛剛啟幕。
一、“iPhone時刻”與增量市場
“超越”不是偽命題,在中美科技競爭、市場隔離的背景下,中國科技產業需要自己的“iPhone時刻”。
人工智能則是最有希望誕生這一時刻的領域:在過去十余年間,AI進步由中美主導,投入也最巨大,因此機會主要也在中美之間。
Open AI的成功,無疑強化了這一觀點,并給所有中國科技企業帶來了一劑強心針,照著這個路徑去做生成式AI,是能夠走通的——這樣即能保證“革命性技術”誕生時離其最近,也能率先進入“增量”市場。
這是在科技行業低迷的當下,一個難得的增量空間。如果能取得先發優勢,就有可能開辟巨大的新市場,或給已有業務,如云計算、電商、游戲、社交、搜索乃至B端的千行百業加上“放大器”。
大模型不僅是聊天軟件,更是生產力工具,已是共識。
在阿里云峰會上,張勇稱所有產品未來都將接入通義千問大模型,進行全面改造;劉熾平在騰訊財報會上強調,生成式AI可成為已有業務的 “倍增器”,也可幫助開拓新增長線;任正非更是認為,ChatGPT 把計算、管道流量撐大,華為產品就有了機會。
其中的邏輯是,AI是數字化時代的“操作系統”,就像移動互聯網時代的IOS和安卓,加速促進了產業數字化的發展,對生產、生活方式進行下一次重塑,帶來更大空間的新領域,而大模型是整個AI產業鏈中,核心中的核心。
從長遠看,如果不能取得先機,未來就有可能會影響現有的整個商業模式,甚至被顛覆。
如周鴻祎在4月21日發出內部信,要求360全員擁抱人工智能,稱“已領先一個身位”。近期接受采訪時也表示,國內“搜索引擎百度市占率60%,公司30%”,強調“在戰略上對標微軟,搜索上踐行必應”,改寫格局的企圖心強烈。
百度反應更為激進,做出了全球第一個對標ChatGPT的文心一言。另據晚點財經報道,在文心一言內測前,李彥宏每晚和項目團隊開會,他們為籌備產品甚至一度睡在公司。
中信建投的一份“會議紀要”也顯示,過去幾個月他們調研了很多一線互聯網公司,得到一個非常一致的結論:這次是全面的一把手工程,不管是BAT還是字節、華為,均是創始人親自督戰,對大模型團隊全力支持。上一次出現如此情景,還是2009年移動互聯網來臨的時候。
中信建投因此認為:未來6-12個月的AI行業會很卷,但也很精彩,各家模型的登場才剛剛開始。
但僅是“開始”,當下國內大模型超過萬億參數的,就有阿里的M6、騰訊的混元、智源研究院的悟道2.0,華為的盤古Σ,千億以上的也有近十個。
從發布時間看,百度、阿里、騰訊、華為等一線科技大廠,在ChatGPT熱潮前均已推出過大模型。
百度的ERNIE 1.0于2019年推出,即后來的文心大模型,目前更新到 3.0 版本;阿里在2021年發布語言大模型 AliceMind和多模態大模型 M6,去年9月合并為通義大模型。
騰訊在2022年6月發布混元大模型,目前更新至 2.0 版本。微信去年 10 月也發布了大模型 WeML;華為盤古大模型于2021年4月發布,后續發布了NLP、CV、多模態等多個大模型。
這些都說明,中國科技企業有技術和能力推動一場大模型的變局,當然,差距和阻力也依然客觀存在。
二、國產大模型需要“新想法”
李彥宏在文心一言發布后曾說,百度有信心在綜合能力上,迅速追上甚至超過 ChatGPT。
這可能不是百度盲目自信,今天的大模型就像一場剛剛開跑的馬拉松,“你追我趕”是必然階段?,F在Open AI領跑,也許明天谷歌就會趕上來,但也有可能是阿里、騰訊、華為實現彎道超車。
科技行業不同于其他行業的魅力所在之處在于,每一輪科技創新都是由大的確定性和小的不確定性構成,帶有偶然性,并不是簡單的強因果關系。
但略顯遺憾的是,目前多數中國科技公司在做的大模型,包括百度和阿里在算法方面和GPT-3架構基本類似,都是基于谷歌的Transformer,其他方面也是追隨OpenAI的腳步實踐,在迭代速度不如人的情況下,反而差距越拉越大。
李彥宏曾明言,百度“文心一言”在研發階段時曾與ChatGPT進行對比測試,當時差距是一個月能追得上。可過了一個月再次測試后,發現差距反而拉大了。
阿里云周靖人也坦承,目前通義千問與ChatGPT仍有差距,“GPT還是屬于各方面都領先的地位”。
更為關鍵的是,ChatGPT“暴力美學”式大模型路徑可能走到了盡頭。
近日OpenAI首席執行官山姆·奧特曼公開表示,“大語言模型規模已接近極限”,“我認為我們正處于巨型模型時代的末尾,目前尚不清楚未來的進步究竟來自何處”。他同時否認了GPT-5的存在,“而且一段時間內也不會有”。
自ChatGPT推出以來,競爭對手眾多。
如馬斯克已經確認自建 AI 聊天機器人TruthGPT與之硬杠,亞馬遜也大力投資生成式AI,谷歌大腦合并DeepMind聯手追趕等等,還有大批初創公司正在構建更大算法。此外,歐洲各國正在禁用或擬禁用ChatGPT。
因此尚不清楚山姆·奧特曼出于何種考量做此表態,但也不排除巨型AI模型時代可能正在結束。這意味著大模型進化的“下一步”需要再次“另辟蹊徑”,尤其是國產大模型更需要有“新想法”。
目前生成式AI的應用在文本領域相對成熟,從海外已落地或處于 Demo階段的應用案例來看,在代碼、圖片、視頻、游戲等領域,海外均有所創新。
但中國顯然有更廣闊的市場及更豐富的應用場景,這也是中國科技公司天然的本土優勢:從toC走向toB。
有很多科技公司的從業人士認為,中國的大模型之路應該與美國市場不同。他們更認可一種“兩條腿走路”的方式,即一邊做大模型基礎平臺開發,一邊直接瞄準垂直的行業場景落地,實現大模型與場景化的兩翼齊飛。
這樣既能持續獲得更多更豐富的各個行業里“好的原材料”(數據),也使更多的研發人員有機會深入到一線,用大模型去解決實際問題(應用場景),從而在工程化、產品化、場景化上不斷迭代,最終與技術底座形成飛輪效應,走向商業化的正循環。
如華為盤古大模型強調在礦山、電力等場景的應用,騰訊CV(計算機視覺)大模型在工業質檢、醫療影像等領域的落地,及諸多AI創業公司深耕垂直行業,都是出于此等考量。
從中長期來看,AI大模型也一定會加速滲透到更多toB的場景,比如汽車、工業(制造業)、航天航空衛星、能源、生物制藥等領域,這也是中國數字化發展的主線。
三、“AI+一切”之數字經濟
2018年時,華為有個“達芬奇”計劃,旨在將AI添加到一切產品和服務中,也可以理解為“AI+一切”。其中最首要的一步,就是開發AI芯片,挑戰英偉達。
那一年,從產業革命,技術創新的周期視角下來看,應該是數字化和智能化的開端,數據、算力、算法都迎來大爆發,更是新一輪硬件終端智能化趨勢的起點,比如汽車、穿戴設備、智能家居等等物聯網終端,至今全球已經有接近1000億的Iot智能終端實時在線。
但是,并沒有數字化時代現象級的應用誕生,不管是自動駕駛還是VR、AR、智能家居、工業互聯網乃至元宇宙,過去幾年落地都不及預期。
中國也沒有誕生自己的英偉達,美國卻又增加了OpenAI這個AI新標桿。這說明,科技領域永遠沒有屬于追隨者的時代。
而大模型之所以形成全球共振效應,因為它可能是全面加速數字化應用落地的超級工具,這是一個全新的節點:大模型更多是一個工程上的突破而非技術突破,一旦商業模式確認,各行各業的落地速度會比過往快很多,這也是越來越多的企業急速涌入的根本性原因。
所以在全新節點下,4月18日釘釘全面接入“通義千問”,這意味著阿里大模型正式面向B端客戶。此前在阿里云峰會上,張勇曾強調,“面對AI時代,所有產品都值得用大模型重做一次”。
“AI+一切”的野望始終都在,這為國產大模型的未來帶來了何止100種的可能性。而釘釘最想實現的一個可能“是成為超級APP”,釘釘總裁葉軍如此說。
但在理論上,百度、阿里、騰訊、華為、字節憑借各自的歷史積累,都有可能成為“AI+一切”的贏家,而不是先做的就一定比后做的好。
目前從不同渠道流出的消息顯示,4月份華為會發布自己的模型,8月份騰訊大模型要出來;字節版的ChatGPT已在內測,但內測之后體驗效果不好預計在9月上線。
不過決定最終誰能跑出來,一定是先“卷”一輪。
從中國經濟發展的歷史來看,無論是家電、新能源車還是電商、短視頻直播行業,“內戰必先于外戰”,但“外戰優于內戰”。
大模型之戰應該也遵循這個路徑,很多小模型或者小場景的商業閉環會被大模型“吃”掉。而大模型一旦成功,會是萬億市值規模的巨大空間,當然最后跑出來的也可能是兩、三個大模型。
屆時,不但會產生中國的“OpenAI”,中國的“英偉達”也會有,底層框架更會有。
因為中國大模型只有構建在國產技術底座上,每一層都實現自主可控,才有可能縱深地做持續閉環優化,這就跟芯片及再上層的芯片先進制程都要實現“自主”是一個道理。
那時國產大模型實現超越,切實可期。
但AI從來不只是技術、算力、人才的角逐,更是國家戰略的角力。4月份以來,網信辦發布了《生成式人工智能服務管理辦法(征求意見稿)》,科技部發起成立“國家超算互聯網聯合體”,及從去年到現在出臺的一系列有關數字經濟、數據要素相關政策,都表明了國家的關切與肯定。
也就是說,相對海外對大模型發展的矛盾態度,中國對整個數字經濟及人工智能的發展,是持一貫的支持態度,這為中國大模型的未來,加上了一個至關重要的確定性。
作者:南北
來源公眾號:明晰野望(ID:MXYW-1688),銳眼看財經野望大市場
本文由人人都是產品經理合作媒體 @明晰野望 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!