大模型混戰背后:科技“食物鏈”頂端是否會出現新霸主?

0 評論 2951 瀏覽 1 收藏 20 分鐘

ChatGPT 的發布,讓人工智能掀起了一波浪潮,與此同時,國內互聯網大廠開啟新一階段的考驗。那么,國內的人工智能將會往哪條路發展呢?讓我們跟隨作者一起了解吧~

如果說,現在的我們正處于一個巨大的軟件互聯網生態系統中。那么,未來我們或許會進入一個巨大的人工智能互聯網生態系統。

從谷歌的阿爾法狗到 Open AI的 ChatGPT,人工智能掀起了一波新的狂歡,國內的互聯網科技圈的“顛覆”暗潮也在不斷涌動。新誕生的 AI 大模型越來越多,“參戰”AI 大模型的玩家也有些數不過來。

據天眼查 APP 顯示,截至目前,人工智能相關企業近 267.4 萬余家。其中,2023 年一季度新增注冊企業17萬余家,與 2022 年同期相比,上漲 6.8% 。

企業以雷霆之勢迅速入局,競爭烈度已經到了以“天”為時間單位的地步。這一奇景背后,行業已經展露出初步的崢嶸頭角,對當下“諸神之戰”判斷和洞察就顯得尤為重要。

一、AI 大模型:雛形初顯,格局崢嶸

實際上,人工智能已經經歷了多次風口以及寒冬的“輪回”。

在人工智能元年 1956 年,出現了機器定理證明、跳棋程序等一批令人矚目的研究成果;1970 年,出現了能夠分析語義、理解語言的人機對話系統 SHRDLU;1997 年,深藍 DeepBlue 戰勝國際象棋世界冠軍卡斯帕羅夫;2016 年,谷歌阿爾法狗與世界圍棋冠軍李世石“人機大戰”,被寫入歷史…

每一次人工智能的高潮,都在推動人工智能崛起的到來,但往往不久后,又會陷入一段時間的冷寂之中。

不可否認的是,在多次周期之后,人工智能已經開始實現從技術研發向成果轉化的目標。從不能用突破到不好用,再從不好用突破到可以用,我們似乎離人工智能的終點只有一步之遙。

本質上來說,此次大模型“諸神之戰”中的各位玩家,也是在瘋狂預判人工智能這場馬拉松的下一個突破節點。盡管爆發時間尚短,但可以發現,目前國內的大模型格局雛形已經初步顯露。

如果按目前發展趨勢,國內大模型玩家大致可以劃分為這么幾派:

1. 巨頭派

首先是以百度、阿里為代表的的“巨頭派”。巨頭入場,但不再是“清場”。

被稱為中國版ChatGPT的百度“文心一言”早已極速發布。百度展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

阿里云旗下大模型產品“通義千問”也已面世。據介紹,通義千問的功能包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等。張勇表示,面向 AI 時代,所有產品都值得用大模型重做一次。

騰訊面向大模型訓練,發布“超強算力集群”。要助力企業云上訓練 AI 大模型,解決中小企業和創業公司的算力壓力。

作為顛覆者,身處寶座之上,往往更害怕被顛覆。作為當今互聯網巨頭,實際上每一步都更加心驚膽戰,唯恐一步不慎,當下榮耀化為昔日榮光。

而大模型就是一個這樣危險的因素,巨頭很難允許大模型被掌握在其他人手中。

2. 堅守派

其次是商湯、云從、科大訊飛等“堅守派”。在人們看來,人工智能似乎已有“新”、“舊”之分,但這些企業無論風口與低谷,始終堅守在AI戰線。

3 月 30 日,云從科技披露定增預案,擬向不超過 35 名發行對象發行股份不超過 2.22 億股,募集資金不超過 36.35 億元,擬全部用于云從“行業精靈”大模型研發項目。

商湯也推出了商湯日日新大模型體系。據悉,日日新大模型體系主要包括自然語言生成、文生圖、感知模型標注、以及模型研發功能。即“商量(中文語言模型)”、“秒畫(文生圖)”、“如影(數字人視頻生成)”、“瓊宇(場景生成)”,“格物(物體生成)”。

5 月 6 日,科大訊飛召開了名為“訊飛星火認知大模型”的成果發布會,同步發布了訊飛AI學習機、訊飛聽見、訊飛智能辦公本、訊飛智能座艙和訊飛開放平臺等5項應用成果??拼笥嶏w董事長劉慶峰表示,根據現在測試結果,星火在國內可測的現有系統中遙遙領先。

“臥榻之側”,豈容被他人顛覆。在自己的人工智能主場,原有的人工智能玩家更不能輕易被外來者跨維度打敗。

3. 互聯網科技派

另外,還有小米、360、知乎等“互聯網科技派”。即便未躋身互聯網頭部,但終究不甘于平庸。

360 集團創始人周鴻祎對外展示了 360 版的 GPT 大語言模型,公布了基于這一大模型開發的人工智能產品矩陣“360 智腦”,落地搜索場景并面向企業用戶開放內測。

知乎創始人、董事長兼 CEO 周源在“2023 知乎發現大會”上宣布,知乎聯合面壁智能發布中文大模型“知海圖 AI ”。知乎方面表示,在特定場景中,把“知海圖 AI ”大模型的效果與 GPT-4 進行了比較,兩個模型幾乎是持平的。

據澎湃新聞報道,小米集團發布內部郵件,任命欒劍擔任技術委員會AI實驗室大模型團隊負責人,向技術委員會副主席、AI 實驗室主任王斌匯報。

曾經輝煌過以及正追求互聯網高光的玩家們, 終于撞上當下愈發稀缺的“翻盤”機遇,他們或許會對大模型會寄予更高的期望。

4. 互聯網藍血派

最后,是王小川、王慧文、李開復等“互聯網藍血派”。互聯網大佬們也已隨之沸騰。

王慧文在社交平臺發文宣布進入 AI 領域再創業并高調招攬 AI 人才,其創辦的光年之外已正式開張,近期已啟動第二輪融資,投前估值約 10 億美元。

李開復宣布籌辦的新公司 Project AI 2.0 目前已正式開啟團隊組建。李開復在朋友圈表示:“我正在親自籌組的 Project AI 2.0,是一個致力打造 AI 2.0 全新平臺和 AI-first 生產力應用的全球化公司。

王小川正式宣布入局中國大模型創業,和前搜狗 COO 茹立云聯合創立人工智能公司。 王小川在公開信中表示,新公司名為“百川智能”,目前已初步組建了 50 人的團隊,獲 5000 萬美元啟動資金。

互聯網藍血們往往已經實現了財富自由,人身同樣自由,出錢又出人,不求其他,只為假設一切、打翻一切,只求干一票前無古人的大事。

從大模型玩家各自出身來看,大致如此。但即便相同“派別”的玩家,也未必會抱有相同的發展目標,玩家們在大模型的發展邏輯上也各有不同。

真正有實力的玩家,往往是奔著大模型“底層路線”去探索。真正坐在人工智能牌桌前,參與這場歷史賭局。

科大訊飛內部人士對互聯網江湖表示:大模型技術背后最核心的是認知智能,科大訊飛在認知智能上已有近 10 年布局,取得多項成果。在 ChatGPT 推出后,公司迅速進行技術和研發體系的驗證,并在去年 12 月迅速啟動大模型的專項攻關。

而剩下的玩家,大都走的是“應用層路線”。大模型未來潛力絕不止于此,只要能夠在大模型產業鏈發展過程中分一杯羹,就有可能給企業帶來極大發展空間。

百家云在這些企業中較為典型,百家云對互聯網江湖表示,目前大模型在應用層主要面臨兩大問題:

一個是市場培育問題。當下大模型仍然處于一個教育市場、教育客戶的階段,作為一項新技術,需求方對于大模型的能力邊界認知還不夠清晰,客戶對于大模型的技術實現程度、具體細分場景落地能力都還不太了解,這需要大模型企業和客戶共同進步。

百家云舉了個例子,此前大模型技術主要被運用于機器翻譯上,大概能達到80%的準確率,再加上簡單的人力完善才可使用?,F在AI人臉識別已經較為成熟,在銀行廣泛使用,百家云在做的工廠工序檢測場景下的大模型也沒有問題。而手勢識別場景下的技術,離落地還有一段距離。

另一個是成本問題。不同細分場景落地的AI所需要的訓練語料是不一樣的,想要得到一個足夠有效且好用的大模型,需要投入足夠多且針對性的語料。為此,百家云專門開發了一套自動化開發平臺,讓客戶自主選擇語料以及成本的投入量,從而實現應用層大模型的成本降低。

當然,其中也不乏一些“渾水摸魚”者,并沒有真正入局大模型,而是想要借這場狂歡,謀得更多短期利益。越來越多的上市公司加入大模型概念股的大軍,想要借助大模型概念提升企業估值。

二、科技產業“食物鏈”,迎來新霸主

1. 互聯網的科技“食物鏈”

互聯網科技產業,本身就存在一條科技“食物鏈”:軟件吞噬世界,平臺吞噬軟件,云吞噬平臺。而這條科技“食物鏈”正迎來一位新的霸主,大模型正在吞噬云。

互聯網企業本質上是軟件企業,通過軟件搬運信息,改變世界。

現如今,軟件已經吞噬了許多被廣泛認為存在于物理世界行業的價值鏈,比如今天的汽車,軟件開始操縱引擎與方向盤,引導駕駛員向目的地行駛。實體零售巨頭沃爾瑪,利用軟件提升自身后勤和配送能力,提升企業運轉效率。航空公司憑借票務系統協調機票、準確定價等等。

而平臺模式的本質是構建多主體共享的商業生態系統,實現互聯網中多主體共贏的一種策略。平臺早已不是最初我們簡單理解的第三方中介或者渠道,而是一個完善且不斷進化的生態圈。

以電商行業為例,淘寶京東等電商平臺成長的同時,更多的垂直性電商消失于歷史長河。淘寶京東也并沒有拘泥于自身電商平臺屬性,而是不斷擴展平臺邊界,買菜、醫藥、短視頻… 變得更加龐大。

平臺發展的同時,也受到了云計算的吞噬。,讓平臺巨頭不得不切入云計算領域。透視互聯網的底層,本質上還是大量的數據,以及對數據的計算。而云的誕生本身就是為了解決分布式計算和存儲的,因此,隨著平臺的發展壯大,云計算終歸會慢慢成為平臺的基礎核心。

比如亞馬遜,云業務早已成為亞馬遜主要的增長貢獻來源。亞馬遜 2022 全年 442 億美元的規模增長中,40.5% 是由亞馬遜云科技( AWS )實現。隨著國內產業互聯網如火如荼的發展,云計算也成為了國內平臺巨頭們的重要戰場。

為何說大模型的發展有可能會“吞噬”云計算?

首先,大模型的進化必然離不開云計算,且有吞噬云計算的趨勢。

大模型需要大量的算力供給,需要云計算提對底層大規模算力統一編排調度,創造一個性能超強的計算環境并提供海量存儲空間。阿里的通義千問背后離不開阿里云的支撐,百度想要發展文心一言,也不得不開始重視自家的百度云。

其次,大模型的進化過程,或許也將會對傳統云計算架構開始新一輪的改造。

如果人工智能的智慧程度達到超越人類的程度,那必然依賴一個能夠超越人腦的“硅腦”,而云計算目前正扮演這樣一個角色。需要注意的是,當下云計算僅僅具備IaaS、PaaS、SaaS三層架構,這對于當下大模型的進化顯然不夠的。

比如ChatGPT,有兩個最引人矚目的創新,是運用了云計算以后工程化的創新:

  1. 情景學習模式以及多模態(文本、代碼、圖片等多維度信息)輸入;
  2. 人類反饋強化學習(RLHF)的微調訓練機制和提示導引模式。

當下,大模型已經證明了自身強大的能力。人們出于對大模型所實現的突破充滿狂熱,認為大模型如同最初的互聯網一般,甚至已經超越了互聯網所帶來的改變,將會帶來新一輪的生產力改造,因此也給予大模型相關企業很高的期待。然而在短期內,大模型還未真正實現落地,對企業的業績拉動作用也并未凸顯。

2. 大模型市場的基礎條件

大模型的能力及其危險程度呈正相關關系,而安全能力將是大模型市場爆發的最基礎條件。

技術層面,大模型仍是一項黑盒技術,為什么大模型能夠壓縮知識,我們不了解其中的細節參數,不具備可解釋性。盡管現在的大模型的錯誤還很明顯,但我們目前已經能體會到大模型的強大之處。當大模型回答的正確度越來越高,而我們還沒有形成完善的謊言的識別能力,其危險程度將隨著落地而陡然上升。

政策方面,國內管控環境和國外管控環境不同,國內政策監管或許會更加嚴格。此前有K12的例子,一紙禁令,行業“熄火”。如果大模型的安全性無法解決的話,在能力達到一定臨界線或者在場景落地并出現行業陣痛之際,也有可能重蹈在線教育的覆轍。

商業層面,不同于國外的 OPEN AI ,國內大模型企業未做到利益與控制權分離。從 OpenAI 的股權設置來看,雖然 OpenAI“賣身”給微軟 49% 的收益權,但并未讓微軟獲得其沒有控制權,這保證了大模型技術不會因為商業利益而被濫用。

而對于國內的大模型企業來說,不存在這點限制,保證技術的發展速度以及商業化速度是首要考慮的因素,而先保證安全等于“先掏罰金”。

3. 未來大模型技術需要至少三層防火墻

  1. 對于底層的大模型企業來說,需要建立底層安全防護理念,保證未來接入其他各類接口的安全性。
  2. 隨著產業協作的完善,底層、中間層、平臺層、應用層等產業各個環節會逐漸成熟,這時候需要在各個環節建立行業統一的安全標準。
  3. 如果大模型部署在公有云上,可以將安全解決方案整體交給專業的云計算企業實施,從而實現大模型系統的整體安全管控。

縱觀人類歷史,從公元元年到18世紀,人類經濟增長曲線幾乎是平的。也只有在近三百年才出現工業革命,實現技術巨大飛躍,帶來經濟高速增長,這在人類已知的歷史中不過是短短一瞬。

可見技術進步的速度和加速度不見得是一致的,接下來的人工智能或許也到了這“最后一瞬”的時候,能否抓住這個機遇就成了當下企業面臨的考驗。

科技樹可以有很多條分支,但終歸只有一條是通向成功。

在這之前,很少有人能夠預測到未來人工智能的走向,此前連谷歌也押錯了注。而此次大模型就一定走在成功的分支上嗎?

仍需時間來驗證。

專欄作家

劉志剛,微信公眾號:互聯網江湖(ID:VIPIT1)。人人都是產品經理專欄作家。資深媒體人,TMT領域深度報道。

本文原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!