數字科技競爭白熱化,我們需要更多大企業

0 評論 2108 瀏覽 2 收藏 17 分鐘

近期的新一輪數字科技競爭狀態變得“火熱”,在這種情況下,大企業的作用尤為重要,為什么這么形容呢?我們接著往下看,筆者分享的文章,了解更多內容。

在新一輪的科技競爭和技術創新當中,大企業的作用顯而易見,在帶動中小企業和大研究中發揮著引領作用,掌握關鍵核心技術、走向國際參與競爭,更需要大企業貢獻力量。

再過不足一月時間,歷史的指針將正式指向2024。大模型“井噴”之勢下,數字科技在全球新一輪科技浪潮中的趨勢與走向,是創新者提前備賽的重要發展指南。

需要進行前情提要的是,數字科技一定是硬科技,但硬科技不等于硬件科技,人工智能、大數據、云計算、區塊鏈、虛擬現實等數字科技也是硬科技。數字技術不僅有很高的技術門檻,同時能夠賦能千行百業、提升效率。突破卡脖子技術需要“軟硬結合”,硬件技術和數字技術缺一不可。

以大模型浪潮為例,涉及到的即有芯片、服務器、通信網絡等硬件領域,也包括云計算、數據庫、虛擬化等軟件層。短短一年間,大模型已從概念走向業務場景應用,加速通用人工智能演進,過程中國內頭部科技廠商起到了引領發展的重要作用。

爆發源于沉淀。這與大企業多年創新積累不無關系,由此才能以“時刻準備著”的姿態抓住窗口期。在推動技術進步的進程中,大企業有自己獨特的優勢,鼓勵大企業發展、努力培育更多在國際市場中有競爭力的大型科技企業,是國際市場競爭戰略。

而作為經濟發展中最活躍的創新要素,企業創新,才能產業創新。

一、國產大模型百舸爭流,加速拓展應用廣度與深度

預判2024,大模型是無法回避的話題。過去一年,國內外大模型加速發展。其中,海外市場繼GPT-4發布后,OpenAI推出了更強大收費更低的GPT-4 Turbo、人人都可定制的GPTs服務以及GPT商店。除此之外,Google、Anthropic、Cohere、HuggingFace都在不遺余力地推進大模型。

國內市場同樣百花齊放,騰訊、阿里、百度、華為、科大訊飛等廠商結合自身業務和戰略布局,發布了各自的大模型技術路線與產品。有數據顯示,截至10月份國內大模型發布已達238個,國產大模型呈百舸爭流之景象。

但無論國內還是國際賽場,大模型的競賽終歸不是閃電戰,而是持久戰。短期模型發布數量暴漲的背后,大模型的應用方向和商業價值更值得深入探索,“下半場比拼的是場景和應用的落地能力”已成業內共識。

目前來看,大模型產業呈現出通用大模型和領域大模型互促共進的發展態勢。通用大模型通常從通用語料訓練生成,具備強大的自然語言理解、語言生成和語言識別等能力,在聊天、寫詩、作畫等泛娛樂場景上表現頗佳。

而在更為嚴肅的工作場景、專業場景里,目前階段通用大模型無法大面積地勝任,例如法律、醫療、金融等。這是因為通用大模型一般基于公開信息進行訓練,在許多專業知識和行業數據方面積累不足。

領域大模型是基于通用大模型灌注行業知識精調形成,能夠更好地理解行業的語義和規范,更有效地執行專業性更強的任務。當前很多大廠從基礎大模型做起,搭配領域大模型,讓人工智能更好地服務于千行百業。

例如,華為在發布盤古大模型后,在醫藥、氣象、金融等領域布局了領域大模型,“盤古藥物分子大模型”使先導藥的研發周期從數年縮短至數月,研發成本降低70%,“盤古氣象大模型”能夠提供秒級的全球氣象預報。

騰訊方面推出了騰訊混元大模型和騰訊云MaaS(模型即服務)?;煸鳛轵v訊云MaaS的基座,客戶可以直接通過API調用混元,也可以將混元作為基底模型,為不同產業場景構建定制化的應用。目前混元已接入騰訊逾300個業務和產品并取得初步效果,包括騰訊云、騰訊廣告、騰訊游戲、騰訊會議等。

從商業化落地情況來看,無論是通用類還是領域類,大模型最根本的出發點是解決產業場景中的實際問題,長遠的目標是以人工智能為代表的新一代數字技術引領新一輪的技術發展和產業重塑。

但如果始終堅持通用類大模型,即便在100個場景中解決70%-80%的問題,卻很難完美解決某個問題;如果始終堅持領域大模型,而在底層模型投入不足的話,未來或許將與第一陣營漸行漸遠。

以大模型為代表的人工智能技術應在更加嚴肅的專業場景和工作場景中真正發揮價值,拓展應用深度;從本文到圖像、音視頻等更多維度,多模態推動AI應用廣度,進而成為新的生產力。

在當前競爭階段,“兩條腿走路”的平衡戰略或許是最佳選擇,只有將通用大模型的能力提升至世界前沿水準,有了較強的基本能力和素質后,才能在不同行業與場景的落地中實現務實創新。

放眼全球,技術進步的速度不會放緩,大模型更是展現出了革命性的技術進步,以人工智能為代表的數字科技正在奔涌向前。跟進與超越,是不可逆的技術洪流。

二、數字科技將成國際競爭重要戰場,關鍵技術應當自主可控

大模型是新型基礎設施的關鍵底座之一,因此大模型的競爭也是國家科技戰略的競爭。在大國博弈的背景下,以人工智能、大數據、云計算、區塊鏈等新一代的數字科技將是未來國與國競爭的重要戰場。

但新的數字科技既是重大機遇,也是艱難挑戰。作為底層技術能力,數字技術勢必將向上賦能各行各業,同時助力科學技術發展。但除了像芯片這樣的硬件領域,在以大模型、人工智能為代表的數字技術方面也存在“卡脖子”問題。如數據和算力,就是當前想要布局全棧自主創新的大模型產品的主要制約因素。

數據是大模型的基礎燃料,決定了模型的訓練質量、性能表現和應用領域的廣度和深度。但其實國內不缺海量數據,缺的是高質量的中文語料。據國家網信辦數據顯示,2022年我國數據產量達8.1ZB,位列全球第二;我國數據存儲量達724.5EB,全球占比為14.4%。但在ChatGPT大模型訓練中,中文占比不到0.1%,這也與中文開源語料庫數量少和規模小有關。

值得關注的是,構建中文開源數據集的步伐正在加快。今年以來,《北京市促進通用人工智能創新發展的若干措施(2023-2025年)(征求意見稿)》中提到,要組織有關機構整合、清洗中文預訓練數據,形成安全合規的開放基礎訓練數據集;持續擴展多模態數據來源,建設高質量的文字、圖片、音頻、視頻等大模型預訓練語料庫。

此外,復旦大學團隊開源包含47萬高質量監督微調(sft)數據集disc-med-sft,華為諾亞方舟實驗室開源第一個億級中文跨模態數據集。

而算力是大模型完成訓練和推理過程的基石,大模型浪潮驅動智能算力需求激增。從算力規模方面看,根據信通院統計,2022年我國算力總規模超150EFLOPS,位居世界第二,并保持高增長速度。

談算力,芯片禁令是無法回避的話題。但歷經多年發展,國產AI高端芯片已取得了長足的進步。面對2個月前的新一輪AI芯片禁令,越來越多從業者選擇華為昇騰910等國產芯片進行訓練開發。

IDC數據顯示,2023年上半年,中國加速芯片的市場規模超過50萬張,本土AI芯片品牌出貨超過5萬張,占整個市場10%左右的份額。國家正在加快推進芯片、云服務等大模型算力基礎設施的自主研發和生產,打破國外的技術和供應鏈封鎖,為國產大模型提供可靠且持續的算力支撐。

面對數字技術巨大的價值和應用前景,雖距離世界頂尖水平仍有差距,但國內產業相關主體努力布局前沿、攻克關鍵技術的步履從未停止。中國數字科技有自己的積累和場景優勢,面對大模型為代表的數字技術方面存在的“卡脖子”問題,中國企業正在努力掌握關鍵核心技術,攜手構建自主可控生態,在數字科技領域縮小與世界領先水平的差距。

三、大企業領軍參與國際競爭,帶動產業鏈條創新提升

大企業往往在基礎研究、原始創新、技術商業落地、高效迭代等能力范疇上表現突出,是創新型企業中的佼佼者。面對更加殘酷的國際市場競爭,以及國內科技實力從量的積累邁向質的飛躍、從點的突破邁向系統能力提升的關鍵節點,應當重視大企業的發展,發揮大企業的作用。

在新時代新征程上,如何讓大企業在自主創新中“挑大梁”,發揮大企業承擔關鍵技術攻關、提升創新體系綜合效能、參與國際科技和產業競爭的優勢,是下一階段需要思考的重要課題。

當前國產大模型從發布數量上看,與世界先進國家差距不大,但從影響力來看,國產大模型還未形成像ChatGPT、Bert一樣的世界性影響力。

這是由于以微軟、Google、Salesforce等為代表的科技巨頭大量資源資金投入的長期結果,為所在國大模型產業的發展積蓄了力量。如Google長期投身于研究基礎理論,最早在2017年提出Transformer網絡結構,成為近些年大模型領域大多數企業底層架構的基礎。

技術創新有其自身的規律,數字科技具有投入大、高風險、回報周期長等特性。當下的科技創新不僅需要實現“從無到有”的突破,更需要平衡成本、效率、效果的“不可能三角”,解決商業化、市場等一系列應用問題。

企業對于數字科技的投入,應該是在創新中容許適當失敗的、長期而又持續的,是既有豐富的市場應用實踐,又懂得科技成果轉化的。相比之下,大企業在創新投入和創新能力上更有優勢,可以形成生態,帶動中小企業的創新能力,進而形成創新鏈條。

就大模型產業而言,訓練成本高,研發難度大,“每家一個大模型”不太現實,一定需要一個“大電廠”,以及幾個大電廠形成互聯互通的算力中心。由此推測,最終的生態應該是由少數幾家頭部廠商研發基礎大模型,中小企業注重精細的部分,高校側重基礎理論的研究,“建立生態+做細應用+對齊科研”才有望在國際和國際市場競爭中贏得大模型產業博弈的彎道超車機會。

目前,國內頭部企業正在不斷完善AI生態構建。百度推出大模型生態政策;華為鼓勵更多伙伴加入盤古大模型全域協同生態體系;騰訊已經與1萬1千家生態伙伴展開緊密合作,推出了覆蓋100多個產業場景的行業解決方案,騰訊云也發布了“大模型生態計劃”。

對于具有豐富行業數據積累的中小企業,可以通過直接調用API或基于GPT大模型微調優化自己的AI產品。然后基于開源模型或海量數據,打造出更專業、更精準的領域大模型,建立垂直行業的平臺生態。

因此在當前環境中,應當發展大企業,用大企業領軍大研究。大企業有更充足的資金、資源、人才,可持續投入和持續創造,進行多方位甚至是冒險式的研發。在國際市場和國際科技發展中同樣如此,沒有大企業就很難擁有話語權。應當鼓勵企業做強做大,到國際上參與競爭。

根據全國工商聯數據顯示,2022年中國民營企業中研發投入最多的三家公司分別為華為、騰訊、阿里巴巴,三家企業研發投入合計約占全國總研發經費支出的近7%。

在全球企業排名中,三家公司的研發投入均排在前二十位。此外,華為在5G領域的專利數量已經連續多年排名第一,掌握的關鍵核心技術專利最多;騰訊專利申請數量超6.6萬件,全球互聯網行業中僅次于谷歌,人工智能專利數超過1萬件……

在數字科技等前沿領域的探索中,頭部企業往往能夠較早布局和規劃,例如騰訊早在2018年就開始了大模型訓練和推理的研發,并設有實驗室專注量子計算、下一代機器人的研究等。

在新一輪的科技競爭和技術創新當中,大企業的作用顯而易見,在帶動中小企業和大研究中發揮著引領作用,掌握關鍵核心技術、走向國際參與競爭,更需要大企業貢獻力量。

期望在未來的世界舞臺上,看到在“以大帶小”、“產學研”與“用”互為指導下,越來越多的中國企業身影。

作者:正見TrueView ,內容:七月,編輯:TV,校對:莽夫

本文由 @正見TrueView 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!