《超越追趕》視角看DeepSeeK的成就
DeepSeek作為國內AI領域的一匹黑馬,憑借其在AI大模型技術上的創新和成本優勢,引發了全球范圍內的廣泛關注。本文將從浙大吳曉波教授的“超越追趕”理論出發,深入分析DeepSeek在機會窗口和技術二次創新方面的成就,供大家參考。
最近令全球嘩然的DeepSeek幾乎擠占了國內外各大社交媒體平臺,引起了AI圈、各行業企業圈、資本圈、政治圈以及社會各階層的關注和討論。作為國內AI領域的一匹現象級的黑馬,DeepSeeK憑借其在AI大模型技術路線上的創新和成本優勢的建立,其立下的“豐功偉績”顯而易見有歷史性的積極面,但也充斥著不同視角的消極面。
積極的一面是國內外專家紛紛公開表達,中美AI差距在縮小(從之前的2-3年縮短到了1年之內甚至半年內),優化后的架構和訓練方式大大降低了對算力的依賴、中國大概率可以擺脫美國的芯片卡脖子問題,進而促進國內芯片的發展。
消極的一面是有些博主從資本視角看這場舉國同慶的盛宴,只不過是資本圈的營銷劇本,只不過是與普通老百姓關系甚遠甚至危機隱私就業問題的糟心事兒,只不過是依附于頂尖大模型技術的更新迭代、絕非獨立創新那般優越…
但無論全球AI競爭與合作會走向怎么樣的結局,當下DeepSeek作為一家國內大廠、AI六小龍之外的后起之秀,面對行業領先者、在位者的時候,可以利用好自身稟賦、把握機會窗口,形成后發優勢,最終實現持續追趕、甚至有望全面超越的成果,就是一個值得被拆解的典范。我們嘗試用浙大吳曉波教授的超越追趕理論,從機會窗口、二次創新2個層面逐一分析,從而看清楚DeepSeek從追趕到超越的外在機會和內在邏輯。
注:關于DeepSeeK最近在技術上的成果、對比及相關的評論,詳見文末的參考文獻
一、DeepSeek是誰?
DeepSeek是一家專注于人工智能開源大模型研發與應用的科技公司,以“技術驅動 + 場景落地”為核心理念,專注于金融、醫療、政務等高價值領域,提供行業專用的大模型解決方案。
DeepSeek是在2023年由母公司幻方量化創立的,在此之前它是幻方量化公司內部專注于AI研究和應用的團隊,而其母公司幻方量化是一家成立于2016年的量化投資公司,不僅可以為DeepSeek提供了強大的技術支持和資源,還通過與多家公司的合作,為DeepSeek的模型訓練和應用提供了豐富的數據和算力支持。
二、超越追趕理論是什么?
超越追趕理論是由浙江大學吳曉波教授提出的,宏觀上解決國家級的超越追趕問題,微觀上解決企業通過技術創新和商業模式創新實現追趕超越問題的方法論。具體通過把握范式轉變的機會窗口,借助技術和商業模式上的二次創新、價值網絡的作用來實現趕超。
本篇文章重點先從機會窗口和技術創新2個層面拆解DeepSeek這類企業能夠“橫空出世”的外在機會和內在邏輯,隨著AI領域和DeepSeek的持續發展,我們后續補充超越追趕理論的其他模塊,從而更系統地進行分析。
為什么這次先從機會窗口和技術創新2個層面展開,原因在于VUCA時代之下順勢而為是每一個在位者企業和后發者企業的必然選擇,技術壁壘是每一個在位者企業和后發者企業的立身之本,而機會窗口體現的就是順勢而為,技術創新強調的就是技術壁壘。
三、DeepSeek的機會窗口長什么樣?
機會窗口是市場上絕大多數企業都接受某一產品的概念模式,但具有主導地位的產品架構還沒有形成的這一特殊時期(引自《超越追趕》),在機會窗口時期,后發者企業追趕以及超越的阻力相對更小,或者說領先者與后發者之間的優劣勢差距相對更小,為后發者追趕及超越創造了機會。
而面對不同有利條件類型的機會窗口時,企業得選擇適配的追趕模式,并防范掉入追趕陷阱(即落后-引進-再落后-再引進的惡性循環)。
具體來說,不同的有利條件指的是企業外部的市場環境、技術環境以及企業內部的資源能力情況等三個影響因素的不同組合情況,市場環境的有利性可以體現為市場需求大或者潛在需求增長快,生產經營容易獲得規模經濟和學習效應(主動獲取多樣化信息和知識,并通過相互交流提高吸收程度和運用深度);技術條件的有利性可以體現為技術演進具有可預測性且變動慢,或者技術演化處于混沌期;而資源能力的有利性可以體現為內部資源豐富、調度外部資源能力強等。
我們從《超越追趕》理論總結的不同有利性組合情況可以看出,市場、技術、資源能力三個因素中至少有2個處于有利條件時,整體環境有利性才是相對可觀的、也是相對靠譜的,在追趕超越模式上,企業可以根據實際情況相應采取或自主研發或合作共贏或引進學習或兼并收購等超越方式。
有了以上關于機會窗口相關知識邏輯的補充,我們把目光轉向DeepSeek來看其所處的市場環境、技術環境和自身資源能力方面的處境究竟如何?以及它選擇了哪條超越模式的道路?
- 市場環境方面,隨著B端和C端對AI的認知、習慣和需要的進一步加深,同時各行各業急需通過AI技術革命實現新的商業升級來解決增長乏力的問題,低成本、優性能的AI大模型和場景應用的市場需求是日益增長、越發緊迫;而且,美國對中國設置芯片禁令等科技封鎖的手段,導致中國面臨AI、新能源等多行業卡脖子的問題,這個時候高效率、低成本的大模型技術突破成了中國擺脫卡脖子問題、推動國內AI發展和國產芯片發展的關鍵需求所在;此外,中國國內信創替代(即國產替代)、數據本地化等政策的推動,更有利于國內AI大模型公司的發展;總體上看,視窗環境是有利的。
- 技術環境方面,目前AI大模型技術的發展路徑仍屬于百花齊放階段,在模型架構、訓練方式、算法創新上有不同選擇來解決不同的需求,模型架構創新方面包括Transformer架構及其變體、多模態融合架構等并行路徑,訓練方式創新方面有預訓練+微調、強化學習等并行路徑,算法創新方面有深度學習算法、擴散模型等并行路徑,主導范式仍未形成,AI大模型處于技術演進的混沌期(即技術范式轉變、技術演進非線性、方向尚不明確的階段);總體上看,技術環境是相對有利的。
- 資源能力方面,DeepSeek脫胎于母公司幻方量化,作為量化投資的資深玩家,幻方量化在AI領域及金融領域擁有強大的技術積累、硬件資源和數據資產,可以為DeepSeek的大模型研發給到全面的保障和支持;同時,DeepSeek利于技術開源策略,憑借其資深的行業積累和技術創新,吸引了全球開發者和企業的參與到整體的開發中,生態資源可以不斷豐富;總體上看,內外部的資源能力是有利的。
當三個環境因素均相對有利的情況下,機會窗口是相對明朗的、相對容易打開的,DeepSeek或者類似DeepSeep處境的后發者可以通過借機會窗口的力、走自主研發的路,進而獲得超越領先者的機會。事實上,DeepSeek走的也正是“自主研發”的路線,只不過是建立在引入Google的Transformer大模型的基礎上,進行二次創新后的自主研發,嚴格來說應該屬于引進后的二次創新。
四、DeepSeek的技術二次創新是什么?
《超越追趕》總結了關于后發者技術追趕實現后發優勢的兩種策略,一種是以較低代價獲取領先者所費不菲積累起來的先進設備和技術,并結合自身的條件和環境,對先進技術進行消化吸收,且在此基礎上展開技術創新,最終實現趕超;一種是后發者跳過舊范式直接緊隨新范式。第一種策略適用于技術生命周期較長、領先者創新迭代速度緩慢的行業場景,后發者具備較長的時間窗口來消化吸收和在創新;而第二種策略適用于技術進步周期短的高新技術領域,如電子通信、人工智能等。
DeepSeek采取的正是第二種策略,在成熟的Transformer大模型基礎上,通過自主研發,從模型架構、訓練方式兩方面進行創新迭代,形成了“架構優化+訓練方式優化”的創新策略,減少了對高性能硬件(GPU)的依賴。
- 架構優化,主要表現為多頭潛在注意力機制(MLA)+混合專家機制(MoE)的配合,降低了對內存和計算資源的需求。DeepSeek將傳統的多頭注意力機制升級為多頭潛在注意力機制(MLA),如同將一個廠房濃縮成了一個小車間,從而大幅降低對內存和計算資源的需求。同時,DeepSeek在傳統的Transformer架構基礎上、通過自主研發引入了混合專家(MoE)機制,將模型中的“計算任務”分配給多個專家模塊,每次只激活任務相關性較高的少數專家,進一步減少了計算資源的需求。
- 訓練方式優化,主要表現為規則化獎勵+GPRO模式配合的強化學習模式。DeepSeek拋棄了傳統大模型通過加強預訓練來實現性能提升的方式,選用通過提升推理時的思考能力來實現性能提升的方式(如同不讓小孩花大量精力去刷題背題,而是讓他去做更多的邏輯思考,該比喻引自視頻號AI享科技)。具體的實現邏輯是在僅依靠準確性獎勵和格式獎勵兩條獎勵規則的引導下,讓大模型自己找到最優答案,并通過GRPO(Group Relative Policy Optimization)的優化機制形成“輸入問題 → 模型生成多個答案 → 規則系統評分 → GRPO計算相對優勢 → 更新模型”的模型迭代流程,提升模型的學習效率、甚至形成頓悟的效果(如同老師出題后,讓多個小朋友一起做卷子,大模型選出分數最高的卷子和小朋友,其他小朋友抄就可以了,該比喻引自視頻號AI享科技)。
架構優化和訓練方式優化結合的技術創新策略,不僅帶來了大模型效率效能的提升,還帶來了成本優勢的大幅領先。從DeepSeek-R1論文的性能數據上可以看出,在數學、代碼、自然語言推理等任務類型的性能上已堪比頂級大模型水平,同時其成本卻不到頂級大模型的三十分之一,這足以體現DeepSeek大模型在技術創新實現了跨越范式的創新,即在AI大模型領域的市場競爭上,形成了以算法(高效率、低成本)為主線的新的競爭范式,而不是之前算力為主線的競爭范式。
DeepSeek的R1、V3和OPEN AI的O1性能比對
API費用對比
相關的技術對比和成本對比不在本文中贅述,詳細內容可見文章開頭的內容推薦
DeepSeek的機會把握和技術創新,打破了當前AI大模型的競爭格局,建立了中國AI走向前沿的信心。DeepSeek創始人梁文鋒在接受“暗涌”采訪時說:“我們看到的是,中國AI不可能永遠處在跟隨的位置。中國AI和美國有一兩年的差距,但真實的GAP是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。英偉達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手里有路線圖。中國AI的發展,同樣需要這樣的生態?!?/p>
超越追趕是每一個后發企業可以有也應該有的目標和夢想,不局限于當前備受國家關注的AI、芯片、新能源等行業,也應該是當前備受煎熬的軟件行業的重要課題。追趕超越可以是一個企業通過機會窗口的把握、技術創新和商業模式創新雙輪驅動之下實現的,但要實現更大范圍、更高戰略規劃時的追趕超越,我們更加需要有更加完整的價值網絡和產業聯盟,目的只有一個:看清路線圖,順勢而為。
文獻參考
- 【2025年1月發布的R1大模型的論文】DeepSeek-R1論文.pdf
- Nature新聞:China’s cheap, open AI model DeepSeek thrills (scientists(https://www.nature.com/articles/d41586-025-00229-6)
- 一文讀懂:DeepSeek新模型大揭秘,為何它能震動全球AI圈(https://www.36kr.com/p/3135022841879040
- 為什么老外在deepseek上面慢半拍?(https://finance.sina.com.cn/roll/2025-01-26/doc-inehhqya0549350.shtml)
- DeepSeek 發展歷程(截止到25年1月)(https://zhuanlan.zhihu.com/p/17511493759)
本文由 @運營在洞察 原創發布于人人都是產品經理。未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!