欧美日本黄色网址,欧美一区二区精品综合

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

OpenAI坐不住，說明中國大模型路走通了

字母榜

2025-02-07

0 評論 307 瀏覽 0 收藏

14 分鐘

春節期間，國產大模型DeepSeek和月之暗面的Kimi k1.5相繼發布，憑借強大的性能和免費調用的優勢，迅速引發了全球關注。本文將探討國產大模型的崛起對OpenAI產生的競爭壓力，以及其背后的技術創新和人才策略，分析國產大模型在全球AI領域的崛起之路。

國產大模型在春節期間的一輪輪產品更新，終于讓OpenAI坐不住了。

北京時間2月1日，OpenAI加急上線了o3-mini新推理模型，且首次向ChatGPT免費用戶開放。

來自國產大模型的這波競爭壓力，甚至重新讓部分海外同行擔憂起美國AI的競爭力問題。

近期，前OpenAI高管、AI初創巨頭Anthropic創始人達里奧·阿莫迪 (Dario Amodei)，罕見發布了一篇萬字長文。在肯定DeepSeek-R1模型在特定基準測試中已逼近美國頂尖水平之外，阿莫迪認為DeepSeek的突破，更加印證了美國對華芯片出口管制政策的必要性和緊迫性。

而這輪國產AI力量中，在DeepSeek發布DeepSeek-R1模型的幾乎同一時間，月之暗面也推出了Kimi k1.5新模型。

上述兩款推理模型，均全面對標OpenAI o1完整版。其中，Kimi k1.5憑借同時支持文本和視覺推理的特性，成為首個可以比肩o1完整版水平的多模態模型。

盡管OpenAI展現了下一階段大模型的技術演進路線，但直到DeepSeek-R1和Kimi k1.5發布之前，國內一眾大模型廠商均尚未推出能夠對標OpenAI o1完整版的模型。它們的出現，成了國產大模型攻破OpenAI技術黑匣子的又一次實力展示。

更重要的是，相比OpenAI o1模型付費使用的限制，無論DeepSeek-R1，還是Kimi k1.5，都支持用戶免費無限調用。

堪比OpenAI o1完整版的模型性能，加上免費調用的差異化競爭優勢，DeepSeek-R1和Kimi k1.5新模型，成了春節期間國內大模型對OpenAI發起突然襲擊的兩把尖刀。

借助春節舞臺，完成某種后來居上式的戰略調整，已演變為中國科技公司的保留節目。

2014年春節前夕，微信首度推出紅包功能，未能掀起太多水花。轉折發生在2015年，借助與春晚合作，斥資5億元推出“搖一搖”紅包的微信，在除夕當天使得微信紅包收發總量超10億次，并在2天內完成了支付寶此前花費10年完成的工作——2億張銀行卡綁定。

微信紅包的此番逆襲，后來被馬云在阿里內部稱為是對支付寶的一場“偷襲珍珠港”，并促使阿里在2016也開始重金贊助春晚，通過“集五?！钡男问酱笕黾t包。

現在，被DeepSeek-R1和Kimi k1.5新模型突襲過后的OpenAI，也不得不調整了自己的新品發布節奏。

在國產大模型的快速技術迭代和模型性能追趕壓力之下，即便是OpenAI，恐怕也受不了幾次這樣的突襲了?！拔覀儠_發出更好的模型，但我們不會像往年那樣保持那么大的領先優勢了?！監penAI CEO奧特曼在o3-mini發布后的問答環節中說道。

01

DeepSeek-R1和Kimi k1.5新模型一經發布，便在海外用戶群中引發熱議。

英偉達AI科學家Jim Fan第一時間發帖總結兩大模型的相似之處，認為兩者都簡化了強化學習框架，同時提升了推理性能和效率，并評價兩家公司所發表的技術論文，都堪稱“重磅”級別。

伯克利人工智能博士，Huggingface機器學習科學家Nathan Lambert、科技大V AK等也紛紛試用kimi，還有不少業內人士對這兩款來自中國的產品進行了測評。

與DeepSeek-R1一樣，Kimi k1.5新模型同樣展現出了詳細的思考過程。

北京時間1月31日，蘋果發布了新一季度財報，以此為契機，選中Kimi k1.5推理模型，輸入提示詞“寫一篇蘋果財報分析稿，其中尤其要關注中國市場的變化，以及蘋果AI何時在國產iPhone中上線的情況”。

經過一段時間思考，Kimi給出了蘋果2025財年第一財季的業績報告數據，并特意指出其中大中華區營收為185.13億美元，同比下降11%。

除了給出聯網參考的94個網頁信息之外，Kimi還列出了自己的詳細思考過程。

如果將大模型看作一個數學家，沒有加入推理功能之前，大模型在證明了一個新的定理，或者解了一道新的數學題時，只會把答案寫出來，不會把思考的過程寫出來。但是，有了推理功能的加入，現在大模型就可以把原本只存在于數學家個人頭腦中的思考過程，給盡可能完整呈現出來。

Kimi k1.5推理模型的思考過程，頗有點“授人以魚不如授人以漁”的作用，將其用來指導學生學習，或者輔助程序員編寫代碼等，都有了更強的實際用途，大模型從有用，逐漸變得真正好用起來。

更重要的是，相比DeepSeek-R1，Kimi k1.5還是OpenAI之外首個實現o1完整版水平的多模態模型。

在Kimi k1.5推理模式下，上傳一張蘋果最新一季財報的數據圖表，并給出提示詞“給出圖中大中華區的營收情況，以及同比變化，并分析大中華區營收占比”。

Kimi不僅讀懂了圖片中的營收數字，還通過列出數學公式的方式，準確算出了大中華的營收同比下降了11%，且營收占比也從去年同期的17%，下降至今年的15%。

楊植麟曾在一次采訪中解釋道，長文本就是某種意義上的長推理，“如果我們想讓AI從完成一兩分鐘的任務變成完成長周期的任務，那必然要在一個很長的context（上下文）里，才有可能真正把AI進一步往下推進。”

加入圖片識別等多模態功能，在某種程度上也可以看作是對長文本準確率的一種提升，這種提升，未來還可能隨著無損壓縮視頻多模態的融入，變得更加強大。

02

對人才的重視和培養，成為DeepSeek和月之暗面能夠率先做出對標OpenAI最新模型o1的共性之一。

在DeepSeek目前約150人左右的團隊中，大多是一幫Top高校的應屆畢業生、沒畢業的博四、博五實習生，以及一些畢業才幾年的年輕人。

從2023年初成立至今，月之暗面更是長期被視為中國大模型創業公司中，技術人才密度最高的玩家之一。

在Kimi k1.5中，月之暗面團隊找到了一種提升推理效率的原創技術，即Long2Short高效思維鏈。

在o1模型中，OpenAI一般依賴于邏輯鏈條（Chain-of-Thought，CoT）來逐步推導出解決方案，這是一種用時間換取精準答案的方法。

月之暗面團隊開發的long2short技術途徑，把長思維鏈（復雜的推理過程）的推理結果“教給”短思維鏈（簡單高效的推理過程），兩者進行合并，最后針對“短模型”進行強化學習微調，從而達到提升token利用率以及訓練效率的目的。

在Short CoT（短文本）模式下，Kimi k1.5的能力同樣大幅領先GPT-4o和Claude 3.5，領先幅度高達550%。

良好的產品使用體驗正在給Kimi帶來用戶量的增長。根據SimilarWeb 2024年12月的數據，Kimi在web端排名全球前五，僅次于ChatGPT、Google Gemini、Claude和Microsoft Copilot。

03

在DeepSeek和Kimi們的突襲之下，來自OpenAI等對手的一輪新競爭，已經在趕來的路上。

奧特曼預告中的OpenAI 新模型o3-mini緊急上線，甚至新一代高級語音模型也發布在即，為了在追求AGI道路上走得更快，奧特曼更是聯手軟銀孫正義，搞起了5000億美元的算力開發大計劃。

可以預見，追趕的壓力，或許很快便會再次來到國產AI們的頭上。

但通過DeepSeek-R1和Kimi k1.5新模型的這番突襲，一個值得關注的新變動是，國產大模型正在向外界越來越多地證明其自主創新能力，甚至不排除有一天完成對OpenAI的真正超越。

近期，Meta首席AI科學家楊立昆（Yann LeCun）在達沃斯“技術辯論”會議上再次提醒道，“我認為當前LLM（大語言模型）范式的生命周期相當短，可能只有三到五年。五年內，任何清醒的人都不會再使用它們了，至少不會作為AI系統的核心組成部分……我們將看到一種新的AI架構范式的出現，它可能不會有當前AI系統的那些局限性。”

對于任何立志于實現AGI的大模型玩家而言，追趕OpenAI都絕不是公司成立的初衷和目標，OpenAI與國產大模型之間的差距，正在逐漸縮小已是不爭的客觀現實。

斯坦福大學計算機科學系客座教授、谷歌大腦聯合創始人吳恩達（Andrew Ng）近期發文指出，DeepSeek的討論讓許多人認識到一些顯而易見的重要趨勢，其中之一便是中國在生成式AI領域正趕超美國。