關于DeepSeek的三點差異化思考:應用場景、數據服務、研發成本
DeepSeek的出現不僅在技術上取得了突破,更在應用場景、數據服務和研發成本等方面帶來了新的思考。本文將從這三個維度深入分析DeepSeek的差異化優勢及其對AI行業的影響,供大家參考。
蛇年除夕夜,各路自媒體忙著討論DeepSeek:中美博弈、開源勝利、技術解析…
我今天不聊這些,來簡單分析3個趨勢:應用場景、數據服務、研發成本。
先回顧2個被驗證了的DeepSeek的馬前炮:
被驗證的馬前炮1:半年前,我認為國內最堅定AI技術理想主義者的公司在量化機構,DeepSeek現在證明了這個判斷。DeepSeek能打開如今的局面,絕非偶然,技術認知與戰略定力確實在線。
被驗證的馬前炮2:DeepSeek利空英偉達,利好國產化算力。發文時,英偉達創造歷史最高市值蒸發紀錄。大洋彼岸OpenAI、Meta們,管理成本的問題也被晾火架上烤。
然后分析3個趨勢:場景、數據、成本。
一、應用場景
DeepSeek的進展,可能解鎖更多高響應時效、高精度要求的復雜分析決策場景。譬如:投資決策、輔助科研、家庭教育、兵棋推演、具身智能、案件分析等等。
DeepSeek通過RL和蒸餾,較小參數的模型也可以涌現出長思維鏈、自我驗證的能力。小參數模型的優勢不僅是算力成本低,更重要的是提升響應時效、方便邊緣計算。
DeepSeek開啟了一個巨大的想象空間:大量原本需要深度分析推理的“慢思考”場景,很可能用“快思考”的速度就能完成。不是說DeepSeek已經做到,而是它解鎖了這個趨勢。
2017年Alpha Go已經可以在圍棋上快速落子,圍棋是有限規則的封閉場景。LLM應對更加多變的無限場景,有本書叫《有限與無限的游戲》,講了這兩種場景決策共同組成了人類社會的全部行為。
以往只有人類的認知天花板,才能夠面對無限游戲做到瞬時響應,未來AI也可能做得到。
如果看過馬斯克的采訪,你會發現他幾乎每句即興表達,都遵循第一性原理,深度思考率接近100%,普通人類是做不到的。
福爾摩斯第一次看見華生,只看了華生一眼,就推斷出他是剛從阿富汗回來的軍醫。這種瞬間復雜推理的能力,即便給華生1年時間也搞不定。福爾摩斯通過大量強化訓練,將原本需要“慢思考”才能解決的復雜邏輯推理問題,轉變為跟“快思考”一樣的速度。
這種人,在專業領域內就是無敵的存在。
如果你看過《思考快與慢》,可能更容易理解。人類有兩種思考系統,系統1是快思考,系統2是慢思考。人類通過長期訓練,某些系統2的行為可以逐漸變得自動化,接近系統1的運作方式。復雜決策的瞬時響應,才是DeepSeek為應用場景帶來的最本質改變。
二、數據服務
復雜場景、垂直領域、高質量的專業數據,比以往更加稀缺。
GPT-4o發布的時候,我拋出過這個觀點:
后來Ilya等大佬也發表了類似的觀點,證明我的猜測,確實通用的訓練數據已接近耗盡。SFT本身有局限,如果要進一步突破上限,強化學習是為數不多的選項。
DeepSeek – R1證明僅用強化學習就可以很好地完成post – train,這樣所需的標注數據規模就會下降。下降不代表沒有,如果想要大模型解決更復雜的推理場景,就必須對數據結構、標注質量提高要求 —— 也就是提升評測標準。
提升哪些標準?一個是專業化,一個是擬人化。
專業化,要到什么程度?我認為不久的將來,各行業的業務專家、Leader們都要到親自到一線實操貢獻數據,萃取他們的認知復刻到大模型。通用場景數據、中低端數據外包服務將不再重要,開發者并不缺這類數據,可以通過導師模型來合成數據訓練小參數模型。
高質量的專家數據將變得尤為重要,并且是經過設計、篩選、標注、核驗、優化過的專家數據。
擬人化,要到什么程度?每一輪對話都像真人,而不像念稿?!跋裾嫒恕边@三個字的標準可以無限高,AGI也是像真人,像馬斯克、王陽明一樣也是像真人。到底什么樣的數據,才能訓練出像真人的模型?只靠微信、抖音里的那種內容數據來堆量,是沒用的。如果有用,互聯網大廠們的大模型性能早就可以一騎絕塵,但實際上并沒有?,F在一騎絕塵的是DeepSeek,AI六小虎也沒有在模型水平上被大廠甩開質的差距。
現在主流的訓練數據混合式是:人工數據 + 合成數據,合成數據的質量不如人類專家。所以專家們,該下場造數據了。
我認為2025年是AI數據領域的分水嶺,勞動密集型的數據生意將逐漸被淘汰,轉向專家密集型的高質量數據服務。這也是為什么Scale AI創始人被DeepSeek刺激,呼吁限制中國AI發展,實際上是未來Scale AI的生意更難做,真的很焦慮。
三、研發成本
頭部AI公司的算力成本、團隊規模會大幅控制,但人才密度會上升。
算力成本:DeepSeek展現出低成本、高ROI的模型讓更多玩家看到應用場景落地的可能性,應用端玩家會更多,資金投入會更堅決。
DeepSeek刺激中美AI軍備競賽加劇,英偉達斷供問題更嚴重。國產替代芯片需求就更加迫切,準確的說市場更加渴望低成本的高端芯片,這對國運來說是利好。
人力成本:經過DeepSeek的祛魅,AI大廠組織精簡拐點已至。我想強調,不僅是硅谷,國內大廠也絕對跑不掉。
同時,更低成本、更高效率的大模型研發機會,將刺激更多新老軟件公司加速布局AI,所以AI人才將呈現結構化的流動趨勢。好的AI公司比以往更缺頂尖人才,100個臭皮匠不如1個諸葛亮,包括算法、工程和產品。
就像炒房、炒股,21年以來房價暴跌,一線城市的豪宅明顯比剛需抗跌,豪宅自有其獨立的價值邏輯。為什么炒股大家都愛龍頭?表面看是人性使然,更本質的邏輯在于:龍頭漲得最早,漲得最多,死得最晚。
所以,未來優秀AI公司的人才密度一定會提升,將涌現出更多小而美的組織用實力證明自己。
作者:于長弘;公眾號:弘觀AI
本文由 @于長弘 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!