我在硅谷看AI:Deepseek狂飆背后,2025年15條AI關鍵投資啟示

0 評論 876 瀏覽 3 收藏 92 分鐘

生成式AI正在重塑全球科技與商業格局,2025年成為這一變革的關鍵節點。從DeepSeek的崛起引發全球關注,到AI Agent商業化元年的開啟,再到基礎設施投資的爆發與低成本訓練的興起,AI領域正經歷著前所未有的快速發展。

本文將深入剖析2025年AI行業的15條關鍵投資啟示,涵蓋技術趨勢、應用場景、商業模式以及未來發展的核心方向,為投資者和從業者提供前沿洞察,揭示AI技術如何重塑商業版圖并催生新的市場機會。

??

#01 開篇

生成式AI,作為當今最具顛覆性的技術之一,正在引領各行業進入全新的發展階段。

2025年伊始,圍繞生成式人工智能的競賽愈發激烈。美國總統特朗普上任第二天,白宮宣布啟動名為“星際之門”(Stargate)的人工智能項目,由美國甲骨文公司、OpenAI與日本軟銀集團聯合出資打造。

1月14日,OpenAI推出了名為Tasks的測試版功能,標志著ChatGPT正式邁入AI智能體(AI Agent)階段。春節期間,中國大模型DeepSeek憑借其推理模型DeepSeek-R1引起了廣泛關注,該模型以OpenAI十分之一的成本達到了GPT-o1的同級別表現。同時,DeepSeek在1月26日登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內下載量突破1600萬。

緊接著,OpenAI繼續推動創新,發布動作不斷:1月24日發布了一款代號為“Operator”的全新AI Agent產品;隨后2月1日推出o3-mini,專注于STEM領域,支持函數調用、流式傳輸、結構化輸出和搜索結合等功能;2月3日又推出面向深度研究領域的智能體產品,進一步拓展了其在專業領域的應用。谷歌也不甘示弱,在2月6日凌晨發布了性能更強的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三個版本。

如今,生成式AI正迎來類似的歷史時刻,這不僅是科技革命,更是商業重塑的契機,我們正站在這一變革的起點。每一次平臺級機會的背后,都會催生出一批市值百億、千億美金的公司。從互聯網到移動互聯網,再到云計算和區塊鏈,每一次基礎設施的創新都激發了無數新的應用場景,推動科技巨頭的崛起。

回顧這些歷史周期,我們發現,基礎設施的完善往往會催生應用公司的黃金發展期。生成式AI作為新型基礎設施,正處于這一發展軌道的起點。未來,這些公司將通過創新的商業模式和智能化產品,重新定義我們的工作和生活方式,迎來屬于自己的千億市值時代。展望2025年,大語言模型將會走向何方?在這份報告中,我們將從行業變化、技術進展和應用趨勢三方面,對大模型的未來發展進行深入前瞻。

#02 AI瘋狂吸金,千億獨角獸冉冉升起

2024年,最為人們印象深刻的,便是生成式AI公司——OpenAI高達65億美元的融資。這筆融資讓這位生成式AI的弄潮兒估值達到約1500億美元——一只大型千億獨角獸正在硅谷茁壯成長,而這只是2024年中最具代表性的一個。生成式AI所創造出的“造富神話”,多次讓人們情緒高漲,AI就像一個龐大的“吸金獸”,以颶風般的速度吸走了大部分的風投資金。

涌入AI賽道的大量資金和頂尖創業者,正在催生出了一批新晉獨角獸公司。根據硅兔君復盤,在過去18個月新增的73家獨角獸中,有28家是AI公司,占到了新增獨角獸的大約三分之一。例如特斯拉創始人埃隆·馬斯克在2023年7月創立的xAI,2024年3月發布了首款AI聊天機器人Grok-1,隨后發布了Grok-1.5V大模型,其在最新一輪融資中,估值達到240億美元;Xaira Therapeutics,作為AI+生物技術領域的公司,其聯合創始人David Baker在“AI+蛋白質”領域頗有造詣,其團隊研發出AI大模型RFdiffusion,用擴散模型構建的創新型生成式AI系統,并且可以按需構建AI分子,估值為27億美元;Cognition AI是一家由三位華人創業者創立的公司,2024年3月,其推出了世界上第一位完全自主的AI軟件工程師,在最新一輪融資后估值達到20億美元。

制圖:硅兔賽跑,數據來源pitchbook

制圖:硅兔賽跑,數據來源pitchbook 

這些AI獨角獸的成長速度遠快于非AI獨角獸,前25%的AI公司在不到2.5年內就已經達到獨角獸估值。同時,最大規模的交易也流向了AI的初創企業。

另一個趨勢是——融資額正在變大,頭部效應更加明顯。根據第三方數據分析機構Pitchbook的數據,2024年,光是北美的風險投資總金額達到了2164億美金,較2023年增長了28%。其中2024年四季度,北美地區的融資額達到了771億美金,創下了2年以來的新高,光是人工智能相關項目的投融資額達到了991億美金,占到了總額的45.8%,達到了歷史最高水平。過去美國最大的10筆風險投資交易每年通常占總融資額的9%左右,而自2023年以來,這一比例升至20%。

過去一年,我們在硅谷,這個北美將近50%投融資發生的地區以及最能夠代表北美創投發展的地方,捕捉到最新的一些變化并試圖梳理出最前沿的趨勢:

首先,針對人工智能創投領域,有四大行業趨勢值得關注:

  1. 如果說2023年的AI Agent,只是停留在諸如斯坦福小鎮這樣的虛擬世界;2024年,AI Agent的商業化條件逐漸成熟;2025年則是Agent AI商業化的元年,資本的關注和注入加速,會加劇各大科技公司和初創企業在Agent AI 領域的競爭,推動技術創新和產業應用的落地。
  2. 一方面圍繞生成式AI基礎設施的投資規??涨?,帶動了一系列產業鏈公司;另一方面,業界正在嘗試一些低成本、性價比高的做法,減少訓練的投入卻能達到與GPT-4/4o等同的效果;
  3. 專有AI模型正在釋放AI潛力,他們正在解決通用大模型不能解決的問題,逐步具備較高的商業化潛力。
  4. 生成式界面將迎重大發展,用戶能夠有更好的互動體驗,將帶來新的商業模式和市場機會。

其次,在人工智能的技術方面,我們總結了八大趨勢:

  1. 2025年,大模型將更加關注多模態的融合與交互,其訓練方法正在不斷優化;
  2. 一直以來,盡管大模型能力在不斷增強,但仍無法解決人工智能的“黑箱”問題。2024年,許多公司陸續推出了更透明的模型架構和解釋工具以緩解“黑箱”帶來的麻煩。2025年,可解釋性工具將進一步普及;
  3. 2024年,大模型的長期記憶能力迎來了一系列技術突破。2025年,隨著多模態技術的進步,跨模態記憶融合將在視頻、文本、觸覺和嗅覺數據的編碼上取得突破,進一步提升模型的記憶能力。
  4. 合成數據作為加速大模型訓練的方法,將在2025年進一步發揮潛能。
  5. 2025年,隨著更強大的計算資源的普及和優化,規模定律將繼續提升,這使得更多的中小型企業可以進入AI領域,加速了大模型的普及,效率躍遷曲線下,大模型的成本更低了。
  6. 2025年,強化學習(RL)與大語言模型的結合有望進一步提升模型的泛化能力,并使得從預訓練到后訓練和推理遷移的轉變成為可能。
  7. 隨著AI應用場景的多樣化,簡化算法架構將成為AI發展的重要方向。2025年,更多優化算法將被用于強化學習等領域,以減少計算資源的消耗。
  8. 隨著AI蒸餾技術的普及,相關的法律和監管框架也需要不斷加強,以確保在模型開發和應用過程中不會侵犯知識產權或數據隱私。

另外,在人工智能的應用方面,2025年也有了一些新的變化:

  1. 2025年,企業級AI應用迎來深入發展,越來越多企業將從人工智能中獲利。AI Agent成為行業顛覆性力量,生成式AI推動傳統行業進入智能化時代。隨著企業在生成式AI上盈利,商業模式轉變為按工作成果收費,取代傳統的SaaS席位收費。
  2. 2025年對于AI應用來說,下一個重大事件將屬于消費。我們期待一個“殺手級”AI消費應用的誕生。
  3. 在AI應用端,企業不再依賴單一模型,而是會根據不同的應用需求和場景,將不同模型模塊進行組合,定制出符合自己業務需求的模型。

趨勢一 :2025年,AI Agent元年拉開序幕

人工智能未來學家雷·庫茲韋爾 (Ray Kurzweil)表示,2025年,我們將開始看到從聊天機器人和圖像生成器向“代理”系統的轉變,這些系統可以自主完成任務,而不僅僅是回答問題。人工智能系統正在從單一的交互模式,走向專門且相互關聯的代理。

AI Agent,也稱為人工智能代理,通常是指能夠感知環境、進行自主理解、決策和執行動作的智能體。根據咨詢公司來覓PEVC的統計,自2024年以來,全球AI Agent賽道的融資金額已突破665億元人民幣。從整體來看,這些資金主要流向了在技術與市場潛力方面處于領先地位的頭部企業。

科技巨頭紛紛布局AI Agent,以搶占未來智能交互的制高點。

2024年,OpenAI憑借其強大的技術實力和廣泛的市場應用,官宣65億美元新融資,成為萬億獨角獸,也成為全球AI Agent領域的主要資金流之一。

埃隆·馬斯克創立的xAI,希望將AI Agent與人類深度整合,創建全球首個AI Agent與人類共存的社交平臺,xAI在2024年12月完成60億美元融資,估值達到了近500億美元。

谷歌也全力推廣商用AI Agent,發布了全球為數不多的商用AI Agent市場,為企業提供一站式開發、部署和應用生態。微軟在2024年11月的Ignite大會上宣布已建立全球規模最大的企業級AI Agent生態系統,企業用戶可通過Azure AI目錄訪問超過1800個AI模型。

此外,微軟的Copilot Studio平臺已支持用戶創建自主Agent,并正式進入預覽階段。蘋果也在開發者大會上展示了其最新的AI成果Apple Intelligence。

2025年,OpenAI推出的智能體功能(AI Agent)以及一系列基于生成式AI的智能系統,它們開始具備真正的自主學習和推理能力,從單一任務的執行者,轉變為能夠進行多任務處理、復雜決策和交互的智能體——1月24日,OpenAI發布了一款代號為“Operator”的全新AI Agent產品,與其他各家Agent相比,它會通過自有的CUA(電腦控制Agent)系統進行復雜的思維鏈反思和步驟規劃,這可以大大提高其完成任務的精度和復雜性。Operator的創新之處在于其成功實現了從認知到執行的完整閉環。這一能力的拓展不僅是技術上的突破,更是AI技術邁向更高層次發展的關鍵一步。

AI Agent不再是單一的輔助工具,而是可以獨立進行深度學習、理解和推理的智能系統,賦能企業和個人高效完成復雜任務,推動生產力的大幅提升。2025年,AI智能體的全面普及將不僅改變技術產業的格局,還將在各個領域深刻影響人類的生活方式,從而使這一年成為AI Agent真正嶄露頭角的元年。

趨勢二:基礎設施軍備競賽:投資空前,低成本做法漸成趨勢

一年多以前,基礎大模型制造商OpenAI,在芯片制造商英偉達生產的25000個最新進GPU集群上訓練了GPT-4。隨后,馬斯克表示他在一個數據中心有100000個GPU,并計劃購買200000個。

頭部公司通過大規模資金投入,搶占人工智能基礎設施的制高點,而以英偉達為代表的硬件廠商也在以前所未有的速度上不斷突破技術極限。例如,英偉達的頂級芯片性能相當于300部高端iPhone的處理能力。

在這場基礎設施競爭中,埃隆·馬斯克的X平臺部分業務——xAI的“Colossus”訓練集群,成為世界上最強大的人工智能訓練集群之一。這個集群僅用122天便建成,預算高達30億至40億美元,成為人工智能基礎設施建設的里程碑。目前,xAI計劃將集群容量翻倍,進一步增強處理能力。Meta也在大規模投資硬件,近期公布了其24000個GPU數據中心規模集群的兩個版本,旨在支持其下一代人工智能模型。

雖然目前GPU集群比傳統數據中心小,但對人工智能計算不斷增長的需求將需要大規模的基礎設施擴展。包括Meta、亞馬遜、Alphabet和微軟在內的主要科技公司正在推動對人工智能基礎設施的空前投資。超大規模數據中心運營商預計2024年資本支出(CapEx)將超過 2000 億美元,到2025年這一數字預計將接近2500億美元。盡管并非所有支出都直接與人工智能相關,但很大一部分都分配給了人工智能,并且這個份額在不斷增加。微軟和OpenAI已討論推出一個專門用于人工智能工作負載的5千兆瓦數據中心,可能耗資超過1000億美元,甚至可以買得下一艘最新型核動力航空母艦。

在這場人工智能基礎建設中受益的,是這個產業鏈中的組成部分。

第一類就是數據中心的托管服務提供商——也就是向大公司提供數據中心租賃容量的公司,他們是數據中心市場的重要組成部分。這批數據中心的托管服務提供商如今也在拓展其以人工智能為重點的基礎設施服務。例如,超大規模托管領域的領導者 Equinix 已獲得近 150 億美元的資金用于在美國建設人工智能數據中心,主要為客戶提供基礎設施,以訓練和部署大規模私有人工智能模型,這些客戶往往是科技行業以外的財富 500 強公司。

另一類受益者則是人工智能數據中心建設中的輔助產品,例如低功耗CPU、內存、存儲系統、網絡組件以及冷卻和電源管理設備。冷卻產品供應商 Vertiv在2024年7月至9月的三個月內實現了19%的同比收入增長,并提高了未來12個月的業績指引。

第三類則是圍繞數據中心能源生產、熱管理和電源管理解決方案的公司。Alphabet董事長在2023年2月表示,與LLM互動可能比標準關鍵字搜索的花費高出10倍。另外,根據谷歌研究員Urs H?lzle的文章提及,標準Google搜索使用的電力為0.3Wh,這意味著每次LLM互動的耗電量約為3Wh。這個數字與SemiAnalysis在2023年初對ChatGPT運營成本的評估一致,該評估估計ChatGPT每次請求耗電量為2.9Wh,如果每天響應1.95億個請求,估計平均每天耗電量為564MWh。

《紐約客》報道稱,ChatGPT每天用電量相當于1.7萬個美國家庭的用電量。如果基于當前模型和技術,讓每個標準Google搜索都變成 LLM 交互,對 Google總用電量的潛在影響巨大。第三方分析機構SemiAnalysis估計,帶有大模型交互功能的谷歌搜索單次請求的用電量達到將近9Wh,谷歌每天搜索大約需要90億次,則需要81000MWh。

這一趨勢促使人們對位于數據中心設施附近的核能和能源生產等技術以及熱管理和電源管理解決方案進行投資。

不過,如今科學家和業界正在尋找更聰明并且資源密集度更低的方法來解決訓練人工智能模型所需要的算力和能源問題。例如通過蒸餾技術,這項技術的踐行者——DeepSeek,這家國產大模型也給美國硅谷提供了更多低成本的訓練參考。

DeepSeek大模型性能在多個方面比肩OpenAI,其中DeepSeek V3,整個訓練過程僅用了約2000張二流芯片進行訓練,官方稱成本僅占用約550萬美元,而Meta的模型則使用了16000個性能最強的一流芯片。并且,DeepSeek-R1通過重新設計訓練流程、以“少量SFT數據+多輪強化學習”的辦法,在提高了模型準確性的同時,也顯著降低內存占用和計算開銷,每百萬輸出tokens16元,大約是OpenAI o1運行成本的三十分之一。

在這樣的競爭壓力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百萬tokens的進出費用分別為1.10美元/4.40美元(享有50%的緩存折扣)。谷歌發布的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬tokens0.3美元,是谷歌目前最便宜的模型。

可以窺見,在AI產業的競爭中,降低訓練成本、提高計算效率和優化模型性能已成為企業的主要競爭策略。尤其是訓練流程的優化,成為了公司在大模型市場中占據競爭優勢的關鍵能力之一。2025年,低成本做法也將成為行業的主流趨勢。

此外,一些大公司也在開發專用人工智能芯片,例如谷歌、蘋果、微軟和OpenAI,這些專業芯片可以比英偉達這樣通用處理器運行更高效;或是采用一些方法提高芯片的使用效率,例如用多種模型,每種模型針對不同問題,以此來縮短芯片的處理時間等。

AI推理芯片制造商Groq2024年估值達到28億美元,在Blackrock領投的新一輪中融資6.4億美元,其專為AI推理任務設計的芯片“語言計算單元”(LPU, language processing unit)能以現有解決方案1/10的價格、10倍的速度運行與ChatGPT、GPT-4o相似的模型。目前,在Groq開發的、對標英偉達CUDA的軟件開發平臺GroqCloud平臺上,約有40萬開發者。

趨勢三:專有模型有望釋放AI的應用潛力

大模型就像個通才,然而,在一些專業領域,大模型往往缺乏針對性和操作性。為了突破這一瓶頸,越來越多的公司開始專注于開發專有模型,通過在特定領域數據上微調模型,實現更高效的工作流程自動化,提供更具操作性和任務導向的工具。這一趨勢正在逐步升溫,并在多個行業展現出巨大的應用潛力。以下為一些具體的案例:

金融服務領域,提升決策效率與洞察力:摩根大通和彭博社等機構正在利用其龐大的內部數據集開發大語言模型,以提升運營效率和決策能力。這些模型能夠提供獨特的市場洞察、風險分析和報告生成。例如,彭博社于2023年開發了BloombergGPT,專注于金融領域的數據分析和預測,通過微調金融數據,能夠更高效地處理復雜的金融任務,如市場趨勢分析和投資策略制定。

網絡安全領域,精準檢測與應對威脅:美國網絡安全解決方案提供商Palo Alto Networks正在訓練自有的大語言模型,這些模型能夠幫助安全專家更好地檢測和應對網絡威脅。該公司在2024財年四季度披露了超過2億美元的AI相關經常性收入,同比增幅近四倍。AI大模型通過模擬復雜攻擊場景,幫助安全團隊快速發現系統漏洞并提供修復建議,顯著提升了網絡安全的實時預警和用戶行為分析能力。

國防領域,用于軍事與情報分析:美國數據分析和軟件公司Palantir近期獲得了一系列合同,用于支持AI的服務,包括加速部署適用于國防和軍事領域的AI模型。這些模型能夠提升情報分析、目標識別和決策支持能力。例如,AI訓練平臺可以創建逼真的戰斗場景,幫助士兵在安全環境下進行戰術訓練。此外,AI技術在軍事領域的應用還包括無人化作戰系統和沉浸式訓練模擬。

生命科學領域:2024年,科研人員使用AI的比例快速增加,AI對科學研究方法和流程的變革效應也開始顯現。比如,AlphaFold 3.0在2024年發布,不僅提高了蛋白質結構預測的準確率,還擴展到了DNA和RNA等生物分子的研究,這項技術幫助科學家快速預測藥物分子與目標蛋白質的結合情況,大大提高了藥物研發的效率。2025年,多模態大模型將進一步融入科學研究,賦能多維數據的復雜結構挖掘,輔助科研問題的綜合理解與全局分析,為生物醫學、氣象、材料發現、生命模擬、能源等基礎與應用科學的研究開辟新方向。

除了上述領域,專有模型還在其他行業展現出廣泛的應用前景。例如,Two Sigma在量化投資中使用AI Agent進行選股策略,通過分析財務數據和宏觀經濟指標,識別潛在的投資機會。Shopify Sidekick則利用LLama 2生成產品描述、回應客戶查詢和創建營銷內容,幫助小企業主提升運營效率。

專有模型通過在特定領域的數據上進行微調,能夠提供更具針對性和操作性的解決方案。這種趨勢不僅提升了各行業的自動化水平,還為企業帶來了顯著的運營效率提升和成本降低。隨著AI技術的不斷發展,未來專有模型將在更多領域得到廣泛應用,成為推動行業創新的重要力量。

趨勢四:推動動態自適應界面,實現高度個性化的交互體驗

生成式界面(Generative Interface)是指利用生成式模型,如生成對抗網絡(GANs)或變分自編碼器(VAEs),自動創建用戶界面元素或交互流程。這種界面不是通過傳統設計方法人工制作,而是通過機器學習算法根據輸入的數據、需求或上下文生成。

在2024年,生成式用戶界面(Generative UI)在動態和自適應界面、AI與算法融合、個性化體驗等方面取得了顯著進展。大規模生成式預訓練模型(如GPT系列、DALL·E等)已被廣泛應用于自動化界面設計。開發者借助這些模型,可以快速生成和調整界面元素,如按鈕、布局、色彩搭配等,甚至可以根據用戶反饋實時調整界面的外觀和功能。

此外,生成式界面逐步在增強現實(AR)和虛擬現實(VR)環境中得到應用,尤其是在需要復雜交互的沉浸式體驗中,AI幫助生成自適應、動態變化的虛擬界面。例如,英偉達在2024年SIGGRAPH大會上展示了利用實時生成式AI創建沉浸式沙漠世界的研究成果。此外,英偉達還通過Holoscan技術賦能手術機器人,加速AI技術在醫療實踐中的應用。這些應用展示了生成式AI在動態生成虛擬界面方面的潛力,尤其是在需要高度沉浸感的場景中。

可以說,隨著用戶需求變得更加多樣化和復雜,傳統的固定界面無法滿足個性化的交互需求。動態自適應界面能夠根據用戶的行為、偏好和環境變化實時調整顯示內容和功能,提供更加定制化的體驗。

展望2025年,生成式界面將迎來重大發展,成為推動用戶體驗變革的關鍵力量。越來越多的應用將采用基于用戶交互和邏輯工作流程自適應的動態用戶界面。生成式UI將使應用能夠自動生成表單、儀表板或可視化等界面元素,這些元素將根據用戶的具體需求和操作量身定制。例如,Web開發平臺Vercel和Bolt.new等公司正在開發能夠創建高度適應性和個性化用戶體驗的平臺,提供實時演進的界面,以滿足不斷變化的需求,從而簡化工作流程。

#03 八大技術趨勢,推動AI泛化能力

趨勢一:多模態能力的增強和集成

2024年,多模態AI取得了顯著進展。OpenAI、Google DeepMind等機構推出了更強大的多模態模型,如視頻生成模型Sora的誕生、OpenAI多模態AI大模型GPT-4o的到來、CLIP模型通過跨模態表示實現圖文搜索,用戶可以通過輸入文本搜索相關圖像或視頻。此外,文本到圖像生成(如DALL·E、Stable Diffusion)和視頻生成模型也取得了顯著進展,進一步拓展了AI的交互體驗。

大模型逐步增加了能夠處理圖像、音頻或視頻等多種輸入形式。這些模型不僅提升了AI對復雜信息的處理能力,還拓展了其應用領域。在谷歌云發布的《2025年AI商業趨勢》報告中,多模態AI被放在首位。谷歌云預測,2025年將成為企業采用AI技術的關鍵一年,這一趨勢主要由多模態學習及其實現的情境感知所驅動的,并預計2025年全球多模態AI市場規模將達到24億美元。

2025年,大模型將更加關注多模態融合與交互。AI不僅能夠生成文本,還能理解圖像、視頻中的上下文,甚至在多模態環境中進行決策。比如,結合視覺與語音的能力,模型能夠更好地理解復雜的場景,并做出合適的反應。

此外,多模態模型的訓練方法也在不斷優化,例如采用分階段訓練策略,先固定大語言模型的權重參數,對圖像編碼器和橋接組件進行初步訓練,再進行整體訓練,從而提升模型性能。

趨勢二:大模型的可解釋性表現更強

可解釋人工智能 (xAI) 是人工智能領域的一個新興領域,致力于使人工智能系統對人類更加透明、可解釋和可理解。xAI的興起源于人們對人工智能決策過程透明度和問責制的需求日益增長,尤其是隨著人工智能系統變得越來越復雜并部署在金融、法律或醫療保健等高風險領域。例如,考慮醫院用于篩查患者X光片的腫瘤檢測 CNN(卷積神經網絡) 模型的情況。但是,當技術人員或患者不知道其工作原理時,他們如何能相信其結果?這正是我們需要方法來了解影響任何深度學習模型決策的因素的原因。

另外,AI的安全性問題是一個不可忽視的關鍵挑戰。尤其是大模型在做出決策時的“思考過程”對于用戶和開發者來說變得不透明,就像一個“黑箱”,其決策過程難以解釋和追蹤。若這些模型未經過嚴格的審查和驗證,它們可能會做出無法被察覺的有害決策,甚至加劇社會偏見和不公。因此,加強對大模型的監控、審查和可解釋性要求是提升AI系統安全性的重要一步。

2024年,大模型的可解釋性取得了重要進展。OpenAI、Google DeepMind等機構推出了更透明的模型架構和解釋工具,如GPT-4的可解釋性增強版本和Gemini的跨模態解釋功能。LIME、SHAP等后驗解釋方法被廣泛應用于醫療、金融等領域,幫助用戶理解模型決策依據。同時,自監督學習和符號AI的結合提升了模型的內在可解釋性,減少了“黑箱”問題。行業也開始重視可解釋性的標準化,例如歐盟《人工智能法案》要求高風險AI系統提供清晰的決策解釋。

2025年,可解釋性工具將進一步普及,將模型將內置更強大的解釋能力,實時生成決策依據,并支持多模態數據的跨模態解釋,幫助用戶理解復雜AI模型的決策過程。通過一些自主進化模式或可解釋性工具,將模型將內置更強大的解釋能力,實時生成決策依據,并支持多模態數據的跨模態解釋。可解釋性與性能的平衡將得到優化,知識蒸餾和模型壓縮技術將幫助簡化復雜模型的同時保持高精度。行業專用可解釋性工具將普及,滿足醫療、金融等領域的合規需求。

以DeepSeek為例,通過純算法自主進化的Zero模式與僅需數千條人工標注數據的R1模式組合,既保留模型自主進化能力又保障人類可解釋性————Zero模式使得模型能夠自我進化和發現數據中的規律,而R1模式通過引入人工標注數據為模型提供了一個監督和解釋的框架。這種結合確保了模型在保持自主學習能力的同時,也能夠被人類理解和控制,從而提升了可解釋性。

此外,倫理和隱私保護將深度融入可解釋性設計,確保AI系統既透明又安全,推動大模型在高風險場景中的廣泛應用。以下是一些提升的方向和工具:

○ 自監督學習與模型可解釋性:通過自監督學習,AI系統可以在缺乏大量標注數據的情況下,通過理解數據的內在結構來進行學習,這種方法有助于提升模型的透明度,使得我們能夠更好地理解其學習過程。

○ 生成對抗網絡(GANs)和模型蒸餾:通過生成對抗網絡和蒸餾技術,開發者能夠簡化復雜模型,同時保持高效性和準確性,這種方法使得大規模深度學習模型更加易于解釋。

○ 增強推理框架和可視化工具:新一代的AI推理框架將更注重可視化,幫助用戶以更直觀的方式理解模型決策的依據。例如,基于圖像或文本的AI系統,新的可視化工具可以清晰展示模型如何關注不同的輸入特征,從而提升其可解釋性。

需要一提的是,未來AI的安全不光需要提升可解釋性,還需要著重于法律合規性、安全審計和濫用防范等方面,推動AI技術的負責任應用。隨著技術的不斷發展,AI如何在不斷的創新中確保安全,將成為AI領域面臨的重大挑戰之一。

趨勢三:大模型長期記憶能力迎來深層次變革

目前的許多大模型(如基于Transformer架構的模型)在處理長文本或復雜上下文時,常常會面臨信息丟失等問題。傳統模型一般有固定的“記憶窗口”,當文本或輸入信息過長時,模型往往會忘記最初的信息,或者在處理過程中只關注較近的上下文。長期記憶的核心需求是讓模型能跨越多個時刻、任務和場景記住信息,并能在合適的時機提取和利用這些信息。

大模型的長期記憶能力迎來了一系列技術突破。首先,在上下文窗口的擴展上,比如2024年,Google Gemini 1.5 Pro突破性地實現了最高可達1000萬token的處理能力。到2025年2月發布的Gemini 2.0全家桶,最強Pro版本可支持到2M上下文。

其次,外部記憶系統的引入推動了大模型記憶能力的發展。如IBM WatsonX的實時知識圖譜更新功能使得在醫學診斷等特定領域的記憶準確率提高了35%。持續學習機制方面,Meta的LoRA-X架構通過參數隔離技術降低了多任務干擾,OpenAI則部署了分布式記憶訓練系統,使百萬設備協同進化,提升了記憶系統表現。在記憶檢索方面,Anthropic的ContextRouter模塊和微軟的MAVEx系統分別通過動態記憶權重分配和跨模態聯合檢索,優化了記憶檢索的準確性與效率。

第三,隱私與安全問題也得到了關注,Google推出的Memory Provenance框架增強了記憶的透明度和可控性,而HuggingFace的SafeMemory工具包通過差分隱私技術將隱私泄露的風險大幅度降低。這些技術突破使大模型的長期記憶能力得到了顯著提升,推動了多個領域的應用發展。

2025年,大模型的長期記憶技術將迎來新的發展趨勢。如混合窗口架構或將成為上下文處理的新范式,能夠根據任務需求動態調整局部和全局注意力的范圍,大幅度提升處理效率。隨著多模態技術的進步,跨模態記憶融合將在視頻、文本、觸覺和嗅覺數據的編碼上取得突破,進一步提升模型的記憶能力。記憶權限管理和記憶遺忘機制將更加成熟,為隱私和安全提供更強保障。

此外,隨著用戶對個性化和定制化的需求不斷提升。個性化記憶系統能夠根據用戶的特定需求、偏好和行為習慣構建專屬的記憶圖譜。例如,AI助手可以記住用戶的興趣、常用的命令、偏好的回答風格等,從而提供更加精準和符合需求的回復。2025年,個性化記憶系統也將成為大模型發展的重點方向,大模型能夠根據用戶需求構建專屬記憶圖譜,提高個性化回復的準確性,并通過跨設備記憶同步實現實時更新。

不過,盡管大模型在長期記憶方面取得顯著進展,但仍面臨技術挑戰,包括記憶沖突解決、多來源記憶的置信度評估體系、能耗瓶頸和認知偏差防控問題。商業應用方面,醫療、教育和金融等行業將受益于大模型長期記憶能力的提升,預計能夠降低誤診率、提升知識留存率并加速風控響應速度。

趨勢四:合成數據或加速大模型訓練

隨著人工智能技術的飛速發展,數據成為推動AI進步的核心資源。2025年,合成數據作為加速大模型訓練的一種重要方法,正在成為AI發展的關鍵趨勢。馬斯克在2025年CES(消費電子展會)的訪談中提到,隨著人類累積的知識幾乎被AI訓練完畢,未來的AI系統將不得不依賴合成數據進行自我生成和學習。這一觀點突顯了合成數據在未來AI技術發展中的潛力。

目前,多個科技巨頭已經開始在AI模型訓練中廣泛應用合成數據。微軟、Meta、OpenAI和Anthropic等公司紛紛將合成數據作為增強模型訓練效率和拓寬訓練數據源的有效手段。例如,2024年下半年發布的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均報告了使用合成數據進行訓練。根據科技市場研究機構Gartner的預測,到2024年,AI及分析項目中使用的數據中,60%以上將來自合成數據。合成數據能夠幫助AI系統在真實數據難以獲得或標注成本過高的情況下,生成具有代表性且符合特定任務需求的數據,大幅降低了對實際數據的依賴。

然而,合成數據的使用仍然面臨諸多挑戰與爭議。2024年7月,《Nature》期刊刊登的論文指出,LLM生成的合成數據可能會污染下一代模型的訓練集,導致模型性能下降,甚至發生“崩潰”。這一風險類似于“數據中毒”問題,嚴重時可能讓模型無法做出有效的推理和判斷。英偉達也發布了其Nemotron-4 340B開源模型,聲稱使用了98%的合成數據,但同時也強調需要加強合成數據的質量控制,以避免潛在的負面影響。

盡管面臨風險,但合成數據在加速大模型訓練方面的潛力仍然巨大。尤其在高性能計算和多模態數據融合等領域,合成數據可以快速擴展訓練集的規模,并提供更多樣化的訓練情境。為了應對合成數據帶來的挑戰,AI研究者正在不斷優化生成數據的質量和多樣性,例如通過強化學習算法對合成數據進行校正,或者結合人類監督和自動化評估機制來減少“數據污染”風險。

展望未來,隨著技術的不斷進步,合成數據有望成為AI訓練中的重要組成部分。它不僅能加速模型的訓練過程,還能在數據匱乏或難以獲取的領域,為AI發展提供新的動力。

趨勢五:大模型普及加速,效率躍遷曲線下成本更低了

在2025年1月,Anthropic的CEO-Dario Amodei 發表了一篇長達萬字的深度分析報告??隙薉eepSeek的技術突破:其最新模型在特定基準測試中已逼近美國頂尖水平,并嘗試從三個維度將中國的AI進步納入全球技術演進坐標系進行定位:算力規模定律、效率躍遷曲線、范式革新動能。

這些維度的選擇反映了他對國產AI評估方面的理解:關注硬件和計算能力的提升(算力規模定律),技術的效率提升(效率躍遷曲線),以及新技術范式的創新和推動力(范式革新動能)。這種全方位的定位方式,能夠精準捕捉到AI大模型在全球技術演進中的角色及潛力。具體我們解釋下這三方面的重要性和趨勢:

首先,規模定律是推動大模型發展的基礎。隨著硬件技術不斷進步(如更強大的GPU、TPU和專用AI芯片),訓練超大規模模型已變得越來越可行,同時也驅動了云計算和分布式計算的發展,進一步降低了成本。隨著更強大的計算資源的普及和優化,規模定律將繼續提升,這是2025年AI大模型的關鍵能力趨勢之一。

其次,關于效率躍遷曲線,曲線偏移指的是技術創新帶來成本曲線的變化,使得原本高昂的訓練成本能夠通過硬件優化、模型架構改進等手段大幅降低。這不僅能夠降低AI研發的門檻,還能加速技術迭代。比如2024年,硬件創新如量子計算、專用AI加速芯片推動AI訓練成本的快速降低。同時,AI框架的優化(如更高效的深度學習框架)和算法改進幫助實現了更少計算資源的更高效訓練。

在前文中我們也提到了,目前對于AI基礎設施方面軍備競賽激烈,低成本做法漸成趨勢,尤其是DeepSeek通過采用OpenAI等先進模型,利用蒸餾技術將其知識轉移。這一過程使得DeepSeek能夠在保持較高性能的同時,顯著減少訓練所需的計算資源和時間。通過模仿OpenAI模型的輸出,“學生模型”能夠快速學習復雜的模式和推理能力,加速模型的優化過程。2025年,隨著硬件和算法的進一步突破,AI開發成本將大幅下降,這也使得更多的中小型企業可以進入AI領域。

此外,新的訓練范式(如強化學習、無監督學習等)正在改變AI的學習方式。2020到2023年,AI主要依賴預訓練模型,使用大量互聯網文本進行訓練,并通過少量額外訓練進行微調。然而,到了2024年,強化學習(RL)成為新的重點,通過強化學習生成思維鏈,AI在數學、編程和推理等任務上的表現顯著提升。初期階段投入較少,但效果顯著。

強化學習和自監督學習等新興范式逐漸在機器人、自動化和多模態學習領域得到應用,尤其提升了機器人在動態環境中的自主學習和決策能力。到2025年,這些新訓練范式預計將成為AI發展的主流,尤其在復雜任務處理上(接下來趨勢六我們會進一步解釋)。

趨勢六:預訓練到后期訓練和推理遷移轉變

2024年是AI技術飛速發展的一年,尤其是在大語言模型(LLM)和多模態技術方面取得了顯著突破。這一年,AI從單一模態向多模態融合邁進,大語言模型通過擴展上下文窗口和采用混合專家架構(MoE)等技術,顯著提升了推理和生成能力。同時,強化學習(RL)開始與大語言模型結合,為模型的泛化能力提升提供了新的方向。此外,AI在醫療、金融、自動駕駛等領域的應用不斷深化,推動了行業變革。然而,隨著模型規模的擴大,預訓練階段的性能提升逐漸放緩,行業開始探索后訓練和推理遷移的新模式。

2025年,AI技術將進入一個新的發展階段,Scaling Law的擴展將成為關鍵趨勢之一。強化學習與大語言模型的結合(RL+LLMs)將進一步推動模型泛化能力,從預訓練向后訓練和推理遷移轉變。

這種模式將使AI在特定場景下的表現得到顯著提升,同時降低訓練成本,提高模型的適應性和靈活性。此外,AI將在更多領域實現落地應用,如智能駕駛、具身智能等,這些領域將迎來技術突破和商業化的加速,但也與此同時會帶來更多的安全和風險管理挑戰。因此,AI安全和治理將成為行業關注的重點。

需要強調的是,大規模語言模型(LLM)的預訓練階段已經接近瓶頸,主要受到數據、計算資源和模型規模增長的限制,且在通用性提升上邊際效益遞減。部分研究人員和行業專家擔心,對于大規模語言模型而言,傳統擴展方式已接近極限。生成式AI已遇瓶頸。據外媒報道,像OpenAI這樣的公司在擴大技術應用時也發現困難重重,其他前沿實驗室也面臨更嚴重的挑戰。知名數據科學家Yam Peleg透露,一些實驗室試圖通過延長訓練時間和增加數據量來提升模型表現,但結果卻遭遇了“收益遞減墻”,且情況比公開報道的更為嚴重。

不過,盡管如此,預訓練依然為模型奠定了基礎,后續的優化潛力巨大。因此,在后訓練階段(如微調、強化學習、多模態對齊等)依然存在許多優化機會。通過領域特化、任務指令優化、模型壓縮等技術,可以提升模型在特定任務上的表現,同時提高其在資源受限環境中的部署效率和安全性。

趨勢七:更多優化算法將被用于強化學習等領域

目前,深度強化學習(DRL)的優化算法在多個行業取得了應用突破。為了解決傳統強化學習在高維度問題上訓練困難的問題,研究者采用了更加高效的算法,如模仿學習和分層強化學習,顯著提升了模型的學習效率和訓練速度。比如Google DeepMind 推出的AlphaDev系統由兩個核心組成部分構成:學習算法和表示函數。學習算法是在先進的 AlphaZero 算法基礎上進行擴展,結合了深度強化學習 (DRL) 和隨機搜索優化算法,以執行大規模的指令搜索任務。

此外,RLHF(強化學習與人類反饋結合)的應用開始更加深入和精細。AI大模型開始通過更精確的人類反饋進行訓練,從而能夠更好地理解復雜任務,并且在人機交互中表現出更高的自適應能力。例如,OpenAI的ChatGPT通過用戶的實時反饋不斷優化對話能力,以提供個性化和上下文相關的回答。由于RLHF能顯著減少對大規模標注數據的依賴,更多AI系統開始通過少量高質量的人工反饋來進行高效訓練,從而降低了模型開發和訓練的成本。

還有近期處于話題焦點的DeepSeek,R1模型通過強化學習(RL)和基于人類反饋的強化學習(RLHF)進行訓練,并針對核心算法模塊做了大量的優化處理:比如改造 Attention 模塊,通過低秩壓縮,讓KV Cache的效率達到最優。以及通過訓練架構瘦身—例如GRPO算法通過省去傳統強化學習中必須的Critic模型(即”雙引擎”設計),將復雜算法簡化為可落地執行的工程方案。一般傳統的強化學習模型通常采用這雙引擎”設計——Actor和Critic,Actor負責執行決策,Critic評估Actor的決策效果,二者需要同時進行訓練,這增加了計算量和訓練復雜度。通過去除Critic模型,GRPO算法能夠簡化模型結構,降低計算資源的消耗。

隨著AI應用場景的多樣化,簡化算法架構將成為AI發展的重要方向。2025年,更多優化算法(如GRPO等)將被用于強化學習等領域,以減少計算資源的消耗,同時提高模型的執行效率和實時響應能力。

隨著硬件資源的不斷提升和算法的進一步優化,像GRPO這樣的輕量級強化學習算法將被廣泛應用于邊緣計算和低資源設備上。例如,智能設備、物聯網設備和機器人等領域,都會受益于這種簡化的算法,實現在硬件條件有限的環境中高效運行。

趨勢八:低成本訓練與AI倫理,知識產權成為核心議題

春節期間,DeepSeek的DeepSeek-R1震撼了全球科技圈和資本市場,其基于知識蒸餾技術,成功將大型復雜模型的知識遷移到較小模型,實現高效部署。2月6日,斯坦福大學李飛飛團隊和華盛頓大學研究人員以不到50美元云計算費用,成功蒸餾出一個名為s1的新推理模型,表現與OpenAI的o1和DeepSeek的R1相似,展示了蒸餾技術的強大潛力?;诟偁帀毫Γ?月7日,OpenAI公開了o3-mini的推理思維鏈,但該推理思維鏈并非原始數據,OpenAI產品官Kevin Weil表示會找到平衡方式以避免被競爭對手蒸餾。

Kevin Weil的考慮出發點在于,蒸餾通常依賴于將一個較大模型的知識提取出來,并將其遷移到一個更小的模型。如果目標模型能夠有效地從源模型中獲取有用的知識,且沒有太大的性能損失,那么理論上,很多模型都可以通過蒸餾技術進行簡化和優化。因此,隨著AI蒸餾技術的普及,相關的法律和監管框架也需要不斷加強,以確保在模型開發和應用過程中不會侵犯知識產權或數據隱私。

這種低成本訓練的模式也引發了業界關于AI模型知識產權和倫理問題的討論。隨著越來越多的研究依賴于現有基座模型進行微調,是否應當給予這些基座模型開發者相應的回報成為一個重要議題。同時,如何確保AI技術的公平使用和共享,也亟待業界深入探討和解決。

#04 下一個殺手級應用,可能在消費領域

趨勢一:越來越多企業從人工智能上掙到錢

過去的2024年,是生成式AI的落地之年。而2025年,則是這些企業級AI應用在已有的落地場景中深入發展的一年。

美國風險投資機構Menlo Ventures在統計了600家美國企業的IT支出(包括模型支出、訓練&部署支出、AI應用支出,不包括芯片、云計算等支出)情況后發現,2024年企業的AI相關支出達到了138億美元,相比2023年的23億美元增長了超過6倍。在這其中,應用支出的增速最快,6億美元增長到了2024年的46億美元。

數據來源:Menlo Ventures

企業AI相關支出的提高,讓不同的行業間接獲益。第一個受益的是咨詢公司。2024年,埃森哲和IBM等咨詢公司正在實現大幅的收入增長,其中,與人工智能相關的服務對其營收增長貢獻顯著,客戶希望通過咨詢,了解實施人工智能能夠獲得的競爭優勢。根據埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨詢預訂額近 30 億美元。

第二個從人工智能中獲益的行業是云計算和軟件公司。軟件公司ServiceNow自推出 “Now Assist” 以來,報告了強勁的生成式人工智能預訂量,其首席財務官表示,在新產品系列中,最大新增年度合同價值貢獻,來自于人工智能的采用。另外,軟件巨頭甲骨文的基礎設施即服務(IaaS)部門實現了強勁增長,這在很大程度上歸因于人工智能工作負載的增加。數據中心的領導者Equinix也因為人工智能基礎設施需求獲得了大量新合同。

另外,廣告行業也從人工智能使用中獲益。根據Meta Platforms最近報告,在人工智能的加持下,其廣告展示量增長了7% ,每廣告的平均價格增長了 11%,季度收入同比增張了19%。

亞馬遜集成了基于生成式人工智能的產品圖像生成工具,導致某些廣告活動的廣告展示量顯著增加。我們預計,隨著人工智能服務需求的擴大,具有獨特市場定位、強大分銷渠道和特權數據訪問權限的云計算、軟件應用和基礎設施公司將成為主要受益者。隨著人工智能市場的成熟,這些科技巨頭可能在 2025 年實現加速增長。

我們嘗試總結了生成式AI滲透率最高的幾個應用場景:AI代碼、AI客服支持和企業級搜索。

● 最高的是AI代碼應用,企業對AI代碼應用的采用率達到了51%,比如,頭部產品 Github Copilot 的ARR(年度經常性收入,是指企業每年從客戶那里獲得的或期望從客戶那里獲得的服務或產品回報的收入計算)達到了3億美金也真實的反應了用戶的需求。Cursor、Cognition 等新興工具在迎來用戶快速增長的同時,也獲得了資本市場的火熱追捧。

● 其次是AI客戶支持,其采用率達到了31%,產品為內部員工或外部用戶提供基于產品知識的客戶支持。Sierra、Decagon 等初創借力生成式AI的智能,為用戶提供符合品牌調性和消費者畫像的定制化客服體驗,挑戰低效、無趣的傳統客服。

● 第三是AI數據檢索,其采用率達到了28%,這類應用幫助企業解鎖和利用分散在各組織中的數據,將數據孤島中的寶貴知識管理利用。例如一家初創企業Glean,其業務是企業級搜索,旨在為企業打造內部的Google,核心產品 Glean Assistant 的用戶每天平均查詢 14 次,遠超Google的日均查詢次數。在過去一年ARR(年經常性收入,Annual Recurring Revenue)達到了5500萬美金。

數據來源:Menlo Ventures

2024年,企業60%的AI應用支出來自企業創新業務的預算,說明企業使用這些應用的態度以嘗試和探索為主,生成式AI在企業應用場景中的落地尚處于早期階段。接下來,隨著企業未來各個部門對于生成式AI應用的預算持續增長,哪些生成式AI應用能為企業帶來實實在在的回報率,哪些或將分得持續性更長、規模更大的預算,從而支持生成式AI應用生根發芽、斬獲1億美金甚至更多ARR。

① AI Agent正在給企業帶來效益

2025年,生成式AI應用正在生根、發芽,給企業帶來實實在在的現金回報,基于這樣的趨勢,AI Agent將是這個商業環節閉環的關鍵。

AI Agent從學術走向商業落地,僅花了三年時間。

AI Agent的第一波高潮來自2023年年初,AutoGPT的火爆,所謂AutoGPT,其實是把學術圈很多的Agent idea簡單呈現出來,盡管其讓開發者感受到大模型的強大,但很快大家便發現,AutoGPT的實驗性強于實用性,難以解決大部分的實際問題。第二波高潮來自2023年9月,AgentGen,通過構建不同職能的Agent,分工協作。

到了2024年,AI Agent開始從實驗走向現實。

2024年末,OpenAI首席執行官Sam Altman提出了AGI(通用人工智能)的五層框架:

  • Lv1 – Chatbot,具備基礎的對話能力,能夠理解和回應簡單的文本輸入
  • Lv2 – Reasoner,具備基本的邏輯推理能力,能夠分析復雜信息并進行推斷
  • Lv3 – Agent,具備理解復雜指令的能力
  • Lv4 – Innovator,具備創新和創造的能力
  • Lv5 – Organizer,具備協調和管理龐大系統、資源和團隊的能力

他提出,如今我們正處于第二個階段并非常接近第三個階段的狀態。

Lv3的Agent智能體能夠自主與環境交互、收集信息,具備持續規劃并執行多步驟、長時間任務的能力。要達成這個階段,需要一個推理能力、邏輯能力更強的模型(可能是o1的下一個版本、也可能是對標o1的開源模型)。同時,服務AI Agent應用的基礎設施也必不可少。

當下,企業出于安全性、準確性、穩定性等因素的考量,更傾向于使用 AI Copilot (人在回路中參與)增加人在工作流中的效率,而不是直接采用端到端自動化 AI Agent。隨著底層模型能力和Agent框架開發的持續升級,Agent應用將為企業提供更智能高效的數字員工。人與AI的協作關系將從AI賦能人工作,逐漸轉變到人監督指導AI完成工作,最終達到AI自主完成工作。這個轉變會在未來幾年迅速發生。

至于適合AI Agent最先產生價值的應用場景,2025年大概將延續現階段生成式AI滲透率高的場景,例如代碼編程、客服、銷售、營銷等。

根據第三方機構Menlo Ventures的調查數據顯示,企業內各部門的生成式AI預算劃分中,IT部分獨占鰲頭(22%)、產品和工程開發次之(19%),客服(9%)、銷售(8%)和營銷(7%)緊隨其后。

數據來源:Menlo Ventures, UpHonest Capital

根據硅兔賽跑的觀察,一些企業的確正在從這幾個場景中賺錢:

IT部門選擇之一的初創公司Glean,在2024年9月份完成新一輪融資,估值達到46億美元,其旨在優化企業內部數據檢索和問題答復。

在產品和工程開發部門依賴的AI編程應用中,初創公司Cognition在2024年3月推出了首個AI程序員Devin,成立僅6個月就達到了20億美金估值。同年12月其Agent產品Devin正式上線,區別于普通的代碼補全應用,Devin能夠無需人類參與進行自主編碼,完成需要人類工程師參與的項目開發。目前 Devin擁有諸多頭部客戶:例如Ramp 使用Devin 編寫測試代碼并清理死亡代碼,MongoDB使用 Devin 更新過時的代碼架構。

硅谷投資機構UpHonest Capital早期投資的Cosine,正在打造全自動的AI軟件開發助理Genie,曾在SWE-Bench測試中獲得全球最高分數。Cosine 研發了獨有的數據管道,能夠生成具有人類工程師開發邏輯、增量知識、支持搜索的高質量數據集。同時,Cosine是OpenAI最大的模型微調合作伙伴,擁有其前沿模型的早期使用權限。結合數據和模型優勢,Cosine已經與多家世界500強公司和明星初創公司達成合作。

客服作為人力密集型工作,也將成為AI Agent最先顛覆的環節。比如UpHonest Capital早期投資的Proactive AI 正在為零售品牌打造具有高情感智能語言能力的客服助理,主要幫助企業向其用戶提供契合品牌調性和個性化需求的客服服務,目前已與餐飲、健身、沙龍等行業多家頭部企業達成深度合作。

銷售和營銷作為企業開源的重要入口,企業利用最新技術提高獲客效率的意愿也非常高。美國的人工智能初創公司11x,打造AI驅動的“數字工作者”以取代傳統的銷售團隊,其Agent能夠自主執行GTM工作流程。11x不通過軟件幫助企業降本增效,而是直接提供實在的工作成果,數字員工能夠自主實現完成的收入閉環。11x成立6個月就達到了200萬美金的ARR,目前ARR已經達到了1,000萬美金。FlashIntel正在打造AI驅動的GTM平臺并向企業提供AI驅動的銷售助理(SDR)。FlashIntel在G2 2024冬季報告中總計獲得了189枚徽章,其中FlashRev被評為最佳銷售產品,最佳營銷和數字廣告產品,以及最高滿意度產品。

② 在數字化滲透率低的傳統行業有隱藏的“金礦”

曾經,傳統行業的玩家對AI嗤之以鼻,過高的投入成本和微不足道的效果,讓他們難以對AI押注過多。

不過這一次,傳統行業的生成式AI之路,有可能跳過軟件階段,直接進入AI階段,類似新興市場從使用現金直接轉向移動支付。

這些行業本身對于科技的采用速度較慢,生成式AI的出現帶來了直接交付結果而非交付軟件的模式,減少了前期投入成本、肉眼可見的提升了投資回報率,使得恐懼新技術的決策者更容易被說服。比如醫療領域的病例記錄、法律領域的案件報告生成、金融行業的合規風險篩查等等。

2024年12月,美國家政垂直軟件巨頭ServiceTitan上市,上市當天股價漲幅超過40%,在2024年上市公司中,該漲幅僅次于社交平臺Reddit和芯片公司Astera Labs兩家。

要知道,ServiceTitan 2012年成立,歷經12年發展,在僅拿下家政行業1%市場份額的情況下,其市值一度達到90億美元。由此可見,美國垂直行業,數字化滲透速率之低,垂直行業AI化的價值之高。ServiceTitan之成功,自然使我們關注到美國傳統行業的機會,數字化滲透率低的傳統行業。

美國初創公司Sameday為美國家庭服務行業(除蟲、HVAC、家庭維修等)提供AI銷售代理,通過自動化的語音客服接聽來電并安排服務預約,提高電話接聽率,從而提高轉換率,現在已經與ServiceTitan集成。Sameday的創始人曾在美國增長最快的家庭服務行頭部公司擔任CMO,擁有極深的行業認知和豐富的行業資源。2024年,Sameday的ARR預計將增長5倍以上,月度客戶留存率達98.5%。

建筑行業的AI解決方案提供商Pantheon,能夠生成高精度且可編輯的 3D 建筑模型,通過AI實現更快的設計迭代周期可以顯著降低項目成本。Pantheon AI不向建筑師出售軟件許可證,而是直接向房地產開發商和業主出售其設計服務。2024年10月,Pantheon AI完成了由a16z領投的2500萬美金種子輪融資。

傳統行業以外,法律、金融、醫療行業積累了大量數據,為行業垂直基石模型訓練提供了豐富的燃料,且法律、金融、醫療行業價值高,但普遍在傳統軟件巨頭的壟斷下變化緩慢。即便垂直SaaS一定程度上取代了過時繁瑣的老系統,但總體的滲透率依然有限。以醫療行業為例,其行業規模高達4.3萬億美元,貢獻了約1/5的美國GDP。但在美國市值前100的上市軟件公司中,只有一家是服務醫療行業的軟件公司。

2024年,Evenup ARR預計將達到5000萬美金,最新一輪的投后估值達到了10億美金。Evenup 利用生成式AI幫助律師進行人身損害賠償(Personal Injury Claims)案件的索賠工作。雖然目前只服務于人身損害賠償這一個領域,但這已經是一個非常大的市場了。美國每年約有30萬參與處理人身損害賠償的律師,每年支付給受害者的索賠金額高達1000億美金。

有備而來者,率先享受紅利,那些垂直行業專家、對行業的工作流有深入認知的創業者,結合不斷進化的生成式AI基礎設施,有機會迅速搶占用戶,構建自身的行業數據壁壘。

③ AI不再按席位收費 :“Sell work, not software”

Menlo Ventures的調查數據顯示,企業在進行生成式AI產品采購決策時,第一考慮要素是產品是否具有簡單可測量的投資回報率,其次是產品是否根據實際應用場景定制。

值得注意的是,現階段,產品價格反而是最不重要的影響因素,僅1%的企業決策者聲稱產品價格影響采購決策。

數據來源:Menlo Ventures

結果正在變得更為重要。隨著AI的獨立工作能力提升,其工作結果、創造的價值會更容易被量化,企業對AI產品的價值評估,也會根據其工作成果界定,美國投資機構a16z提出。因此,商業模式變得更加重要。

SaaS時代,SaaS公司創新了按席位收費的商業模式,即按照使用SaaS產品的員工賬號數量按月或按年收取訂閱費用,這種定價方式背后的邏輯是,使用SaaS產品的每位員工,效率會有不同程度的提升、處理更多工作,許多SaaS定價的策略在于評估使用者效率提升創造的收益。

但到了生成式AI時代,這個SaaS時代一直以來賴以生存的邏輯正在被顛覆。隨著Copilot產品向Agent產品的升級,未來的Agentic AI系統將在不同AI agents的相互配合下,自動完成任務,取代越來越多的工作者,顯然,如果繼續按照席位收費,開發者的收入則會逐漸減少。

Benchmark合伙人最先建議生成式AI公司“Sell work, not software”,即按照工作成果收費,打破按席位收費的模式。

基于此,目前原生AI公司普遍采取的商業模式分為兩類,一類是基于用量的定價模式,Salesforce發布的Agent force智能體系統,提供客服、銷售、員工服務等AI agent智能體,按照用戶與agent實際交互的用量收費,每次”對話“收費2美元,如果發生以下三種情況之一,即視為一次”對話“結束—— AI agent無法滿足用戶需求,需要人工介入;用戶主動結束與AI agent對話;用戶超過24小時沒有再主動與AI agent對話。

另一類是基于工作結果的定價模式,前Salesforce聯席CEO Bret Taylor創立的AI客服公司Sierra,為客戶提供基于工作結果收費的客服AI agent,從消費者滿意度、問題解決程度、以及每次的交互成本三方面來評估工作結果,決定企業付費規模。采用按照工作結果定價的模式,實現了AI agent企業客戶與開發公司的利益一致性,雙方將共同得益于agent獨立任務完成能力的提升。

趨勢二:等待一個“殺手級”AI消費級應用

“2025年(AI應用)下一個大事件屬于消費?!泵绹t杉資本合伙人Jess Lee表示,AI聊天、圖片、視頻已驗證了其消費市場潛力,接下來將看到全新的AI消費社交APP、新形式的互動媒體、基于聊天的游戲、新的搜索和信息整合工具、基于互動式UI的聊天工具等?!?/p>

消費賽道,一直是歷次技術創新浪潮下創業者和投資人高度關注的方向,如果回顧之前的技術周期會發現,全球市值Top15的科技公司中,有9家是從To C消費產品起家的。To C的公司上市時,估值超過100億美元的比例,比To B公司高10%左右。

但在這一波生成式AI創業浪潮中,消費AI應用似乎在被創業者和資本遺忘。2024年,90%以上的A輪融資流向AI企業應用。

不過,自2024年下半年以來,這個現象正在發生改變。

2024下半年以來,資本市場對消費級AI應用的關注度上升,以硅谷孵化器Y Combinator 為例,其下半年孵化的消費級AI產品數量比上半年翻番。

數據來源:Y Combinator, UpHonest Capital整理

2025年,消費級AI應用的“土地”正在被開墾,行業在等待一個“殺手級”AI消費的應用。風險投資機構也對消費級AI應用的機會產生共識。YC Partner Michael Seibel表示,目前太多創始人尋找B2B的AI機會,太少人探索消費側的機會,消費創業者的機會來了;a16z提出“生成式AI或將重塑從旅游、心理治療到網購等一切(消費行為)?!扒癐ndex Ventures合伙人Rex Woodbury,稱現在是“消費復興”的機會。

生成式AI對消費端改變,體現在三個層面:首先,AI會逐漸改變人與人、人與信息交互的方式,形成新的流量入口;其次,AI搜索正在改變信息的分發方式,會創造新的商業機會;第三,AI釋放PGC、UGC內容創作潛力,使內容消費更加豐富多元。

以AI搜索為例,作為線上流量的第一入口,已經久無戰事,生成式AI引入了新變量。2020年創立的生成式AI搜索初創You.com,近期完成5000萬美元融資,價值7億美元了。OpenAI在7月發布AI搜索工具SearchGPT,其付費用戶均可使用。

Perplexity是一家成立于2022年8月的美國AI創業公司,公司由前OpenAI研究科學家Aravind Srinivas和前Meta研究科學家Denis Yarats等聯合創立,專注于開發基于人工智能的對話式搜索引擎,旨在通過大型語言模型(如GPT-4和LLama2)為用戶提供精準的搜索結果。Perplexity的界面更像是聊天屏幕,用戶可以通過自然語言提問,Perplexity會提供直接的答案,并附上詳細的引用來源,Perplexity 的用戶增長非常迅速。2023年2月,Perplexity的月訪問量達到1000萬,獨立訪客達到200萬人。截至2024年4月,Perplexity 的月活躍用戶數便突破了1500萬。Perplexity在短時間內完成了多輪融資。截至2024年11月,Perplexity在新一輪融資中籌集了5億美元,使公司估值達到90億美元。投資方包括軟銀、亞馬遜創始人貝索斯和英偉達等多家知名企業和AI領域知名人士。

除了通用搜索引擎,生成式AI使垂直領域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企業知識數據庫的搜索——Glean在9月份完成新一輪融資,估值達到46億美元,旨在優化企業內部數據檢索和問題答復,在近兩年中ARR翻倍增長;亞馬遜、沃爾瑪都在加強電商搜索引擎建設,今年先發搜索助手,再發Agent。初創企業DayDream種子輪拿到了5000萬美元投資,Forerunner、Index聯合領投。DayDream鏈接了超過2000+品牌,支持自然語言檢索,根據用戶提供的時間、地點、場合等信息給予相關產品推薦。Encore,YC24新一期孵化項目,是一個LLM驅動的針對二手商品購物的搜索引擎,鏈接美國多個二手商品網站,支持自然語言搜索以及按照主題的搜索;垂直于科研場景的搜索:初創企業Consensus與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務科研的搜索引擎,改變人們獲取和使用學術文獻的方式。2024年收入增長了600%,月活40萬用戶,ARR近200萬美元。

也許明年會出現更多令人眼前一亮的垂直領域的AI搜索創新。

這一點,美國紅杉在2025年的AI趨勢預測中也分享了一些思考,紅杉提出AI搜索或將成為2025年的”殺手級“應用,他們提出了兩點預測:目前一個整體的搜索市場可能會碎片化,未來每個人可能會有專業AI搜索引擎——例如,Perplexity可能會成為投資人和分析師的第一搜索工具選擇,律師選擇Harvey,醫生選擇OpenEvidence……全新的生成式AI搜索引擎將緊密契合目標用戶的“心智模式”,投資人、律師、醫生的思維模式各不相同,信息獲取模式、目的和決策思維各有差異,這些不同和差異就是生成式AI搜索引擎創新的機會;消費級和企業級應用場景分化,每位知識工作者每天至少會使用兩款AI搜索引擎 —— 一款用于工作,另一款用于其他所有事務。

除了AI搜索,落到電商、音樂、社交、游戲、旅行和教育等直接To C的領域中,也各有生成式AI原生應用的創新機會。

以旅行為例,Wanderboat是面向消費者的AI旅行規劃工具,也是旅游內容分享社區。它構建了一個chatbot,可以根據用戶需求推薦、定制目的地及各類娛樂體驗活動,還可以主動學習用戶的興趣,定制專屬行程?;趧撌既舜饲霸谖④浀慕涷灒瑯嫿艘恍┖苡腥さ男」ぞ?,比如用戶在查看地圖時也可以與AI互動,實時獲取一些信息和建議。在零付費推廣的情況下,月活用戶數量達到了6位數。

一是多模態AI營銷,從文字延展到音頻、視頻。形式從單點的chatbot延展到具有操作執行能力的agent,并且準確率和對于邊緣案例的覆蓋力隨著基石模型推理能力的提升增強。此外,如果生成式AI運用得當,銷售、營銷、客服對消費者的洞察進一步提高,可以創造更加個性化的服務、定制化體驗。

GigaML是YC孵化的一家AI客服初創,雖然這個方向競爭激勵,但實際GenAI應用的滲透率還比較低,因為客服在實際工作中有許多邊緣案例,現在大部分的GenAI應用解決邊緣案例的表現一般,原有的自動化客服足以解決基礎問題,所以企業升級的動力不足。GigaML發現將基石模型切換至o1-preview,加上大量的評估、調優之后,錯誤率大幅下降,從70%降至5%,并能夠解決8成的邊緣案例。在OpenAI最新推理模型加持下,客服用例值得期待。

Para和HeyGen分別是聲音和視頻營銷的典型案例,Para利用AI生成個性化定制的聲音營銷電話,幫助品牌激活用戶,幫助球隊活躍粉絲;HeyGen的AI視頻營銷收入快速增長,據悉今年的年化ARR超過2000萬美元,估值已達到5億美元。

AdsGency則是一個利用AI用戶數據洞察,實現精準廣告營銷的公司,創始人此前曾在滴滴、亞馬遜從事廣告、營銷相關的產品工作。它的業務核心是廣告和用戶數據,為客戶提供了一個全棧AI營銷工具,覆蓋內容創意、創作、投放、歸因等流程。AdsGency也代表了現在AI營銷的一個發展趨勢—— 從Point Solution,到整個GTM的全流程自動化解決方案。

趨勢三:企業應用大模型朝模塊化方向發展

2024年,人工智能領域的一個顯著趨勢是模型的可組合性和模塊化發展,這種模塊化實現了從概念到規?;芈涞?。企業不再僅依賴于單一的“大模型”解決方案,而是可以根據具體需求,將不同的模塊進行組合,定制出符合自己業務需求的能力。這種靈活性不僅能夠提升效率,還能降低成本,并且更好地滿足各行業對AI應用的多樣化需求。

在技術架構層面,傳統“大一統”的大模型被逐步拆解為功能與場景模塊,例如Amazon Bedrock提供了一系列生成AI的模塊化服務,涵蓋文本生成、圖像生成、語音合成等功能,這些模塊化的服務可以幫助企業根據自己的需求進行定制,支持跨行業的AI應用,如生成個性化的營銷文案、產品推薦和自動化客服對話等服務。微軟推出了更加精細化的模塊化API,支持更加多樣化的場景,例如多語言客服、智能會議助手和自動化客戶反饋系統。Transformer論文八位作者之一Aidan Gomez也瞄準這一方向,估值55億美元的Cohere提供專為企業用例優化的系列AI模型,在語言生成、多語言處理、多模態、語義檢索等方面各有所長,企業按需選擇、組合。

2025年,模塊化和抽象化設計將在多個領域得到廣泛應用,特別是在人工智能和機器學習領域。這種設計方式將推動AI系統的高效演化和自適應能力,為AI技術的廣泛應用提供更強大的支持。根據Gartner預測,到2028年,至少15%的日常工作決策將通過代理AI自主做出。

這種趨勢表明,模塊化和抽象化設計將為AI系統的自主決策提供更強大的支持,推動AI技術的廣泛應用。并且,更多的技術企業將推出專為行業需求定制的AI模塊。例如,針對智能制造、智慧醫療、自動駕駛等領域的具體需求,可能會出現更加精細化的模塊組合,企業可根據自己的數據和業務需求靈活選擇。而且隨著硬件能力的提升,這些模塊可能會更加高效,甚至實現更高的跨領域協同能力??傊?,這種模塊化大模型的發展將向縱深推進,技術、商業與社會的多重博弈將重塑行業格局。

#05 總結

這場科技商業史上最大“賭局”,讓身處其中的投資者越來越感受到了曾經硅谷早期的投資氛圍——押注一個未知的全新技術、等待一個超長回報周期,而不是基于互聯網成熟技術的模式創新上迅速迭代和回血。

自從ChatGPT發布之后,硅谷正在吸引全球的目光。關注硅谷發生的故事,正在成為眾多的中國投資者甚至中國企業員工、公關必做的事,大家試圖從這些持續關注中獲得最前沿的信息和生成式AI最前線所發生的故事,從而試圖判斷新的商業方向。

誰也不知道這場生成式AI的變革會將商業引向何方,也同樣預測不到新技術的迭代如此之快。

在過去的幾年里,聽到最多的便是企業對生成式AI的抱怨“我們知道它重要,但我們仍然不知道如何用在自己的場景中”,這種抱怨帶著一些敬畏——“不上大模型一定會被淘汰”。投資者在不斷推高的估值和融資中,快要喪失信心。動輒幾十億美金的融資,再加上Scaling Law之下,不斷增加的數據中心的投資,讓他們望而卻步。這也表明,2025年將是生成式AI讓人們看到賺錢希望的一年,投資者和創業者同樣需要信心。

AI Agent元年,這個發端于學術界的概念將會落到實際,并產生價值,企業將會使得生成式AI變得更加好用,并切實轉化為價值。與此同時,消費級的AI應用將會讓人們切實感受到生成式AI帶來的生活的變化。

垂直領域的模型正在成為通用大模型的補充,讓更多企業釋放AI的價值。垂直行業中,將會出現越來越多的AI搜索應用,滿足人們不同領域的需求。

2025年,從生成式AI來說,一些泡沫會破滅,一些企業能夠從中賺到錢。技術新陳代謝快速而殘酷,這場競爭中沒有老手,都是新人,昔日的領軍者亦有可能跌落神壇,最先關注到技術和商業的變化,并做出行動的企業,才能在這場競爭中生存下來。

*【免責聲明】本篇內容并非投資意見,為便于理解,該報告匯總了相關領域的典型企業案例作為參考,但所含相關公司資料不構成任何投資產品之要約或者建議,只作為一般參考資料用途。

作者:王子、顧程來、Evan、李海丹 編輯:李海丹

本文由人人都是產品經理作者【硅兔賽跑】,微信公眾號:【硅兔賽跑】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!