2025,AI Agent還在起跑線

0 評論 990 瀏覽 1 收藏 18 分鐘

未來幾年,有關智能體的討論會愈加密集,但比起這個,如何解商業化這道難題更加緊迫。

當2024年全球科技峰會的話題從“大模型參數競賽”轉向“智能體落地場景”時,行業似乎完成了一次集體認知躍遷。人們意識到,AI的價值不再是參數量的天文數字,而在于能否像水一樣滲入真實世界的縫隙。

過去兩年,隨著混合專家架構(MoE)、神經符號系統等技術范式的迭代:智能體不再依賴“暴力訓練”,而是通過知識注入與邏輯推理的結合,逐步逼近人類專業能力。 全球科技巨頭與初創公司紛紛將資源投向AI Agent,人們甚至開始產生一種錯覺——智能體很快會進入成熟期。

這種感覺的背后,源于行業對“智能體”定義的微妙重構。相比馬文·明斯基時代的“自主生命體”理想,在大模型取得突破性進展的當下,留給AI應用落地窗口期愈發緊迫,對智能體的界定,雖然同樣具備能夠 “自主感知并采取相應行動” 的特征,但更多是把它視作AI應用落地最重要的一種產品形態。

從Anthropic、Google DeepMind到OpenAI,從字節、百度等頭部大廠,到kimi、智譜等AI新勢力,各家公司都在探討如何利用這項技術去顛覆現有的行業格局,讓智能體真正成為打通AI從實驗室到實際場景落地的利器。

然而看似繁榮的落地案例,大多僅是技術長跑中的零星里程碑:特斯拉Optimus機器人能分揀零件,但面對傳送帶突發卡頓仍需要人類救場;Anthropic的Computer Use讓用戶可以指揮Claude操作電腦,但面對復雜流程,也只有15%的操作成功率。

這些情況并非個例。當前大多數智能體集中在高度結構化的環境中運行,而人類世界的復雜性遠超實驗室預設的邊界。站在2025年的節點,這個被賦予“顛覆生產力”使命的技術,仍處于爆發前夜。

篤信行業的人會認為,當大模型完成技術啟蒙,算力基建逐步完善,智能體正在打開一個比移動互聯網更龐大的市場——結合麥肯錫與Gartner研究預測,到2027年,智能體將滲透至大部分的企業工作流,釋放萬億美元經濟價值。我們看到的不是技術天花板,而是一個領域新的起跑線,技術、商業與社會的碰撞剛剛開始,真正的變革將在混沌中重塑規則。

01 智能體爆發前夜

在很多人的印象里,AI智能體能夠實現工作流程的自動化,其實早在多年以前,就有企業已經開始嘗試使用基于規則的系統來處理簡單任務,比如一些系統可以根據預設的知識庫,自動回答客戶的基本問題。

最接近智能體形態的產品是IBM Watson這類規則引擎驅動的專家系統和Siri等單點交互工具,但這些依靠預設規則和簡單決策樹運行的相對初級的程序,局限性非常明顯:當面對復雜業務場景時,系統需要工程師編寫數以萬計的if-then規則,任何業務規則的細微調整都可能引發蝴蝶效應,導致整個系統需要推倒重來。

真正革命性的突破發生在2015年前后。隨著深度學習技術的發展,AI開始具備自主學習和環境適應能力。谷歌DeepMind團隊的AlphaGo就是典型的例子,在2016年擊敗圍棋世界冠軍,標志著人工智能從”機械執行者”向”策略制定者”的蛻變。

彼時的智能體,作為基于計算機程序和算法構建的智能實體,也逐漸具備了基于數據自我迭代的能力,但由于“算法泛化能力不足”與“場景理解碎片化”的技術局限性,還沒有達到完全自主決策的程度。AlphaGo雖然在圍棋領域超越人類,卻無法將這種能力遷移至其他場景。這種專家系統式的智能,本質上仍是戴著鐐銬跳舞。

直到大模型的出現。

2020年GPT-3橫空出世,智能體進入了一個新的認知革命,體現在兩個方面:AI認知的泛化,千億參數構建的大模型能理解跨行業的術語與業務邏輯;人機交互方式的改變,人們可以通過對話來生成結果。

2022年底,ChatGPT破圈,驗證了大模型作為“通用認知引擎”的可能性,次年多模態大模型爆發,被視為智能體的“成人禮”,GPT-4、Gemini等模型展現的跨模態能力,讓智能體初步具備人類的多感官協同。

在這樣的背景下,具備持續學習能力的AI Agent,在一定程度上有望突破工具屬性,成為具備商業思維的”數字員工”,也就是大家現在所理解的“企業智能助手”的雛形。

與此同時,大模型API調用成本從GPT-3的每千tokens 0.06美元,降至GPT-4 Turbo的0.01美元,意味著中小企業也能負擔智能體部署。包括麥肯錫在內的多家研究機構測算并得出結論,大模型推動智能體部署成本下降60-80%。

智能低門檻、高適配、強進化的應用特征,讓不少為了擺脫商業化困境的AI玩家,將智能體當作新的突破口。

而人們對智能體的終極期待,是構建一套“企業認知中樞”——它不僅是執行命令的工具,更是沉淀知識、優化流程、預測風險的核心引擎。這一愿景在過往受限于技術碎片化與成本壁壘,而如今,大模型的泛化能力、多模態融合與成本下降,終于讓商業社會看到了破壁的機會。

02 行業現狀冰火兩重天

Anthropic CEO Dario Amodei曾斷言,未來2~3年內,AI可能在幾乎所有任務上超越人類,五年內智能體將滲透90%的企業工作流。智能體之所以成為風口,本質是市場對“第二代數字化轉型”的豪賭,如果說2000-2020年實現了業務流程數字化,當下正進入“用智能體重構業務本質”的新階段。

根據CB Insights,2023 年,全球AI初創公司融資總額達到425億美元。而伽馬數據則顯示,過去的一年里,全球AI產業融資金額超4000億元,同比增長超77%,其中智能體相關的初創企業融資占比尤其顯著。

但資本市場的狂熱與產業實踐的謹慎形成微妙張力。綜合各類機構調研,2024年全球僅小部分智能體部署項目實現盈利,多數企業仍在為“如何讓AI理解業務邏輯”焦頭爛額。這種矛盾映射出一個現實:智能體從技術演示到商業閉環之間仍有巨大鴻溝。

從技術布局看,頭部公司的探索方向已現分野。

例如OpenAI的Sam Altman押注“通用智能體”,試圖通過GPT構建可適應任意場景的認知引擎,剛剛正式發布的“Operator”能讓智能體接管用戶電腦操作,例如自動編寫代碼并調試運行,但是否能避免此前Anthropic computer use所暴露的控制能力脆弱性,還需要進一步驗證;

而微軟CEO納德拉選擇深度嵌入路線,將Copilot植入Office、Teams等產品矩陣,試圖把智能體變成企業工作流的“隱形中樞”,但在供應鏈管理等復雜場景中,其智能體因缺乏行業知識庫支持,也曾引發過合規危機。

具體到智能體的商業化路徑,不同類型的公司也呈現出不同的思路:以OpenAI、谷歌和字節跳動為首的平臺基建型玩家,和以Anthropic為代表的垂直深耕型選手。平臺型與垂直型智能體公司的分野,本質上映射出技術普惠與深度價值的兩條進化路徑。

OpenAI的GPTs上線三個月即吸引超300萬開發者,用戶通過自然語言指令創建各種智能體,這種“對話即開發”的模式將生態擴張速度提升10倍,但繁榮背后暗藏隱憂——據SimilarWeb監測,GPTs商店中近70%的智能體生命周期不足30天,同質化工具泛濫導致用戶付費意愿持續走低。

用生態化的平臺來聚攏開發者,這種玩法在互聯網早期就已顯現,本質上是科技巨頭之間的軍備競賽。然而,平臺型玩家雖占據流量與開發者優勢,卻難免廣度稀釋精度的悖論——當微軟Copilot企業版用戶抱怨其生成的財務報告頻繁出現會計準則誤用時,OpenAI工程師坦言“通用模型在專業場景的知識深度,不足人類專家的1/10”。

垂直型路徑則選擇向產業縱深處掘金,為了和OpenAI等公司差異化競爭,Anthropic在發布Computer Use之外,Anthropic 把目光鎖定在金融、醫療等對合規審查、風險評估的要求極高的領域,以滿足這些剛需場景為切入點,提供“憲法AI”約束,用Claude API滿足客戶的私有化部署。

不同于OpenAI的“通用模型+生態擴張”,Anthropic采用“可控性+行業適配”方案,這么做的原因并非通過平臺的形式來賣鏟子,而是在自身技術優勢的基礎上,滿足行業在AI時代對安全、精準、定制化服務日益增長的需求。

聚焦細分領域且能快速落地的方案,對于科創型公司來說更具實踐意義,國外AI科技公司LangChain調查了從工程師、產品經理到商業領袖和高管共計1300多企業人士,調研的企業里,超過一半用Agent來進行研究和總結的工作,其他依次為個人生產力工具、客戶服務、代碼生成等方面。

在過去的兩年里,各類AI智能體產品,在全球各行各業釋放出極大的潛力。主打金融、法律文檔智能分析的Hebbia.ai、為企業客戶定制AI客服的Sierra,以及職業教育領域的Sana Labs等,都有不錯的增長。

資本的瘋狂涌入,推動這些新玩家們的融資規模與估值雙雙飆升。但與此同時,市場卷起的巨大泡沫,一些智能體初創公司的PS Ratio(市銷率)甚至超過50倍,遠超此前SaaS行業平均水平。拿Sierra來說,這家成立不到兩年的公司,估值已經達到45億美金,成為智能體初創企業中最火熱的投資標的之一。

垂直化也意味著規模天花板,Gartner數據顯示,專注金融合規的智能體公司年均營收增速僅為平臺型企業的1/3,且客戶獲取成本持續攀升,部分賽道已出現用80%資源爭奪20%頭部客戶的殘酷內卷。

從平臺型到垂直型,兩種路徑的角力實則指向產業根本矛盾:通用智能體的開放生態能快速鋪量卻難挖深井,垂直解決方案雖能創造高毛利但復制成本陡增。

于是在這種情況下,一些公司已悄然調整戰略,Anthropic 在Claude API中開放“憲法規則自定義”接口,允許企業將內部合規條款植入模型,這種“可拆卸的垂直化”或許預示著未來智能體市場的終局形態:平臺提供基礎認知引擎,垂直模塊則像App Store中的專業應用般自由組合,最終在開放與封閉、普惠與深度的平衡中重塑商業。

但這些,還僅僅是一種預測。

03 智能體還在起跑線

回到智能體本身,行業領袖的反應更為冷靜。Meta的扎克伯格坦言:“我們高估了短期進展,低估了長期挑戰——讓智能體真正理解人類意圖,可能還需要十年?!庇ミ_黃仁勛則預測,”只有當智能體開始改造企業利潤表時,真正的革命才剛開始。”

兩者觀點看似矛盾,前者警示短期高估,后者強調長期革命性,但這些判斷的背后,其實都是對當下智能體技術瓶頸和商業化局限下的認知。

當前智能體的自然語言交互能力雖已突破語法層面,但在深層語義理解上仍存缺陷,在動態環境和跨系統的協作協作,智能體仍存在各式各樣的可靠性不足。在商業化層面,不少公司面臨成本和收益失衡,波士頓咨詢調研顯示,企業智能體項目中不到20%達到預期ROI,多數企業仍在“試水”階段。

如果將視線放到國內,情況將會更加復雜。

事實上,國內和國外的智能體發展,一開始差異并不明顯,但現在差別越來越大。具體表現為,國外在智能體領域的融資規模不斷攀升,產品力不斷增強,部分超級公司正在崛起;而國內目前大多還停留在概念階段,這種情況和當年SaaS行業很相似。

從中國信通院發布的《2024年人工智能發展報告》來看,在金融、醫療、制造等領域的智能體公司數量龐大,但受限于高部署成本和商業化落地難度,企業級市場的盈利項目占比屈指可數。

這一差距背后,是技術路徑、產業生態和商業邏輯的多重差異。

目前國外大部分智能體產品的交付,仍沿用軟件定制開發或按時訂閱的商業路徑,主要得益于其SaaS化基因,有成熟的軟件生態基礎,另一方面,智能體對傳統線下生產和運營流程的替代更加精細,可替代的人力環節更多,智能體能解決更多實際問題,因此擁有廣闊的發展空間。

商業發展的本質,是要縮短傳統流程,并盡可能降低成本,當成本比原來降低更多時,新的模式就會取代舊模式。但相比之下,國產AI的發展并非是因為軟件生態成熟,有了AI后如虎添翼;恰恰相反,國內軟件生態原本就不夠完善:既缺乏類似Hugging Face的模型庫、Databricks的數據處理平臺,行業內的API標準化也表現不足,增加了企業的集成成本。

這種情況導致在AI領域,國內還需要去彌補軟件生態方面缺失的功課。更棘手的是,企業客戶習慣為“功能模塊”付費,但拒絕為“決策能力”溢價。一些頭部廠商的智能體一旦報價超過客戶預期的范圍,客戶流失率甚至能達90%。

所以在2025年的節點,清醒認識到,伴隨AI從玩具編程工具,但如果要把智能體從生產力工具變成真正的生產力,這場變革還未抵達交卷的程度,它不會遵循摩爾定律的節奏躍進,而是要在試錯與迭代中蹣跚前行。

作者|李小東

本文由人人都是產品經理作者【新眸】,微信公眾號:【新眸】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!