AI Agent 是人類生產關系的一次巨變

0 評論 790 瀏覽 0 收藏 13 分鐘

AI Agent不僅僅是對現有技術的升級;它們代表了一種組織運作、競爭和創新方式的轉變。

谷歌發布的一份名為《Agent》的白皮書,展望了人工智能在商業中扮演更加積極和獨立的角色的未來。這份42頁的文件在9月發布時并未引起太大轟動,但如今在X.com(前身為推特)和LinkedIn上引起了廣泛關注。

這份報告提出了“AI Agent”的概念,一種超越現有AI模型的軟件系統,能夠進行推理、規劃并采取行動,以實現特定目標。與傳統的AI系統不同,后者僅根據預先存在的訓練數據生成響應,AI Agent可以與外部系統互動,做出決策,并獨立完成復雜任務。

白皮書解釋道:“Agent是自主的,可以在沒有人類干預的情況下獨立行動?!彼鼈儽幻枋鰹榻Y合了推理、邏輯和實時數據訪問的系統。AI Agent的背后理念十分雄心勃勃:它們可以幫助企業自動化任務、解決問題,并做出曾經完全由人類處理的決策。

白皮書的作者——朱莉亞·維辛格(Julia Wiesinger)、帕特里克·馬洛(Patrick Marlow)和弗拉基米爾·武斯科維奇(Vladimir Vuskovic),詳細闡述了AI Agent如何運作以及它們所需的功能。

然而,更廣泛的影響同樣重要。AI Agent不僅僅是對現有技術的升級;它們代表了一種組織運作、競爭和創新方式的轉變。那些采納這些系統的企業可能會在效率和生產力上獲得巨大的提升,而那些猶豫不決的企業則可能發現自己在競爭中逐漸落后。

以下是谷歌白皮書中的五大關鍵見解,以及它們對未來商業中AI應用的潛在影響。

一、AI Agent不僅僅是更聰明的模型

谷歌認為,AI Agent代表了對傳統語言模型的根本性突破。像GPT-4和谷歌的Gemini這樣的模型,在生成單輪響應方面表現優異,但它們僅限于從訓練數據中學習到的內容。相比之下,AI Agent設計的初衷是與外部系統互動,基于實時數據進行學習,并執行多步驟任務。

白皮書指出:“傳統模型中的知識僅限于它們訓練數據中已有的內容。AI Agent通過與外部系統的連接擴展了這些知識。”

這種差異不僅僅是理論上的。設想一個傳統的語言模型被要求推薦旅游行程。它可能會基于一般知識提出一些建議,但缺乏預訂機票、檢查酒店可用性或根據用戶反饋調整建議的能力。然而,AI Agent則能做到這一切,它可以結合實時信息并做出自主決策。

這一轉變使AI Agent成為一種新的數字工作者,能夠處理復雜的工作流。對于企業來說,這意味著能夠自動化那些曾經需要多個人力角色來完成的任務。通過整合推理與執行,AI Agent可能成為從物流到客戶服務等多個行業中不可或缺的工具。

人工智能Agent如何使用擴展訪問外部API以執行任務的細分。(圖片來源:谷歌)

二、認知架構驅動它們的決策過程

AI Agent能力的核心是其認知架構,谷歌將其描述為一個用于推理、規劃和決策的框架。這一架構被稱為協調層,使Agent能夠以循環的方式處理信息,結合新數據來優化其行動和決策。

谷歌將這一過程比作一位大廚在繁忙廚房中的工作。大廚會收集食材,考慮顧客的口味需求,并根據反饋或食材的可用性調整食譜。類似地,AI Agent會收集數據,推理下一步行動,并根據目標調整自己的行為。

協調層依賴于先進的推理技術來引導決策過程。諸如推理與行動(ReAct)、思維鏈(CoT)和思維樹(ToT)等框架,為拆解復雜任務提供了結構化的方法。例如,ReAct允許Agent在實時中結合推理和行動,而ToT則使Agent能夠同時探索多個可能的解決方案。

這些技術賦予Agent不僅僅是反應性的決策能力,還能做出積極主動的決策。白皮書指出,這使得AI Agent具有高度的適應性,能夠以傳統模型無法做到的方式應對不確定性和復雜性。對于企業來說,這意味著AI Agent可以承擔一些任務,例如故障排除供應鏈問題或分析財務數據,且在較少人工監督的情況下實現高度的自主性。

AI Agent決策過程的流程,從用戶輸入到工具執行和最終響應。(圖片來源:谷歌)

三、工具拓展了Agent的能力,超越了訓練數據的限制

傳統的AI模型常被描述為“靜態知識庫”,僅限于其訓練數據所涵蓋的內容。而AI Agent則不同,它們能夠通過工具訪問實時信息,并與外部系統進行互動。這一能力使得它們在現實應用中具有實際價值。

白皮書解釋道:“工具彌合了Agent內部能力與外部世界之間的差距?!边@些工具包括API、擴展程序和數據存儲,它們使Agent能夠獲取信息、執行操作,并檢索隨著時間變化的知識。

例如,一位負責規劃商務旅行的Agent可以通過API擴展程序檢查航班時刻表,通過數據存儲檢索旅行政策,或者使用地圖工具查找附近的酒店。AI Agent能夠動態與外部系統互動,這使得它們不再是靜態的響應者,而是商業流程中的活躍參與者。

谷歌還強調了這些工具的靈活性。例如,函數允許開發者將某些任務卸載到客戶端系統,企業因此能更好地控制Agent如何訪問敏感數據或執行特定操作。這種靈活性對于金融、醫療等行業至關重要,因為這些行業對合規性和安全性有嚴格的要求。

代理端和客戶端控制的比較,說明人工智能Agent如何與Google Flights API等外部工具交互。(圖片來源:谷歌)

四、檢索增強生成(RAG),讓Agent變得更智能

AI Agent設計中的一項最具前景的進展是檢索增強生成(RAG)的整合。這項技術使Agent能夠在其訓練數據不足時,查詢外部數據源——如向量數據庫或結構化文檔。

白皮書解釋道:“數據存儲通過提供訪問更動態和最新信息的途徑,解決了[靜態模型]的限制?!盇gent可以實時檢索相關數據,從而將其響應基于事實信息。

基于RAG的Agent在信息變化迅速的領域尤其有價值。例如,在金融行業,Agent可以在做出投資建議之前拉取實時市場數據。在醫療領域,Agent則可以檢索最新的研究成果,來為診斷建議提供支持。

這一方法還解決了AI中一個長期存在的問題:幻覺(hallucinations),即生成不正確或虛假的信息。通過將響應建立在現實世界數據的基礎上,Agent能夠提高準確性和可靠性,從而更適用于那些高風險的應用場景。

檢索增強生成(RAG)如何使Agent能夠查詢向量數據庫并提供精確的上下文感知響應。(圖片來源:谷歌)

五、谷歌提供工具加速Agent部署

盡管這份白皮書充滿了技術細節,但它同樣為希望實施AI Agent的企業提供了實用的指導。谷歌重點介紹了兩個關鍵平臺:LangChain,一個開源的Agent開發框架,以及Vertex AI,一個用于大規模部署Agent的托管平臺。

LangChain通過允許開發者將推理步驟和工具調用串聯在一起,簡化了構建Agent的過程。而Vertex AI則提供了測試、調試和性能評估等功能,使得部署生產級Agent變得更加容易。

白皮書指出:“Vertex AI使得開發者能夠專注于構建和完善他們的Agent,而平臺本身則管理了基礎設施、部署和維護的復雜性?!?/p>

這些工具降低了那些想嘗試AI Agent但缺乏深入技術專長的企業的門檻。然而,它們也引發了關于廣泛采用Agent的長期后果的思考。隨著這些系統變得越來越強大,企業將需要考慮如何平衡效率提升與潛在風險,如對自動化的過度依賴或決策透明度方面的倫理問題。

推理循環、工具和API的集成,使AI Agent能夠處理旅行計劃或天氣檢查等復雜任務。(圖片來源:谷歌)

六、這意味著什么

谷歌關于AI Agent的白皮書呈現了一個詳細且雄心勃勃的AI發展藍圖。對于企業而言,信息非常明確:AI Agent不僅僅是一個理論概念,它們是能夠重塑企業運營方式的實際工具。

然而,這一轉型不會一蹴而就。部署AI Agent需要精心的規劃、實驗和重新思考傳統工作流程的勇氣。正如白皮書所指出的:“由于基礎模型的生成特性,沒有兩個Agent是完全相同的?!?/p>

目前,AI Agent既是一個機遇,也是一項挑戰。那些投資于理解和實施這一技術的企業將能夠獲得顯著的競爭優勢。而那些選擇觀望的企業,可能會在智能化、自動化系統日益主導一切的世界中,陷入追趕的困境。(Venture Beat)

本文由人人都是產品經理作者【AI新智能】,微信公眾號:【AI新智能】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!