Agent(智能體):通往AGI的必經之路

0 評論 5781 瀏覽 31 收藏 8 分鐘

Agent被看作是通往通用人工智能(AGI)的必經之路。那么不同于傳統的人工智能,Agent的獨特之處在于哪里?怎么理解Agent這一概念?本文作者對其關鍵組成、特點和局限性等方面做了分析,一起來看一下。

上文介紹了AI大模型連接外部世界的重大意義,今天我們來了解一下Agent(智能體)。

Agent可以更好地理解和應對復雜多變的現實世界場景,具備更強的智能和自適應能力,因此被認為是通往通用人工智能(AGI)的必經之路。

一、基本概念

Agent(智能體)是一種能夠感知環境、進行決策和執行動作的智能實體。不同于傳統的人工智能,Agent 具備通過主動思考、調用工具去逐步完成給定目標的能力。

我們知道,大模型與人類之間的交互是基于prompt實現的,用戶prompt是否清晰明確會影響大模型回答的效果,在此過程中,人類主動提問,而大模型是“被動”回答。而Agent的工作僅需給定一個目標,它就能夠針對目標獨立思考并做出行動。

從大模型的角度來看,Agent其實就是基于大模型的語義理解和推理能力,讓大模型擁有解決復雜問題時的任務規劃能力,并調用外部工具來執行各種任務,利用向量數據庫保留“記憶”的一個智能體。

Agent = 大模型 + 任務規劃(Planning) + 使用外部工具執行任務(Tools&Action) + 記憶(Memory)

把Agent比作一個人的話,他應該有大腦(語義理解、存儲記憶、推理規劃、專業知識)、五官(接收文本、視覺輸入、聽覺輸入等)、四肢(使用工具完成各種具體任務)等主要部件。

其實我們在上文中舉的例子,就是Agent的極簡版工作模式:

我們還是參照該示例,從大模型的角度來看一下Agent的組成。

二、Agent的關鍵組成部分

Agent最核心的組成部分就是 任務規劃(Planning):

  • Agent需要提前將一項復雜任務拆解為多個更小、更易于處理的子任務,從而實現對復雜任務的高效處理。
  • Agent可以從錯誤中吸取教訓,并通過自我反思來優化結果,提高最終結果的質量。
  • 任務規劃能力是通過提示工程來引導大模型實現的,可以去翻閱《提示工程(Prompt Engineering):指導AI大模型完成任務的藝術》,里面那段自動優化提示詞的“咒語”,其實就是Planning的體現。

Agent還要擁有長短期記憶(Memory):

  • 短期記憶:短期記憶一般也是通過提示工程來實現,最常見的短期記憶可能是聊天上下文,在Agent中,思考過程、任務規劃內容、子任務返回的結果也都屬于短期記憶。
  • 長期記憶:長期記憶一般通過向量數據庫進行外部向量存儲和快速檢索來實現,可以長期保留和回憶信息。最常見的長期記憶可能是私有知識庫和私人信息(家庭住址等),也可以把大模型的所有記錄存儲起來,讓Agent擁有長期記憶。RAG相關內容可參考《檢索增強生成(RAG):如何讓AI大模型更懂我?》。
  • 壓縮記憶:通過對記憶進行壓縮,以提高記憶檢索效率。

工具&執行(Tools&Action):

Agent會根據拆分好的子任務,調用外部提供好的專業API解決專業問題,完成一個個具體的子任務,并把處理結果返回給大模型。詳情可參考上文《AI大模型如何連接外部世界:深入解析GPTs、Assistant API和Function Calling》。

三、Agent vs 大模型 vs 傳統軟件

傳統軟件的特點:

  • 非常穩定,極具確定性。
  • 不適合解決靈活的問題,必須提前預設好情境才行,略顯死板。

大模型的特點:

  • 強大的語義理解能力。
  • 強大的推理能力。
  • 高效的數據處理。
  • 更舒適的交互方式(自然語言交互)。
  • 輸出結果不穩定,缺乏確定性。

Agent的特點:

  • 比傳統軟件更靈活,同時比大模型更可靠。
  • 具備大模型的良好體驗,并盡可能解決其可靠性問題。
  • 但無論怎么優化,它的穩定性和可靠性短期內是無法和傳統軟件相比的。

總之,Agent目前會損失一定的可靠性,換來可觀的創造力,這種情況大概率會持續較長時間,但是一旦取得突破性進展,可能會徹底顛覆現有的交互方式,從GUI進入到自然語言交互的時代,到時候就可以真正用上那句“所有系統都值得用AI重做一遍”了。

四、局限性

雖然Agent讓我們看到了AGI的曙光,但目前它依然有很大的局限性:

  • 嚴重依賴大模型的核心能力,所以大模型底座必須足夠強
  • Agent多次與外界交互,效率不高,資源消耗大,成本較高
  • 執行鏈路過長,某一中間環節出錯,就會導致前功盡棄

五、總結

本文主要介紹了AI Agent的基本概念,Agent讓我們看到通用人工智能(AGI)的曙光。

雖然目前依然有很多局限性,導致Agent無法大面積應用,但隨著技術底座快速升級,Agent的規劃能力會越來越強,成本會快速降低,很可能會徹底顛覆現有的交互方式,并最終實現AGI。

本文由 @AI小當家 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!