全面解讀Agent,前OpenAI高管+斯坦福頂尖學者綜述
“探秘智能體,解讀未來智能?!?在人工智能的前沿領域,智能體(AI Agent)正逐漸成為焦點。它究竟是如何構建的?又具備怎樣的能力?本文將深入解讀前 OpenAI 高管和斯坦福頂尖學者的綜述,為你揭開智能體的神秘面紗,展現其在模擬人類行為等方面的巨大潛力。
(Lilian Weng定義的Agent結構圖)
智能體(AI Agent)=大模型(LLM)+記憶(Memory)+規劃(Planning)+工具使用(Tool Use)
LLM(AI大模型)是Agent的大腦,屬于“中樞”模型,要求有以下3種能力:
planning skills:對問題進行拆解得到解決路徑,既進行任務規劃
tool use:評估自己所需的工具,進行工具選擇,并生成調用工具請求
memory:短期記憶包括工具的返回值,已經完成的推理路徑;長期記憶包括可訪問的外部長期存儲,例如知識庫
斯坦福大學+谷歌頂尖學者發布的《Generative Agents: Interactive Simulacra of Human Behavior》中做了一個AI小鎮,通過類似《模擬人生》的沙盒環境中里面內置了25個Agent。
用戶可以觀察并干預 Agent 規劃他們的日常、分享新聞、建立關系以及協調團隊活動。這篇文章要解決的問題是如何創建能夠模擬人類行為的生成Agent,這些Agent可以在交互式應用中使用,例如沉浸式環境、人際交流排練工具和原型設計工具。
架構
這篇論文提出了一種生成代理架構,用于解決人類行為模擬的問題。具體來說,
記憶流:首先,論文描述了一個長期記憶模塊,稱為記憶流,它以自然語言形式記錄代理的所有經歷。記憶對象包括自然語言描述、創建時間戳和最近訪問時間戳。
檢索函數:為了決定代理的下一步行動,論文實現了一個檢索函數,該函數根據代理當前的情況返回記憶流的一個子集。檢索函數考慮了三個主要組件:
新穎性:最近訪問的記憶對象得分較高。
重要性:代理認為重要的記憶對象得分較高。
相關性:與當前情況相關的記憶對象得分較高。
反思:其次,論文引入了反思的概念,這是一種更高級別的思維,由代理定期生成。反思通過將最新的記憶記錄作為查詢,并從語言模型中獲取相關記憶來生成。
規劃和反應:最后,論文描述了規劃和反應的過程。規劃描述了代理未來的行動序列,幫助保持行為的一致性。反應則是代理在感知到環境變化時采取的行動。對話生成則是基于代理之間的記憶來進行的。
實驗
論文通過在一個類似《模擬人生》的沙盒環境中實現生成代理來驗證其架構。具體來說,
環境:沙盒環境被稱為Smallville,包含一個小鎮,其中有25個獨特的代理。每個代理由一個簡單的精靈頭像表示,初始記憶包括一個自然語言描述的段落。
用戶控制:用戶可以通過自然語言與代理互動,指定一個角色來感知代理。用戶也可以直接命令一個代理,使其更像代理的“內心聲音”。
環境交互:代理在沙盒世界中移動和與環境中的對象互動。用戶可以改變代理的環境狀態,例如將廚房爐子從“開啟”改為“燃燒”。
結果
可控評估:在可控評估中,論文通過“采訪”代理來測試其在自我認知、記憶、計劃、反應和反思方面的能力。結果表明,完整的生成代理架構生成的行為最為可信,而移除某個組件后性能會下降。
端到端評估:在端到端評估中,論文觀察了25個代理在兩天內的自發行為。結果顯示,代理之間形成了信息傳播、關系建立和協調。具體來說,關于Sam市長競選的信息傳播范圍從1人(4%)增加到8人(32%),關于Isabella情人節派對的信息傳播范圍從1人(4%)增加到13人(52%)。
總結
智能體(AI Agent)可以比喻為一部高效運作的智能機器人。這部機器人由以下幾個核心部件組成:
大語言模型(LLM):相當于機器人的大腦。它負責處理和理解語言信息,就像人類大腦處理思考、理解和溝通一樣。大語言模型使得機器人能夠理解指令、回答問題并與人類進行流暢的對話。
記憶(Memory):相當于機器人的存儲系統。它允許機器人記住過去的交互和經驗,以便在未來的任務中加以利用。就像人類根據記憶來做出決策一樣,智能體通過記憶來提高其處理問題的能力。
規劃(Planning):相當于機器人的導航系統。它幫助機器人制定行動方案,以實現既定目標。就像我們在旅行前規劃路線一樣,智能體通過規劃來確定如何執行任務。
工具使用(Tool Use):相當于機器人的雙手。它使得機器人能夠使用各種工具來輔助完成任務。就像人類使用工具來提高工作效率一樣,智能體通過使用工具來擴展其功能,解決更復雜的問題。
所以智能體(AI Agent)就像一個具備高級認知能力、豐富經驗、出色規劃和實際操作能力的智能機器人,能夠高效地完成各種復雜任務。
本文由人人都是產品經理作者【陳宇明】,微信公眾號:【碼個蛋】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!