【AI Agent】入門,看這一篇就夠了!
AI Agent技術正重塑我們的未來工作與生活。本文深入探索了AI Agent構建平臺的奧秘,從概念理解到功能剖析,再到國內外平臺的全面盤點,帶領讀者領略這一變革性技術的魅力。
一、初識Agent(由來及現狀淺析)
Agent一詞,在人工智能領域的早期研究中,就已被用來描述能夠執行任務或做出決策的程序或系統。
從2023年下半年開始,Agent這個詞的熱度便隨RAG,大模型開發框架等概念推出后一度飆升,至今依舊熱度不減(由下圖「百度指數」和「谷歌趨勢」關于“Agent”關鍵詞的搜索指數和趨勢可以看出)。
圖1-1來自百度指數(數據統計范圍:2022.11.30~2024.7.17)
圖1-2來自谷歌指數(數據統計范圍:2023.7.16~2024.7.17)
當前Agent,在人工智能領域,通常用來指代“決策、感知、執行于一體”的智能系統或智能應用,并且進行指揮和決策的“大腦”可以由各類LLM或VLM充當。
在2023年11月20日,在OpenAI首屆開發者大會上推出GPTs以后,各種類GPTs構建平臺便如雨后春筍一樣出現,并且功能也越來越豐富。
在AI Agent熱浪下,國內外的AI頭部公司、互聯網大廠以及原有RPA、企業辦公(CRM、客服)業務的公司,都紛紛推出了Agent相關產品。比如助力企業實現業務流程自動化的Beam.ai、亞馬遜Bedrock Agent等,面向多種應用場景的各類AI Agent構建平臺(字節扣子、智譜清言智能體中心、百度文心智能體平臺、阿里百煉平臺、百度智能客服產品-客悅“Agent0-1構建功能”、昆侖萬維的skyAgents等。
這些Agent和GPTs,正在悄然改變人們的工作方式,提高工作與生產效率,以及重新定義生產力。據有關人士整理,目前單國內外的AI Agent構建平臺,至少已經超過80個。
圖1-3 智譜AI-智譜清言-“新建智能體”產品功能截圖
圖1-4 文心一言智能體-產品界面截圖
圖1-5 百度客悅智能對話平臺一2024年4月產品界面截圖(1)
圖1-6 百度客悅智能對話平臺一2024年4月產品界面截圖(2)
二、AI Agent產品特點、功能模塊、使用場景介紹
前段時間,吳恩達教授在紅杉資本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、規劃(Planning)、多智能體協作(Multiagent collaboration)四種AI Agent設計模式已經逐步在一些Agent構建平臺實現,有的平臺如Coze等已經能夠支持全部四種設計模式。
圖2-1 字節AI智能體構建平臺(Coze)-產品主頁截圖
前面說了那么多,那到底什么是AI Agent構建平臺?AI Agent平臺有什么特點?有哪些功能模塊?
如若你使用過幾款AI Agent平臺(工具)產品,你就會發現:現在的這些AI Agent構建平臺,不論是產品UI界面上,還是產品功能邏輯上,都大差不差,均提供基于LLM通識能力的對話機器人構建(簡單智能體構建),和基于LLM、工作流、知識庫、API插件于一體的復雜Agent構建兩種。
且在創建Agent應用時,用戶只需要輸入一段簡單的智能體工作&技能相關描述,后臺AI便能幫你自動生成智能體名稱、頭像、簡介及系統提示詞等內容,非常之快捷、方便,分分鐘即可配好你的智能體。
圖2-2(a) 智譜清言-“新建智能體”-用戶輸入智能體描述
圖2-2(b) 智譜清言-“新建智能體”-系統據用戶輸入,智能生成的智能體配置信息
p.s.在當前時間節點(2024年7月17日),字節Coze、百度文心智能體、智譜AI-智譜清言均早已實現“一句話描述智能體,AI自動生成配置”,而騰訊元器(騰訊的智能體平臺)還暫未實現,還需要用戶手動輸入頭像&名稱這些信息,否則無法創建成功。
2.1 基于LLM通識能力,快速構建chatbot
1)適用場景:
適用于僅依照LLM通識能力,通過設定好LLM系統提示詞(人設&工作內容&溫度值等參數)就可以實現業務需求的場景,如“美食推薦專家”、“智能溝通專家”、“冷笑話專家”、“知識百科小助手”等等;
圖2-3 字節Coze新建智能體(test-bot)
2.2 基于知識庫&插件&工作流,構建復雜智能體
1)適用場景:
如果需要訪問企業/個人知識庫、調用一些額外的API插件來實現業務需求,則需要配置好相應的插件(如網絡爬蟲、xxx數據庫查詢與數據統計、天氣查詢、航班查詢等等)、知識庫數據。
另外,若有高階需求,比如需要根據不同的業務觸發條件執行對應的sop,則還需要配置工作流。
——當前階段,一般的Agent平臺,均提供“畫布拖拽式”的工作流搭建功能。在你的工作流中,你可以選擇讓LLM參與任務,也可以選擇不參與,此時LLM就相當于一個組件而已。
圖2-4 字節Coze-工作流配置頁面
圖2-5 Dify-工作流配置頁面
2.3 本節Q&A:
Q1. AI Agent產品有什么特點?
A1:AI Agent產品,一般具備AI Agent 0-1構建的功能,可幫助用戶或企業零代碼或低代碼,通過“自然語言”的方式,輸入一段智能體描述,即可分分鐘快速搭建一個chatbot,如美食推薦專家、旅游規劃專家、情感樹洞、講冷笑話小助手。
此外,AI Agent構建平臺產品,還支持個人和企業用戶構建復雜的智能體應用,通過提供【插件】、【知識庫】、【工作流】、【多智能體協作】配置相關功能,實現這一過程。同時支持對智能體【在線調試】和【發布】,發布形式上,支持按API調用,也支持直接發布帶前端界面的應用(這種應用一般以chatbot(對話機器人)形式為主,一些AppBuilder產品,還可支持低代碼和無代碼搭建網站等應用,如之前火過的釘釘「宜搭」、「輕流」低代碼平臺。
- 在【LLM】選擇和配置上,平臺一般均會提供【自家LLM】和【三方LLM】,供用戶挑選;在LLM配置上,一般支持配置LLM的溫度值、系統提示詞、TOPK等參數;
- 在【工作流】配置功能中,Agent平臺,基本上均實現了“畫布式”可視化配置方式,用戶可通過拖拽節點組件{LLM、插件、數據庫、會話、變量等}來完成工作流配置。
- 在【插件】選擇上,平臺支持用戶從平臺整合好的【預置插件商城】中選擇,也支持用戶【自定義插件】。
- 在【知識庫】配置功能中,一般的Agent平臺,均支持導入外部文檔資料(如pdf、excel、word等),功能豐富一些的Agent平臺不僅支持離線導入文檔,還支持“連接數據庫”(如語聚AI,支持連接飛書文檔,需提前定義好API相關配置)
——答案來自個人理解,僅供參考~
Q2. AI Agent用來解決誰的什么問題的?
A2:AI Agent平臺,可以幫助個人用戶和企業,通過“自然語言”、工作流配置等方式,無代碼或低代碼地簡單高效的搭建一款chatbot應用,在對話和任務執行過程中,用戶可選擇LLM來完成任務,相較于原來的智能對話機器人“總是從頭說”、“回答話術一成不變”、“無法很好理解用戶問題”等問題來說,基于LLM的chatbot更加智能、更加“懂用戶”。
——答案來自個人理解,僅供參考~
Q3. 目前AI Agent產品有哪幾種設計模式?分別有什么特點?
A3:吳恩達教授在紅杉資本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、規劃(Planning)、多智能體協作(Multiagent collaboration)四種AI Agent設計模式。
- 反思(Reflection):指的是AI代理在執行任務時能夠自我評估和調整其行為的能力。通過反思,AI可以學習從經驗中獲得教訓,從而在未來的決策中做出更好的選擇。
- 工具使用(Tool Use):這涉及到AI代理能夠識別、選擇和使用不同的工具或資源來完成特定的任務。例如,一個機器人可能會使用不同的工具來修理設備或完成建筑任務。
- 規劃(Planning):這是指AI代理能夠制定和執行長期或復雜的計劃。規劃能力使AI能夠預見未來的需求和挑戰,并提前做出相應的安排。
- 多智能體協作(Multiagent Collaboration):這涉及到多個AI代理能夠協同工作,共同完成更復雜的任務。這種協作可以提高效率和效果,尤其是在需要不同技能和資源的情況下。
Q4. AI Agent平臺,一般有哪些功能模塊?
A4:基于LLM的chatbot0-1搭建,包括:【智能體創建】、【智能體配置】、【智能體調試】、【智能體發布】功能;以及【智能體商城】功能,支持用戶從平臺中挑選其感興趣的智能體進行應用和體驗;以及多智能體協作功能。
關于【智能體配置】功能,包括智能體『基本信息配置』(名稱、頭像、簡介、LLM模型選擇與參數配置(工作技能和工作內容&流程描述、溫度值等)、『智能體復雜配置』(工作流配置、插件配置、知識庫配置等);
- 在【LLM】選擇和配置上,平臺一般均會提供【自家LLM】和【三方LLM】,供用戶挑選;在LLM配置上,一般支持配置LLM的溫度值、系統提示詞、TOPK等參數;
- 在【工作流】配置功能中,Agent平臺,基本上均實現了“畫布式”可視化配置方式,用戶可通過拖拽節點組件{LLM、插件、數據庫、會話、變量等}來完成工作流配置。
- 在【插件】選擇上,平臺支持用戶從平臺整合好的【預置插件商城】中選擇,也支持用戶【自定義插件】。
- 在【知識庫】配置功能中,一般的Agent平臺,均支持導入外部文檔資料(如pdf、excel、word等),功能豐富一些的Agent平臺不僅支持離線導入文檔,還支持“連接數據庫”(如語聚AI,支持連接飛書文檔,需提前定義好API相關配置)
——答案來自個人理解,僅供參考~
三、國內外AI Agent產品盤點
下面給出行內有關人士整理(+個人補充)的海內外AI Agent平臺盤點名單,包括68個海外AI Agent構建平臺和 21個國內AI Agent平臺 產品名稱及介紹,老師們可根據產品名稱自行搜索體驗,建議從互聯網大廠、AI獨角獸廠商的產品開始使用體驗。
3.1 68款 海外AI Agent構建平臺盤點及簡要介紹
圖3-1 海外AI Agent平臺構建(圖來自網絡,僅做學習交流使用,如有侵權聯系刪除)
圖3-2 SignalWire Agent平臺構建
3.2 21款 國內AI Agent構建平臺盤點
除此之外,還有百度智能客服-客悅平臺、簡易云的語聚AI產品等,也支持AI Agent構建。
四、本文參考資料
文章《全球80+AI Agent構建平臺大盤點…》:https://hub.baai.ac.cn/view/37088
本文由 @南方碟道 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
最近對AI Agent技術很感興趣,看了很多篇相關文章,這篇文章寫得很詳細也很清晰,要學習AI的話還是需要付出一定的精力的,這篇文章也算是給我提供了一個思路了。
最近看了很多篇AI 的文章,平時圖方便還是國內的AI用的多,個人認為滿足平時需求的話國內AI就挺夠用的。
嗯嗯 是呢 如果自己使用的話,就對比幾款,挑那么一兩個滿足自己使用需要的就好啦