AI創新加速:揭秘Coze、元器、Dify、千帆、百煉如何推動Agent開發新紀元
今年開始,Agent成為大模型落地的最佳選擇,各大廠商都在大力推廣。面對這種技術簇,我們應采取一種積極探索與謹慎評估并重的策略——既要保持理性,也要保持樂觀。
隨著大模型迭代的浪潮一波接一波地推高技術前沿,Agent技術已經成為大模型落地的主流選擇,并被視為賦予大模型更廣闊能力的最佳路徑。從理解復雜的指令,到處理多模態信息,從簡單的問答系統到復雜的決策支持系統,從個性化推薦到自動化的業務流程管理,陸續在更多領域展現出其巨大的潛力和價值,它正在為社會帶來深刻的變革。
在這場趨之若鶩的群體行動中,面對這項持續發展變化的技術簇,我們應采取一種積極探索與謹慎評估并重的策略——既要保持理性,也要保持樂觀,以此來應對不確定性。技術的更新迭代需要時間與耐心,而技術的應用則需了解其限制和準確判斷業務場景。
要有效利用大模型,首先,必須明確他們的優勢和不足(圖1)。接下來,整理業務操作流程即業務SOP,確保對業務場景有深刻理解和準確的認知。其次,對領域知識進行必要的梳理。第四,在搭建Agent的過程中,盡可能的規避LLM的局限(例如,通過多輪對話精準捕捉識別用戶意圖)。第五,要做好企業內專業資料的處理和必要工具的建設。最后,準備好對Agent進行持續的優化(效果優化),從而在應用大型模型時發揮其優勢,規避弱點。
一、大模型原生能力&局限
大模型擅長語義理解、邏輯推理以及生成和創作內容。然而,它們目前存在一些限制,包括對特定領域的深入理解和時效性不足、有限的記憶能力、在實際情況中的魯棒性不夠,導致錯誤、潛在的安全風險、推理和規劃能力尚待提升、缺少合作意識而無法協同解決復雜問題、以及缺乏視覺和聽覺等感官能力,有時生成的信息可能不精確或是虛構的。在構建Agent時,可以通過集成其他技術和能力來補充和改進大模型的這些不足。
另外,一些限制更多地取決于大型模型自身能力的提升。例如,泛化能力和過度擬合現象,這可能導致對含糊不清的信息的理解出現歧義,或者混淆了特定領域的知識。模型處理上下文的能力也受到長度的限制。模型的可解釋性和可調試性不足,使其在某些情況下表現得像一個局部的黑箱。由于模型參數眾多,推理過程耗時較長。此外,微調模型對高性能的GPU和TPU計算資源的需求也相對較大。
二、Agent
為讓大模型更充分的發揮價值,突破當前的局限,主流趨勢是通過Agent增強能力(大腦),為大模型增加眼耳鼻口手腳的能力。
2.1 Agent框架
Agent為大模型提供了執行復雜任務、與環境交互、自主決策和長期記憶等關鍵能力,使得大模型的應用從單純的語言處理擴展到更廣泛的領域,包括自動化任務執行、客戶服務、內容創作等,極大地擴展了AI的實用性和影響力。為了實現這樣一套解決方案(圖2),背后需要用工程化的手段落地——工具鏈。
2.2 一站式AI Agent開發工具鏈
Agent開發平臺是面向智能體生產場景的一站式開發工具,具備智能體編排、流程搭建、知識庫管理、大小模型交互、計量、開放、私有化部署等功能,能夠有效提升智能體研發效率,降低研發成本。目前國內知名的Agent開發平臺包括百度的千帆、阿里的百煉、字節的Coze、Dify以及騰訊的元器等。
2.3 工具鏈競品分析
1)字節Coze
Coze平臺專為零代碼或低代碼(可視化編排)開發者設計,極大地降低了開發門檻,使得非技術人員也能快速上手。
優勢:
- 功能強大(圖像流、通過觸發器實現自動化的任務調度和執行、多渠道發布)
- 高度可定制
- 支持豐富的主流第三方插件
- 數據源多樣
但整體的動線繁瑣,用好的門檻比較高。
2)騰訊元器
網站風格一如既往的“節制”,功能布局清晰易懂,用戶無需花費腦力去理解網站的結構、布局和導航。該有的元素都有,后續在生態建設上,期待看到更多的可能,包括且不限于更豐富的大模型可選、插件……
3)Dify
是做LLM應用開發平臺中最早的一批之一,且功能性甚至比國內頭部大廠更突出,相比之下,目前它是是Github上Star數最多的大模型應用開發工具(54000星),是全球LLM Tools增速Top1的開源項目(300萬的安裝量)。
優勢:
- AI生態相對最好:支持40多家廠商的大模型,對接大模型平臺、對接開源大模型,全鏈路免費。上百種插件
- 成功打開海外市場
- 提供云服務和本地部署兩種方式,滿足了不同用戶的需求,同時支持多平臺發布應用
- 自動化流程搭建和數據處理方面具有明顯的優勢,適合需要構建復雜自動化流程或處理大量數據的用戶
4)百度千帆AppBuilder
千帆AppBuilder提供全面便捷的應用開發套件與資源環境,包括大模型驅動的開發組件(文字識別、文生圖等多模態能力),內置RAG(檢索增強生成)、Agent(智能體)、GBI(智能數據分析)等常用的AI原生應用框架,語音識別、TTS、文生圖等AI能力組件,以及各類IAAS云資源。使得開發者能夠在一個平臺上完成從應用開發到部署的全過程,大大提高了開發效率。
優勢:
- 千帆大模型平臺提供了從模型設計、訓練到部署、優化的全流程支持
- 平臺42個大模型,預置41個數據集。內置103套Prompt模版及自動化Prompt工程能力
- 預置的安全模塊可以有效控制輸入和輸出的安全風險,為用戶提供全面的模型安全、內容安全和數據安全保障
- 自研集群,為企業節約了算力成本和時間成本
- 生態能力強大,預置100+優質官方組件
- 自主規劃準確,支持人工編排以高效還原業務SOP
5)阿里百煉
優勢:
- 開放的模型非常多,除了阿里系之外,支持主流的三方大模型,百川、智譜、零一萬物、Meta……
- 支持進行多輪對話配置,模型支持將選定的歷史對話信息作為輸入
- 允許企業開發應用時引入自研插件,與業務場景充分融合
6)競品分析:核心功能
從Agent構建(編排)、節點(及節點管理)、生態、發布渠道、OPS,5個一級維度,70個三級維度,來評估5個頭部供應商的功能,可以看出,在過去一年多的時間里,各家的開發工具鏈都在快速演進和迭代。
2.4 參與方
以企業內部自建or私有化部署Agent開發平臺角度看,利益相關者有Agent開發平臺的建造者(自建)or維護人(外采)。有小白用戶,有研發能力的Agent開發者(包括插件的開發、知識庫的建設等圍繞大模型應用的一系列的元素建設),還有外部的三方服務商(提供底層基座大模型、Agent開發套件、解決方案、甚至是上手幫企業調Agent)。
2.5 沉淀的AI資產——生態市場
在大模型的范疇內,新型的AI資產是企業核心價值力的一種體現。包括各種Agent(Mult-Agent)、Flow工作流、業務的SOP、大&小模型、Prompt、插件、知識庫、知識圖譜、語料、評測集、評測排行榜(含報告)……。這些資產在具體的業務領域應用中,像變形金剛一樣,可以單打獨斗,也可以組合變形,以解決文本編輯、圖像處理、語音識別、智能助手等形態推進企業的產品創新、服務質量的提升、運營效率的改進、營銷效果的高轉化。
三、Agent開發生命周期
上文介紹了Agent開發工具,有了這些利器,接下來的關鍵點在于如何巧妙的運用它們?構建并完善Agent,以確保業務效率的顯著提升,是展現大模型價值的最佳途徑。企業內部做Agent一般經過3個步驟:
其一,業務提需求,搭建Agent,確保POC符合業務預期
其二,正式開發Agent,以及對接業務系統,上線交付
其三,持續運營優化Agent,不斷提升效果
四、行業發展趨勢VS企業落地關鍵點
在企業實際搭建Agent的過程中,有三個關鍵步驟極其重要,必須由企業內部人員主動參與并領導,這是無法通過購買第三方服務來取代的。
其一,是讓大型模型理解企業內部的數據、信息和知識,為Agent提供高質量、精確的數據資源,以便讓大型模型輸出符合業務預期的答案是至關重要的。數據到信息,信息到知識,知識到智慧的轉化過程,需要從最終使用者的角度反向思考。如何采集、處理和加工數據、信息、知識才能達到預期效果。這需要在六個方面進行思考:準確性、完整性、全面性、粒度(粗糙或詳細)、關聯性以及訪問或使用權限。信息處理的效果對于企業有效利用大型模型至關重要,這需要具備專業知識的人員掌握與大型模型互動的專門技巧,如提示(Prompt)和知識庫或記憶技巧。
其二,通過使用插件,可以實現Agent與企業現有系統的無縫集成,從而提升系統的智能化程度。這一過程通常由開發團隊負責編碼(或使用如Cursor等代碼生成工具)。在此過程中,需要重視元數據的完整性(AI資產管理),以便實現最大程度的復用性,從而提高企業內部系統對接的效率。
其三,在構建Agent之前,我們需要理清業務的標準操作流程(SOP)。在編輯工作流時,開發者需要參照SOP,將大模型、知識庫、插件等原始元素進行編排,并通過邏輯節點將流程連貫起來,從而“虛擬重現”業務場景。這三個方面的推進效率和質量,決定了一個企業應用大型模型的效率和效果,也決定了在這場生產力革命中的排位。
可以預見,在2025年,大模型應用將給我們帶來更多令人驚嘆的“哇哦”時刻,讓我們拭目以待~
受作者領域認知深度所限及技術無時無刻不在更新迭代,業界對LLM、AGI、Agent、GPT……的衍生應用必定是珠零錦粲。無法在一篇中盡現全貌,未來可能會徹底推翻當下的種種嘗試而不得知。能為大家帶去一點點新的啟發,以深感欣慰。文中難免有紕漏或不準確的地方,歡迎大家批評指正。
撰寫中參考網絡上各位同仁的最新觀點,拿來主義未打招呼,還望見諒。若有任何建議或意見,歡迎聯系作者探討。
作者:shucay、佳琪
本文由@shucay 授權發布于人人都是產品經理,未經許可,禁止轉載
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!