亚洲综合激情五月色一区,无码人妻精品丰满熟妇区,av中文字幕网免费观看

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

AI Agent：大模型的下一個(gè)高地

科技云報(bào)到

2024-01-16

0 評(píng)論 847 瀏覽 7 收藏

14 分鐘

不少人都將AI Agent看作是大模之后的下一個(gè)爆發(fā)點(diǎn)，也有大量技術(shù)人員已然投入構(gòu)建自主Agent。那么，AI Agent究竟會(huì)怎么改變我們的生活？AI Agent落地的關(guān)鍵點(diǎn)，又在于何處？一起來看看本文的分析。

當(dāng)所有人都沉浸在與ChatGPT對(duì)話的樂趣中，一場(chǎng)靜水流深的變革已然啟動(dòng)。

2023年11月，比爾·蓋茨發(fā)表了一篇文章，他表示，AI Agent將是大模型之后的下一個(gè)平臺(tái)，不僅改變每個(gè)人與計(jì)算機(jī)互動(dòng)的方式，還將在五年內(nèi)徹底改變我們的生活。

如果說大模型是未來水電煤一般的基礎(chǔ)設(shè)施，那么Agent則是未來用戶接觸、使用AI的方式。

AI Agent不再滿足于僅僅作為“聊天對(duì)象”的角色，而是渴望成為能在真實(shí)世界里揮灑自如的“智能執(zhí)行者”。

數(shù)據(jù)顯示，過去兩年間，針對(duì)AI Agent的研究投入增長(zhǎng)幅度高達(dá)300%。大模型市場(chǎng)的玩家們，似乎正齊刷刷地轉(zhuǎn)向AI Agent。

在國(guó)內(nèi)，截止去年11月中旬，AI Agent賽道發(fā)生融資事件13起，總?cè)谫Y金額約735億人民幣，公司融資均值為56.54億人民幣。

在國(guó)外，據(jù)外媒MattSchlicht數(shù)據(jù)顯示，至少有100個(gè)項(xiàng)目正致力于將AI代理商業(yè)化，近10萬(wàn)名開發(fā)人員正在構(gòu)建自主Agent。

毫無(wú)疑問，AI Agent正在成為大模型之后下一個(gè)爆發(fā)點(diǎn)。

值得探討的是，作為一種巨大的技術(shù)變革，AI Agent將如何改變我們的生活？國(guó)內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何？AI Agent落地的關(guān)鍵點(diǎn)是什么？

一、AI Agent：自主執(zhí)行任務(wù)的“小助手”

去年4月份，斯坦福和谷歌的研究者共同創(chuàng)建了一個(gè)“西部世界小鎮(zhèn)（Westworldsimulation）”。在這個(gè)小鎮(zhèn)里，25個(gè)AI Agent每天都在樂此不疲地散步、約會(huì)、聊天、用餐以及分享當(dāng)天的新聞。

在這個(gè)實(shí)驗(yàn)中，AI Agent（智能體）在執(zhí)行任務(wù)和互動(dòng)上表現(xiàn)出了令人驚艷的自主性和智能性，由此引發(fā)了業(yè)界的高度關(guān)注。

事實(shí)上，這并不是AI Agent第一次出圈，其概念從出現(xiàn)到爆發(fā)，已經(jīng)邁過多個(gè)階段。

在單一Agent階段，主要是針對(duì)不同領(lǐng)域和場(chǎng)景的特定任務(wù)，開發(fā)和部署專門的智能體。以GPTengineer為例，給它一個(gè)需求，其就可以把代碼寫個(gè)大概。

在多Agent合作階段，是由不同角色的Agent自動(dòng)合作完成復(fù)雜的任務(wù)。

例如在MetaGPT上，如果讓其做一個(gè)股票分析的工具，它會(huì)把這個(gè)任務(wù)分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理等5個(gè)角色，模擬整個(gè)的軟件開發(fā)中所有決策工作流。

不過，隨著微軟全新工具AutoGen的發(fā)布，AI Agent很快翻開了新的篇章。

AutoGen允許多個(gè)LLM智能體通過聊天來解決任務(wù)。LLM智能體可以扮演各種角色，如程序員、設(shè)計(jì)師，或者是各種角色的組合，對(duì)話過程就把任務(wù)解決了。

與MetaGPT不同的是，MetaGPT的角色模型是被定義好的，而AutoGen可以讓開發(fā)者自己定義Agent，還可以讓他們相互對(duì)話。

這是一個(gè)新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個(gè)星期內(nèi)，星標(biāo)量從390狂增到10K，并在Discord上吸引了5000多名成員。

如果說AutoGPT拉開了自主智能體（Autonomous Agent）的帷幕，那么前文提到的“西部世界小鎮(zhèn)”則開啟了生成智能體（Generative Agent）之路。

生成智能體就像美劇《西部世界》中的人形機(jī)器人或《失控玩家》中的智能NPC，它們?cè)谕画h(huán)境中生活，擁有自己的記憶和目標(biāo)，不僅與人類交往，還會(huì)與其他機(jī)器人互動(dòng)。

總的來說，AI Agent是一個(gè)能夠自主行動(dòng)、執(zhí)行任務(wù)的“小助手”，能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng)，會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟，依靠來自外界的反饋和自主思考，為自己創(chuàng)建prompt以實(shí)現(xiàn)目標(biāo)。

比如，讓AI Agent買一杯咖啡，它會(huì)首先拆解如何才能為你購(gòu)買一杯咖啡并擬定代用某APP下單以及支付等若干步驟，然后按照這些步驟調(diào)用APP選擇外賣，再調(diào)用支付程序下單支付，過程無(wú)需人類去指定每一步操作。

而目前基于LLM的ChatGPT給出的反饋，只能止于“無(wú)法購(gòu)買咖啡，它只是一個(gè)文字AI助手”之類的回答。

這也就不難理解，為什么AI Agent會(huì)是大模型的下一個(gè)高地——大模型聚焦于處理語(yǔ)言相關(guān)的任務(wù)，它并不直接與現(xiàn)實(shí)世界互動(dòng)，而AI Agent強(qiáng)調(diào)解決實(shí)際問題的能力和與環(huán)境交互的全面性。

二、AI Agent加速落地

事實(shí)上，大模型還沒有出現(xiàn)之前，一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結(jié)合應(yīng)用。因此，AI Agent在各領(lǐng)域的落地比大家預(yù)想得要快很多。

目前，海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務(wù)、人力資源、金融、制造業(yè)等多個(gè)領(lǐng)域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品，例如：

在醫(yī)療領(lǐng)域，Agent可以幫助診斷、治療和監(jiān)測(cè)患者。IBM Watson Health 是一個(gè)AI智能體，可以分析醫(yī)療數(shù)據(jù)，以識(shí)別潛在的健康問題并推薦治療方案。

在金融領(lǐng)域，Agent可以分析財(cái)務(wù)數(shù)據(jù)、檢測(cè)欺詐行為并提出投資建議。嘉信理財(cái)（Charles Schwab）使用名為Intelligent Portfolio的人工智能智能體，根據(jù)客戶的投資目標(biāo)創(chuàng)建和管理投資組合。

在零售業(yè)務(wù)場(chǎng)景中，Agent可以提供個(gè)性化推薦，改善供應(yīng)鏈管理，增強(qiáng)客戶體驗(yàn)。亞馬遜的Alexa是一個(gè)AI智能體，可以推薦產(chǎn)品、下訂單和跟蹤發(fā)貨。

在制造業(yè)，Agent可以優(yōu)化生產(chǎn)流程，預(yù)測(cè)維護(hù)需求，提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實(shí)時(shí)監(jiān)控機(jī)器，以預(yù)測(cè)和防止設(shè)備故障。

在運(yùn)輸領(lǐng)域，自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動(dòng)駕駛車輛，并幫助駕駛員停車、變道和安全駕駛。

不僅如此，在底層技術(shù)方面，AI Agent也打下了不錯(cuò)的基礎(chǔ)。

例如，OpenAI開發(fā)的GPTs，以及推出的GPT-4Turbo和可定制AI Agent，提供了基礎(chǔ)Agent的構(gòu)建能力，如工具調(diào)用、基于知識(shí)庫(kù)文件記憶能力等，使得AI Agent進(jìn)入了另外一個(gè)新階段，即人人都可以打造自己的Agent。

但總的來說，AI Agent技術(shù)還處于比較早期的階段，主要在兩個(gè)類型的場(chǎng)景中更容易落地：

一類是具有交互性質(zhì)的場(chǎng)景。

例如，智能機(jī)器人和問答式交互，這與AI Agent的迭代性質(zhì)天生匹配。在這種情境下，對(duì)于一些簡(jiǎn)單的任務(wù)，比如購(gòu)買火車票或解決企業(yè)內(nèi)部IT服務(wù)的問題，任務(wù)型機(jī)器人的應(yīng)用效果較好，并且相對(duì)容易維護(hù)。

另一類是線性執(zhí)行任務(wù)的場(chǎng)景。

例如，一家支付公司要求用戶在開戶時(shí)提交身份證明，在這種場(chǎng)景下，前臺(tái)是單向的，但后臺(tái)可以利用AI Agent執(zhí)行，相較于原有的流水線，AI Agnet更為高效。

三、AI Agent落地挑戰(zhàn)

盡量理想很美好，但當(dāng)前市場(chǎng)上的大多數(shù)AI Agent，其實(shí)只是構(gòu)建了一個(gè)基于特定知識(shí)庫(kù)或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進(jìn)行問答交互，如獲取行業(yè)資訊、報(bào)告等，在程序聯(lián)動(dòng)和操作方面還有很大的提升空間。

在一些更復(fù)雜的場(chǎng)景中，現(xiàn)有的AI Agent技術(shù)只能做到輔助，無(wú)法完全實(shí)現(xiàn)自動(dòng)執(zhí)行。

這背后的原因有很多，包括技術(shù)能力、商業(yè)化路徑、應(yīng)用場(chǎng)景等，都會(huì)影響Agent的能力體現(xiàn)。

首當(dāng)其沖的，依然是技術(shù)問題。

LLM作為AI Agent的認(rèn)知核心，其智能性在很大程度上決定了AI Agent感知環(huán)境、做出決策并執(zhí)行適當(dāng)行動(dòng)的能力。但就目前而言，包括GPT-4在內(nèi)的所有大模型，能力仍需提升。

同時(shí)，AI Agent繼承了LLM的一些問題，比如“幻覺”、“可解釋性”等問題。此外，對(duì)于底層基礎(chǔ)模塊的質(zhì)量和性能，包括調(diào)用圖像識(shí)別等模型，也會(huì)直接影響到上層建筑的性能。

此外，Agnet各個(gè)模塊之間的交互和運(yùn)行可能會(huì)產(chǎn)生許多中間結(jié)果和狀態(tài)，這也帶來了一些技術(shù)挑戰(zhàn)。例如，處理中間結(jié)果的魯棒性是一個(gè)問題，下層模塊的性能和質(zhì)量會(huì)直接影響上層模塊的執(zhí)行。

其次，AI Agent的落地效果也受限于應(yīng)用場(chǎng)景。

例如，在出行預(yù)訂中，得益于豐富的API等問題，AI Agent表現(xiàn)出色。而在如法律助手場(chǎng)景中，由于新知識(shí)的頻繁出現(xiàn)和API的不完善，實(shí)際應(yīng)用面臨更多挑戰(zhàn)。

這一點(diǎn)，從國(guó)內(nèi)AI Agent紛紛生長(zhǎng)于協(xié)同辦公平臺(tái)就可見一斑。

由于協(xié)同辦公平臺(tái)本身具備良好的API接口和插件體系，這使得將大模型集成到現(xiàn)有工具中變得更加容易。

同時(shí)，許多企業(yè)都在使用協(xié)同辦公軟件，這意味著廣泛的用戶基礎(chǔ)可以加速大模型的迭代和優(yōu)化過程，使其更好地滿足用戶需求。

最后，找到切入點(diǎn)以及好的商業(yè)模式至關(guān)重要。

AI Agent爆發(fā)的一段時(shí)間，人們普遍認(rèn)為補(bǔ)齊了大模型短板的AI Agent更具備實(shí)用性，將是大模型重要落地方向。

但就目前而言，這一路徑的商業(yè)化存在諸多問題。拿游戲場(chǎng)景而言，目前收費(fèi)主要來源于出售游戲裝備、皮膚等方式，而AI Agent的價(jià)值無(wú)法體現(xiàn)在這些固有的變現(xiàn)途徑上。

由于AI Agent落地效果未出現(xiàn)顛覆性的能力，C端用戶是否會(huì)為其買單無(wú)法得知，能否成為AI大模型從C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向，還需時(shí)間驗(yàn)證。

相對(duì)來說，B端可能更適合AI Agent的落地。在Agent構(gòu)建平臺(tái)上，企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件；軟件廠商也可以基于此平臺(tái)構(gòu)建軟件為企業(yè)提供服務(wù)。

但這仍需要成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評(píng)估。