劍指「智能體」

0 評論 4740 瀏覽 1 收藏 18 分鐘

隨著人工智能技術(shù)的飛速發(fā)展,智能體(Agent)的概念逐漸走進(jìn)了公眾視野。這些智能體不僅能夠模仿人類的互動(dòng)方式,還能在特定環(huán)境中執(zhí)行任務(wù),解決復(fù)雜問題。從簡單的聊天機(jī)器人到能夠處理多輪對話和數(shù)據(jù)分析的高級智能體,它們正在成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧?/p>

關(guān)于ChatGPT做搜索的新聞,我一直挺感興趣。

上個(gè)月25號,OpenAI在當(dāng)?shù)赝瞥隽艘粋€(gè)新產(chǎn)品,名叫“SearchGPT”。官方說,產(chǎn)品能給用戶提供帶鏈接的搜索結(jié)果,用戶還可以繼續(xù)問問題,系統(tǒng)會(huì)根據(jù)上下文給出回答。

我看到消息后,馬上申請內(nèi)測。但一個(gè)月過去,官方還沒給我權(quán)限;現(xiàn)在網(wǎng)上辦法多。我就通過特殊朋友渠道,弄到了一個(gè)測試賬號,體驗(yàn)了一把。

體驗(yàn)之后什么感覺呢?

一句話總結(jié)即:perplexity AI解決不了的問題,SearchGPT也解決不了。

比如:AI幻覺。一千個(gè)觀眾有一千個(gè)哈姆雷特,不同的人看同一信息可能得出不同的結(jié)論。就算是同一個(gè)人,今天看到的東西和明天可能理解也會(huì)有所不同。

這就像AI面對復(fù)雜、多變的人類思維一樣,如果AI不能真正地“站在你的角度”去理解問題,感受你的感受,那它很難獨(dú)立地給出人們真正想要的答案。

因此,除非AI能達(dá)到這樣高級的理解和適應(yīng)能力,不然,AI永遠(yuǎn)無法避開幻覺問題。所以,怎么辦呢?

01

來看看另一個(gè)新聞:

不久前,Twitter上有個(gè)名叫@iruletheworldmo的用戶頻繁爆料,談到Project Strawberry(草莓計(jì)劃),這是OpenAI的一個(gè)項(xiàng)目,以前叫Q-Star。

這個(gè)計(jì)劃目標(biāo)是讓AI變得更聰明,更能自主。簡單來說,他們希望訓(xùn)練出來的AI能自己處理很多事,不需要人來監(jiān)督。

這意味著,AI將能自己搜索信息,深入研究問題,甚至自己創(chuàng)造數(shù)據(jù),這樣就能減少對人類的依賴。也就是說,AI可能會(huì)變得更像人,更會(huì)思考。

這條推文引起了不少人的關(guān)注,大家都在猜到底是不是OpenAI內(nèi)部信息,但還沒等到官方回復(fù),就有人跳出來了,這人叫Div Garg,是MultiOn公司的創(chuàng)始人。

他說:

OpenAI的“Q”還沒正式出來,但我們已經(jīng)推出了一個(gè)新的智能體,叫“Agent Q”,并且邀請大家來試試,很多人懷疑他在利用OpenAI的秘密項(xiàng)目來做廣告。

我查了查,發(fā)現(xiàn)MultiOn這家公司確實(shí)在2023年接受了OpenAI、DeepMind等公司、高管個(gè)人的投資;所以,讓人不禁猜想,OpenAI做的搜索項(xiàng)目,和他們到底有沒有關(guān)系?

好吧。姑且,不論這事,來看看MultiOn這家公司。

MultiOn專門做AI智能體,目標(biāo)是,通過智能體幫助人們完成日常任務(wù),比如:網(wǎng)頁瀏覽、網(wǎng)購和郵件處理,他們希望構(gòu)建一個(gè)能在數(shù)字世界里,能自主完成復(fù)雜任務(wù)的AI系統(tǒng)。

這么一看,兩者之間確實(shí)有些相似。相似在哪呢?

我們換個(gè)角度:

請問,你解決不了AI搜索幻覺的問題,還要不要解決?作為普通人的我們當(dāng)然覺得,要。必須解決。其實(shí),單一視角往往會(huì)限制我們。

系統(tǒng)科學(xué)家羅素·艾可夫(Russell L. Ackoff),在作品《問題解決的藝術(shù)》中提到:

復(fù)雜問題往往源于問題定義本身,如果能夠以新的視角、新框架重新定義問題,有時(shí)能發(fā)現(xiàn)原本看似復(fù)雜的問題,其實(shí)有更簡單的解決之道,或者,原本的問題根本就不需要以傳統(tǒng)的方式解決。

也就是說:解決一個(gè)復(fù)雜問題,最好的辦法是,繞開把它轉(zhuǎn)成一個(gè)非問題。

舉個(gè)通俗的例子:

想象一下,你家廚房每次做完飯都一團(tuán)糟。通常,你可能會(huì)選擇在烹飪后進(jìn)行一次大掃除,這樣雖然能清理干凈,但每次要花費(fèi)大量時(shí)間和精力。

如果你換一個(gè)角度來看就不一樣了。類似,重新組織廚房物品,把常用的廚具、調(diào)料放在容易拿到的地方,不常用的東西則收好。

改進(jìn)烹飪流程,做飯時(shí),邊做邊清洗用過的器具,甚至,在操作臺上放一個(gè)垃圾桶,用于臨時(shí)收集廚余和垃圾。

這樣,是不是做飯過程中就能持續(xù)保持廚房整潔了?這就是,非問題化;重新定義問題和調(diào)整處理方式,使原本要解決的問題變得不再是問題。

02

那么,這和搜索與智能體之間有什么關(guān)系呢?來看看,OpenAI首席執(zhí)行官Sam Altman在2024年4月25日斯坦福大學(xué)的演講。

他說,AI實(shí)現(xiàn)通用人工智能(AGI)要經(jīng)過五個(gè)階段:

  • 一級:能夠進(jìn)行對話交互的人工智能;
  • 二級:系統(tǒng)能夠解決博士級別的問題。
  • 三級:系統(tǒng)能夠代表用戶工作幾天;
  • 四級:人工智能能夠開發(fā)創(chuàng)新。
  • 五級:人工智能系統(tǒng)可以執(zhí)行組織的工作。

他并指出,目前OpenAI處于第一級,接近第二級。

考慮到進(jìn)展,請思考一下,這樣一個(gè)AI行業(yè)巨頭,如何從當(dāng)前階段過渡到更高級階段,比如“三級或四級,或者說,如何讓弱人工智能到強(qiáng)人工智能?讓技術(shù)更能滿足每個(gè)用戶第一場景使用情況?

答案很明顯:AI智能體。

因?yàn)?,智能體是過度解決問題的最好辦法。想象一下,在理想狀態(tài)下,面對億萬用戶時(shí),如果能夠展示數(shù)千萬個(gè)AI解決方案,來幫助大家解決各種問題,那么,無疑是最有效的。

畢竟,每個(gè)人都能找到符合自己需求的解決方案,極大提到了解決問題的效率和質(zhì)量。

為什么是智能體?

昨天,一個(gè)朋友抱怨說,買房后要還貸款,未來幾十年每月都要還幾千塊錢;他讓我?guī)兔λ阋凰?,到目前為止,他一共還了多少本金和利息,如果他想提前還款,根據(jù)現(xiàn)在的政策,可以節(jié)省多少錢。

這種復(fù)雜的問題我怎么能解決?于是,我把它給了豆包。

我先描述基本情況,讓豆包記住,然后,再把其他想法和訴求告訴它。大概幾十輪的對話后,豆包幫我詳細(xì)計(jì)算了出來,并生成一份大約600字的詳細(xì)分析報(bào)告。

這份報(bào)告包括了完整的背景信息、我的具體訴求、計(jì)算過程和對比分析等。

你用過豆包,或者其他可以和AI對話的工具么?不知道你有沒有發(fā)現(xiàn),現(xiàn)在此類對話工具,連續(xù)上下文邏輯能力變強(qiáng)了。

我再說一個(gè)貼身經(jīng)歷:

最近幾天,經(jīng)常接到一些奇怪的電話,涉及內(nèi)容如貸款、房產(chǎn)購買、京東優(yōu)惠等。

這些電話中,上來就問需要、不需要、行或者不行。我發(fā)現(xiàn),對方語氣很像真人,但當(dāng)我給出它們設(shè)定范圍以外的問題時(shí),它無法回答了。

這說明,智能體已經(jīng)在不知不覺中融入了日常生活,它們,能夠在特定的環(huán)境中模仿人類的互動(dòng)方式。

所以,一個(gè)完整智能體,能夠充分與環(huán)境互動(dòng),這包括智能體自身和它所處的環(huán)境兩個(gè)部分;就像人類在物理世界中的行為一樣,智能體在其“外部環(huán)境”中也能執(zhí)行任務(wù)。

說白了,我可以與它交互,也能設(shè)定好指令,界定范圍,讓它幫我完成目標(biāo)。

對比下來,是不是不難看出,智能體無疑是繞過AI搜索中幻覺問題、并成功商用的有效方式之一?

為什么這么說?

你想想看,考慮傳統(tǒng)AI搜索和提問時(shí),AI搜索直接給出答案,這種答案比較扁平化,不具備連貫性。換言之,你提出一個(gè)問題,AI直接給你一個(gè)結(jié)論,結(jié)論會(huì)引用來自多個(gè)信息源的數(shù)據(jù)。就結(jié)束了。

智能體工作方式不同。

它不僅對單一問題做出反應(yīng),還會(huì)引入外部信息,在一連串多輪問答中,會(huì)反復(fù)接受來自你的信號,通過這種互動(dòng),它更能理解你的訴求。

在解決問題之后,它能生成一篇簡短的文章、總結(jié)方案,把整個(gè)互動(dòng)過程指標(biāo)串聯(lián)在一起;很明顯,智能體不是一個(gè)簡單的AI提問、總結(jié)工具,是一個(gè)完全符合每個(gè)人需求的系統(tǒng)。

因此,智能體能完美繞過AI幻覺,畢竟過程中,你不滿意時(shí),能一次次糾正它的錯(cuò)誤。

03

縱觀國內(nèi)市場,目前誰在做智能體呢?我查閱了一下,據(jù)說有超過4500家,比如:大家耳熟能詳?shù)陌俣?、科大訊飛、云從科技、字節(jié)跳動(dòng)和騰訊等。

所以,誰在做智能體,這個(gè)問題不好解答。與其這樣,不如換種思考方式:智能體類型有哪些?我們通過類型看各家所在的生態(tài)位。

我盤點(diǎn)結(jié)果是:

智能體(Agent)平臺大體上分為兩類:一類基于知識庫和數(shù)據(jù)庫的。就像聊天機(jī)器人(Chatbot)這種簡單的平臺;另一類是用來解決更復(fù)雜問題的。這種平臺有多工作流編排的能力,比較高級。

國外Orkes Conductor、ControlFlow by Team Prefect、和 Flyte等平臺,就是專為復(fù)雜工作流和數(shù)據(jù)處理設(shè)計(jì)的。

這些平臺主要用戶包括數(shù)據(jù)科學(xué)家、工程師、開發(fā)者,他們用平臺來建立和優(yōu)化復(fù)雜的工作流程,提高數(shù)據(jù)處理的效率和自動(dòng)化水平。

國內(nèi)也有類似的平臺。像扣子Coze、百度智能云的千帆AgentBuilder、科大訊飛的星火智能體平臺,還有騰訊的元?dú)夂桶⒗镌频腁gentScope等。

他們利用大模型搭建 AI 原生應(yīng)用工作臺,給開發(fā)者提供 RAG、Agent、GBI 等應(yīng)用框架,賦能他們開發(fā)出來文生文、對話、文生表等垂直應(yīng)用,以幫助企業(yè)和個(gè)人解決問題。

我根據(jù)對象、流程和代碼復(fù)雜程度,把它細(xì)分成三類:

  1. 面向公眾和非開發(fā)人員
  2. 面向開發(fā)者的平臺
  3. 企業(yè)級開發(fā)平臺

第一種,主要偏向低代碼平臺,不要你懂太多編程。

像GPTs這樣的工具,提供很標(biāo)準(zhǔn)的操作界面和流程,主要用來做基于知識庫的聊天機(jī)器人。給你一個(gè)模板,你按步驟填信息就行,不用自己調(diào)整太多東西。

字節(jié)跳動(dòng)的扣子(國內(nèi)版),就是被設(shè)計(jì)來幫助人們輕松創(chuàng)建下一代的AI聊天機(jī)器人。

第二種平臺功能更強(qiáng)大,可以讓開發(fā)者用各種API、第三方庫,還能自己編寫代碼和調(diào)整參數(shù),來精細(xì)控制智能體的行為。

Coze海外版很受歡迎,它的功能全面,支持很多高級操作。像百度、阿里和亞馬遜也提供這樣的平臺,讓開發(fā)者可以用各種AI模型來做更復(fù)雜的應(yīng)用。

企業(yè)開發(fā)平臺,專為企業(yè)設(shè)計(jì),重點(diǎn)是幫助企業(yè)自動(dòng)化他們的工作流程。

比如:

實(shí)在智能的TARS-RPA-Agent和壹沓科技的“數(shù)字員工團(tuán)隊(duì)”CubeAgent,它們是用來自動(dòng)化企業(yè)日常操作的。

還有國外的Torq和國內(nèi)瀾碼科技的AskXbot平臺,也提供了大模型結(jié)合企業(yè)知識庫的解決方案,幫助企業(yè)自動(dòng)化處理更多復(fù)雜任務(wù)。

三種類型各有千秋,這么說,是不是更清楚一些?那么,站在AI搜索和智能體中間來看,智能體屬于那種呢?

04

解答該問題,不妨站在行業(yè)結(jié)構(gòu)視角看。我盤了一下,智能體(Agent)行業(yè)結(jié)構(gòu)有四層,分別為:基礎(chǔ)工具層、運(yùn)營平臺層、開發(fā)工具層,以及服務(wù)與培訓(xùn)平臺層。

組件是做智能體必不可少的基礎(chǔ)。有各種智能模塊、記憶模塊,比如語言模型、數(shù)據(jù)庫,還有一些安全工具和通信工具,就像蓋房子的磚塊和水泥。

運(yùn)營層,包括制作Agent組件的廠商和各種運(yùn)營集成平臺。如GitHub這樣的Agent框架發(fā)布平臺,它們提供必要的環(huán)境和服務(wù),支持智能體運(yùn)行。

開發(fā)層相對容易理解了。

像Agent工具集成平臺AgentLego、或提供專屬云環(huán)境及沙盒環(huán)境的平臺等,它們使開發(fā)者能夠構(gòu)建、測試和部署智能體。

值得一提的是,像NexusGPT、Relevance AI等平臺,它們提供數(shù)字員工Agent的訓(xùn)練服務(wù),目的幫助企業(yè)把智能體整合進(jìn)現(xiàn)有的工作流程中,或者幫助個(gè)人創(chuàng)建能自動(dòng)完成任務(wù)的AI團(tuán)隊(duì),這反而是目前很多企業(yè)剛需。

國內(nèi)也有類似的公司。例如:

金柚網(wǎng)的梧桐數(shù)字員工、壹沓科技的數(shù)字員工平臺1Data Agent,以及實(shí)在智能的RPA Agent。

這些平臺的特點(diǎn)是允許用戶通過聊天,輕松與智能體互動(dòng),管理和優(yōu)化各種業(yè)務(wù)流程,使智能體理解和執(zhí)行復(fù)雜任務(wù),讓日常更高效。

不論怎么說,從短期發(fā)展看,智能體要解決兩個(gè)問題:

  1. 豐富通用工作流和場景工作流,類似于AI搜索下的大搜,還要在處理數(shù)據(jù)訓(xùn)練、多輪對話的準(zhǔn)確性上下功夫。
  2. 讓智能體成為知識專家,形成可持續(xù)的服務(wù)能力。有點(diǎn)像針對特定領(lǐng)域進(jìn)行深入挖掘。

比如,假設(shè)我是做消費(fèi)品營銷的,如果有一個(gè)專門的智能體,它學(xué)了很多關(guān)于社交媒體趨勢、消費(fèi)者行為的知識,那么,它就能真正幫到業(yè)務(wù)。

當(dāng)然,智能體在其他行業(yè)也在不斷爆發(fā),像游戲,金融、醫(yī)療等,總體上說,基于LLM的能力,下一步基礎(chǔ)智能體必將是繞不開的一步。

總結(jié)

讓它光思考,遠(yuǎn)遠(yuǎn)不夠。

想實(shí)現(xiàn)真正全面AGI,得把對話模型變成基本智能體,讓它參與到實(shí)際使用中去;就像人們常說的,從實(shí)踐中來,到實(shí)踐中去一樣。

所以,AI生成避免不了幻覺,但智能體的輪番交互,可以微調(diào),可以解決具體問題,至少,使用場景下,這是閉環(huán)的正向反饋動(dòng)作。

本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】,微信公眾號:【王智遠(yuǎn)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!