在企業(yè)內(nèi)部落地大模型效果好嗎?——我們?cè)撛趺醋?/h2>
0 評(píng)論 2441 瀏覽 20 收藏 14 分鐘

大模型賽道現(xiàn)在發(fā)展如火如荼,但大家都是在卷價(jià)格,卷應(yīng)用,關(guān)于場(chǎng)景的討論較少。這篇文章,我們來看看大模型在行業(yè)內(nèi)、企業(yè)內(nèi),正在發(fā)生的變化。

每一次新技術(shù)的到來,都引得各家蜂擁而上。大模型的熱浪,燒到了全球每個(gè)角落。在底層大模型、及應(yīng)用架構(gòu)探索方面,美國(guó)遙遙領(lǐng)先。在應(yīng)用層面上,中國(guó)會(huì)像互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)一樣,取得百家爭(zhēng)鳴甚至趕超歐美的盛況嗎,大概率會(huì),但尚需多少時(shí)日,暫不得而知。但有一點(diǎn)是明確的,敢于嘗鮮的獵人,已經(jīng)出發(fā)……下面就讓我們來看看,在行業(yè)內(nèi)、企業(yè)內(nèi),正在發(fā)生的變化。

一、生成式AI應(yīng)用方向

生成式AI應(yīng)用可以分為四大類,每個(gè)領(lǐng)域都在思考,這次變革對(duì)當(dāng)下的工作、生活會(huì)帶來什么樣的變化,要怎么做才能登上“甲板”~

二、引入大模型,我們的工作會(huì)發(fā)生什么變化?

下面,用一張圖推演下,當(dāng)有了AI的協(xié)助,我們的工作狀態(tài)會(huì)發(fā)生怎樣的變化……

Copilot跟Agent的區(qū)別,筆者認(rèn)為,copilot更多的依賴人類的大腦。Agent相比之下,有更高的自主性。所以,在“教-學(xué)”的環(huán)節(jié),筆者用了Copilot這個(gè)詞。

三、Agent架構(gòu)為大模型加配了四件套

Agent(智能體)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體(感知、記憶、工具、行動(dòng))。不同于傳統(tǒng)的人工智能,Agent具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。在有LLM作為其大腦之后,Agent更是具備了對(duì)通用問題的自動(dòng)化處理能力。

Agent架構(gòu)賦予大型語(yǔ)言模型(如 LLM)一種解決問題的“策略性思維結(jié)構(gòu)”。該框架模擬了人類處理問題的過程,實(shí)現(xiàn)群體智能的模擬與構(gòu)建,即“規(guī)劃、執(zhí)行及反饋的智能決策循環(huán)”。該架構(gòu)可以用來搭建,第一章節(jié)中提及的生成式AI的四個(gè)演進(jìn)方向,根據(jù)領(lǐng)域or場(chǎng)景的差異,有些做到copilot即可,有些需要達(dá)成agent,多agent,甚至是AIGC。自23年6月首次提出以來,已經(jīng)有海量的資訊專門探討、介紹AI Agent,在此不多著墨。

在該資料基礎(chǔ)上擴(kuò)充https://zhuanlan.zhihu.com/p/666913254

四、讓大模型發(fā)揮作用,“模型”本身的能力、實(shí)現(xiàn)Agent的“架構(gòu)”、“人”三者都很重要

LLM是集合了人類的智慧,通過自然語(yǔ)言交互可以給你答案,但是要想讓這個(gè)“智腦”切實(shí)的幫助你,需要跟他交互的“人”的智慧,也需要“讓大腦聯(lián)合手腳(Agent)”的工程框架的能力。

4.1 如何高效、低成本的搭建Agent?

AI Agent是高度可訓(xùn)練的,像新員工入職時(shí)一樣需要培訓(xùn)。需要從業(yè)務(wù)場(chǎng)景->Agent能力->平臺(tái)功能->技術(shù)支持的一連串的推導(dǎo),只有把SOP提煉、總結(jié)的足夠精準(zhǔn)和細(xì)致化,才更有利于one by one的去搭建、調(diào)優(yōu)。

4.2 分析業(yè)務(wù)場(chǎng)景SOP定位需求為搭建Agent做好準(zhǔn)備

以汽車銷售場(chǎng)景為例,從最開始的了解到推薦,歷經(jīng)9個(gè)步驟。每個(gè)步驟中,都有關(guān)鍵用戶行為合計(jì)22項(xiàng)。對(duì)各個(gè)營(yíng)銷觸點(diǎn),用戶有各自的感受,有評(píng)價(jià),有訴求(痛點(diǎn))。對(duì)應(yīng)的,企業(yè)內(nèi)部對(duì)應(yīng)的在這些環(huán)節(jié)上,形成了具體的需求,希望借助大模型的能力,可以為整體鏈路提效、提升用戶體驗(yàn)和滿意度。

引用自:神策數(shù)據(jù)出品的“汽車行業(yè)CJO解決方案”

4.3 應(yīng)用場(chǎng)景->原子化->產(chǎn)品->技術(shù)能力->模型->服務(wù)

其一,抽象通用原子化能力,以復(fù)用,可以是agent,可以是插件,可以是信息庫(kù)~。這些原子化的組件可以快速組裝到業(yè)務(wù)所需要的大Agent中,類似N多個(gè)原子化的agent組成了MultiAgent。

其二,抽象特異性能力,以滿足特殊業(yè)務(wù)場(chǎng)景需要

五、如何搭建Agent?

目前,比較敏捷的方式,是通過“智能體搭建平臺(tái)”來實(shí)現(xiàn)。我們調(diào)研行業(yè)相關(guān)平臺(tái)工具,整理如下:

5.1、海外AI Agent構(gòu)建平臺(tái)

5.2 國(guó)內(nèi)AI Agent搭建平臺(tái)

六、想落地效果好,還有很長(zhǎng)的路要走

6.1、跟大模型的交互,給大模型投喂的“信息”很重要

大模型被認(rèn)為可以達(dá)到本科畢業(yè)生同等的認(rèn)知能力,因此,當(dāng)大模型具備領(lǐng)域知識(shí)時(shí),可以不依賴knowledge,可以從information到wisdom。大模型的推理能力很強(qiáng),但推理的效果,要依賴“信息”。這好比大模型是土地,長(zhǎng)出什么莊稼,要看喂給它的“種子”,“準(zhǔn)確的、結(jié)構(gòu)化的”信息or知識(shí),便于讓大模型懂。

  • 數(shù)據(jù)加工成信息的途徑:數(shù)據(jù)+定義和格式+時(shí)間范圍和相關(guān)性=>信息
  • 信息提煉成知識(shí)的途徑:信息+假設(shè)+關(guān)系+模式和趨勢(shì)=>知識(shí)
  • 知識(shí)變成智慧的途徑:知識(shí)+管理(收集、加工、應(yīng)用、傳播)+深刻認(rèn)識(shí)(洞察、判斷)+遠(yuǎn)見(預(yù)測(cè))=>wisdom,越接近智能化 ,對(duì)物理世界的還原越接近“真相”

6.2 在安全的范圍內(nèi)使用、觸碰“信息or知識(shí)”

大模型的能力,對(duì)信息的安全使用、合法“生成”、合規(guī)“觸碰”提出了更高的要求。識(shí)別和攔截的維度可以有多種,可是模型粒度的、Agent粒度的,也可以是基礎(chǔ)元素粒度的(插件、信息),具體根據(jù)業(yè)務(wù)需要去設(shè)置。

6.3 怎么提問,有門道?

跟大模型的交互,一般是通過prompt工程來實(shí)現(xiàn)的,如何問,是非常重要的。行業(yè)內(nèi)已經(jīng)有很多關(guān)于如何寫prompt工程的文章(角色扮演、零樣本提示、 少樣本提示),不再贅述。

這里,提醒應(yīng)該充分發(fā)揮大模型的優(yōu)勢(shì)能力——COT(Chain of Thought)能力。即大模型在解決問題時(shí)能夠展示其思考過程的能力。這種能力使得模型能夠像人類一樣,通過一系列邏輯推理步驟來解決復(fù)雜問題,而不僅僅是簡(jiǎn)單地輸出一個(gè)答案。COT能夠幫助人們理解模型是如何得出某個(gè)結(jié)論的,從而提高模型的透明度和可信度。

例如,假設(shè)我們要求大模型解決一個(gè)數(shù)學(xué)問題:

問題:一個(gè)直角三角形的兩條直角邊分別為3和4,求斜邊的長(zhǎng)度。

具有COT能力的大模型可能會(huì)這樣展示其思考過程:

理解問題:首先,我需要理解這是一個(gè)關(guān)于直角三角形的問題,且已知兩條直角邊的長(zhǎng)度。

應(yīng)用知識(shí):我知道根據(jù)勾股定理,直角三角形的斜邊(c)的長(zhǎng)度可以通過公式 ??=??2+??2c=a2+b2 來計(jì)算,其中a和b是兩條直角邊的長(zhǎng)度。

代入數(shù)值:在這個(gè)例子中,a=3,b=4。所以我將這些數(shù)值代入公式中:??=32+42c=32+42。

計(jì)算:計(jì)算各項(xiàng)的平方,得到 ??=9+16c=9+16。

求和:將平方相加,得到 ??=25c=25。

開方:計(jì)算平方根,得到 ??=5c=5。

得出結(jié)論:所以,這個(gè)直角三角形的斜邊長(zhǎng)度是5。

通過這種逐步展示思考過程的方式,COT能力不僅幫助用戶理解模型是如何得出答案的,還可以在教育、解釋復(fù)雜概念或決策過程時(shí)提供幫助。

6.4 將任務(wù)拆細(xì)以多Agent協(xié)作模式推進(jìn),比單Agent集合任務(wù)效果好

在面對(duì)復(fù)雜的任務(wù)挑戰(zhàn)時(shí),開發(fā)者可以通過細(xì)分任務(wù)并構(gòu)建多個(gè)Agent來完成。這一多Agent架構(gòu)賦予開發(fā)者集中精力打造具備單一而強(qiáng)大功能的AI應(yīng)用程序的能力,而不是勞神費(fèi)力地開發(fā)少數(shù)幾個(gè)功能繁雜的GPT模型。

這種轉(zhuǎn)向不僅極大地提升了AI應(yīng)用的專業(yè)性與工作效率,而且為開發(fā)者開辟了更廣闊的創(chuàng)新領(lǐng)域,加速了AI應(yīng)用開發(fā)的多元化和個(gè)性化進(jìn)程。

多Agent系統(tǒng)的出現(xiàn)還激發(fā)了對(duì)AI未來發(fā)展的新設(shè)想,比如實(shí)現(xiàn)不同Agent間的自主互動(dòng)和層次化協(xié)作,從而逐漸減少對(duì)人工干預(yù)的依賴,向AGI更進(jìn)一步。

6.5 其他可以提升Agent效果的途徑?

在分析清楚、理清業(yè)務(wù)邏輯的基礎(chǔ)上,在搭建Agent時(shí),工程鏈路的設(shè)計(jì)和開發(fā)也至關(guān)重要。當(dāng)業(yè)務(wù)場(chǎng)景需要跨出組織內(nèi)部,聯(lián)動(dòng)外部生態(tài)時(shí),生態(tài)系統(tǒng)的API開放能力和程度(即工具的完備度),也將影響Agent的效果。

底層大模型無時(shí)無刻的高速進(jìn)化著,跟大模型對(duì)接的Agent,也會(huì)因這種變化而發(fā)生波動(dòng),在這場(chǎng)空中加油的競(jìng)賽中,需要找準(zhǔn)路子,方向如果錯(cuò)了,越努力越遙遠(yuǎn)……,貼著行業(yè)動(dòng)向打,或許是一條更“實(shí)際”的路線,讓我們拭目以待!

關(guān)鍵詞:Agent、GPT、生成式AI、AIGC、LLM、AGI、Prompt、插件、MultiAgent、Agentbuilder

受作者領(lǐng)域認(rèn)知深度所限,且技術(shù)無時(shí)無刻不在更新迭代,無法在一篇中盡現(xiàn)全貌,能為大家?guī)ヒ稽c(diǎn)點(diǎn)新的啟發(fā),以深感欣慰。文中難免有紕漏或不準(zhǔn)確的地方,歡迎大家批評(píng)指正。若有任何建議或意見,歡迎聯(lián)系作者探討。

作者:shucay,佳琪,王麗、富璽、新遠(yuǎn)

本文由@shucay 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!