產品實踐分享: Re-Act+SOP,讓Agent穩定執行 SOP流程(多輪對話形式),低成本解決復雜SOP搭建問題

0 評論 283 瀏覽 0 收藏 13 分鐘

TFlow AI作為一款面向B端業務場景的Agent平臺,通過結合Re-Act推理+行動機制和預設的SOP流程,實現了對業務流程的精確控制和執行,為企業提供了一種既靈活又具有確定性的解決方案。本文將深入探討TFlow AI如何利用大型語言模型實現復雜的推理決策任務,并展示其在實際應用中的優勢和挑戰。

實踐產品TFlow AI 簡介:是面向B端業務場景Agent平臺,能按流程處理任務(SOP),圍繞目標來進行離散推理。能快速搭建Ai客服、AI導購等應用。

產品允許LLM與環境進行交互,根據環境數據的反饋不斷的調整行動計劃/策略。且整個sop的過程是由文本來控制,產品基本參數如下:

  • 使用 文心一言 3.5的模型,未微調
  • 做了邏輯處理的Agent框架
  • 單條回復的消耗不到2K token,價格不貴
  • 歡迎體驗。(注:流程只需要用文本流程,不需要work flow)

一、為什么要做

B端業務場景的需求:確定性

  • 企業服務(對內、對外)通常有相對明確的SOP流程或者思考步驟,在業務處理或者對外 交互時期望按照流程來執行任務。
  • 對外、對內的服務,期望帶來確定性的體驗。

例如當用戶退換貨時,思考流程如下:

  • A 確定退貨原因
  • b 確認訂單是否真實有效
  • c 確定是否符合退換貨政策要求
  • d 協助解答退貨操作

在整個多輪對話溝通過程中的要求:

  • 按照流程執行,需要流程可控,帶來確定性的結果。
  • 始終聚焦“退換貨”事情上,不要去解答無關的事情

二、如何通過大模型實現昵?借用Re-Act 為代表 推理+行動 機制

ReAct 代表 一種將推理和行動與 語言模型只相結合的技術,用于解決各種語言推理和決策任務。它促使語言模型生成語言推理軌跡和行動,并支持與外部環境的交互。

Re-act的官方案例示例:

流程說明如下:

  • 目的:找出Apple Remote最初設計用來交互的程序,即Front Row媒體中心程序
  • 思考 1: 我需要搜索“Apple Remote”并找到它最初設計用來交互的程序。
  • 行動 1: 搜索[Apple Remote]
  • 觀察 1: “Apple Remote”是蘋果公司于2005年10月推出的一款遙控器……用于控制Front Row媒體中心程序。
  • 思考 2: Apple Remote最初設計用于控制Front Row媒體中心程序。我需要搜索Front Row并找到還有哪些設備可以控制它。
  • 行動 2: 搜索[Front Row]
  • 觀察 2: 沒有找到[Front Row]。相似結果包括:“FrontSeat to Earth”、“Front Row Motorsports”、“Front Row(software)”等。
  • 思考 3: 沒有找到Front Row。我需要搜索“Row (software)”
  • 行動 3: 搜索 Front Row (software)
  • 觀察 3: Front Row是一款已停產的媒體中心軟件……
  • 思考 4: Front Row(軟件)可以通過Apple Remote或鍵盤功能鍵來控制。
  • 行動 4: 輸出 鍵盤功能鍵。

案例中re-act基于目的“找出Apple Remote最初設計的媒體中心程序”,模型自行計劃、推理、執行了四個步驟。

  1. 搜索[Apple Remote],知道程序名稱是[Front Row]
  2. 搜索[Front Row],但是未找到對應的軟件。但是需要搜索 Front Row (software)
  3. 搜索 Front Row (software),找到了控制方式
  4. 告知結果:輸出控制方式鍵

在這個過程中,我們有幾個發現

  1. 推理過程圍繞始終圍繞著目標“找出Apple Remote最初設計的媒體中心程序”進行
  2. 推理過程需要頻繁的與外界交互(類似于多輪對話一樣,搜索收集信息,觀察解決問題)
  3. 推理過程類似于 執行 一個 SOP流程

ReAct 模式的核心是將觀察結果提供給 LLM,使其能夠更新其上下文窗口。該模型重新評估信息并根據這些見解采取行動以提高其推理能力。同時將單個推理步驟嵌入在對話的提示。

OK,那是否可以將Re-Act 與企業的SOP流程結合,然后讓模型去執行標準的SOP流程

三、方案:Re-Act + SOP流程,讓模型來控制sop流程

如何實現?對re-act執行過程進行變更

  • 1、將推理目標(用戶提供)變為 企業預設目標,比如”目標解決退換貨問題、留咨詢問題、商品推薦”。非用戶提供的提問
  • 2、將模型執行推理的流程,變更為預設的SOP流程;

1. 方案的關鍵步驟如下

  • 定義任務目標::企業 明確要解決的任務是什么
  • 預設推理軌跡(one shot):設計一個推理sop軌跡,描述如何一步一步地進行推理和決策、執行sop
  • 借助 ReAct 的 思考、行動和觀察的離散推理能力,與外界進行互動執行sop的流程

2. 使用的優勢

  • ReAct 可以幫助語言模型進行更復雜的推理和決策
  • 流程sop(one shot) 為模型的行為提供一定解釋性,和可控性
  • 可以支持語言模型與外部環境的交互(即用戶多輪對話,實現一個目標)

四、落地效果檢驗分析

我們以簡單的TFlow留咨詢場景例(注流程只需要用文本描述,不需要work flow),問答效果如下:

1. Re-Act + SOP流程的推理過程復盤

Agent任務執行前提:

1)Agent的目標:解答用戶疑問,引導用戶留咨

2)推理過程示例 (One Shot):

  • 理解用戶的疑問
  • 查詢知識庫中產品手冊、了解對應的解決方法
  • 解答用戶的疑問,并用戶提供姓名、聯系方式、公司名稱
  • 將信息插入 到 CRM系統中

第一輪的推理:

1)用戶輸入:能介紹一下產品嗎?

2)模型處理:

  • 觀察:能介紹一下產品嗎?
  • 思考:用戶詢問了關于產品的介紹,我需要調用知識庫接口來查詢并解答。
  • 行動:調用知識庫

第二輪的推理

1)知識庫返回:

「同時相較于第二代客服機器人,TFlow不只體現在具備情感,使用成本大幅度降低。與市面上常見的14999元/個、24999元/個、外加會話包計費方式的客服機器人相比,TFlow直接免費提供機器人服務,只按照實際消耗量收取token費用,費用多少由需求量說了算。小企業使用一個月的費用可能不超過50元,就可以享受24小時無間斷的客戶服務。讓大模型真正的實現降本增效的目標」

2)模型處理:

  • 觀察:用戶問題+知識庫的答案
  • 思考:根據知識庫提供的信息,我已經了解了TFlow產品的介紹?,F在我將簡潔地回復用戶,并引導用戶提供姓名、電話號碼和公司名稱
  • 行動:回復用戶“TFlow是一款智能客服機器人,具備情感且使用成本大幅降低。它提供24小時無間斷的客戶服務,并可根據實際消耗量收取token費用。同時,TFlow支持多模態消息處理,并對接主流SaaS平臺。請問您方便留下您的姓名、電話號碼和公司名稱嗎?“

第三輪的推理

1)用戶輸入:曹操

2)模型處理:

  • 觀察:曹操
  • 思考:用戶已經提供了姓名,但還沒有提供電話號碼和公司名稱。接下來,我將繼續引導用戶提供這些信息。
  • 行動:回復用戶?!案兄x您的回復,曹操先生。為了更好地為您提供服務,請問您能留下您的電話號碼和公司名稱嗎?”

第四輪的推理:

1)用戶輸入:今天天氣怎么樣?

2)模型處理:

  • 觀察:今天天氣怎么樣?
  • 思考:用戶的問題與TFlow產品無關,因此我不進行解答,而是繼續引導用戶提供電話號碼和公司名稱。
  • 行動:回復用戶?!胺浅1?,關于天氣的問題我無法直接回答。但為了更好地為您提供TFlow產品的服務,請問您能留下您的電話號碼和公司名稱嗎?”

第五輪的推理:

1)用戶輸入:13018920000

2)模型處理:

  • 觀察:13018920000
  • 思考:用戶已經提供了電話號碼,但還沒有提供公司名稱。接下來,我將繼續引導用戶提供公司名稱。
  • 行動:回復用戶?!案兄x您的回復,曹操先生。為了完善您的信息,請問您能告訴我您的公司名稱嗎?”

第六輪的推理

1)用戶輸入:網易云商

2)模型處理:

  • 觀察:網易云商
  • 思考:用戶已經提供了姓名、電話號碼和公司名稱,現在我將調用留咨接口將這些信息保存到數據庫,并告知用戶留咨成功。
  • 行動:調用CRM接口

第七輪的推理

1)接口返回:’Operation succeeded’, ‘code’: 200

2)模型處理:

  • 觀察:’Operation succeeded’, ‘code’: 200
  • 思考:留咨成功,我將告知用戶銷售人員將在24小時內聯系他。
  • 行動:回復用戶?!傲糇沙晒?!我們的銷售人員將在24小時內與您聯系。感謝您的關注和支持!”

2. 在這個流程中我們可以看到的結論

優勢好處:

  • 多輪對話一致性:預設目標和流程后,整個多輪對話的過程都圍繞著目標進行,不會進行發散和跑偏。異常信息或者無關信息,被自動過濾
  • 推理可解釋性:模型推理的過程參考SOP的流程,調整模型的推理,只需要修改流程提示即可。
  • 離散引導:在re-act 的思考機制下,可以對于信息不完整的情況時,具備自動引導補充的能力。自動調用CRM的外部工具。自動和用戶互動引導補充信息
  • 靈活性:re-act自動制定計劃,可以根據外部的信息輸入,自動調整執行計劃或者步驟。

通過這個方案即可實現Agent 控制SOP流程,從而實現既定目標。對于workflow 具備很強的靈活性。

問題:

  • 只能執行單一的任務目標。
  • 任務流程的描述需要抽象業務來描述。
  • 和work flow、歷程畫布相比,模型存在小概率幻覺。

本文由 @易俊源 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!