產品實踐分享: Re-Act+SOP,讓Agent穩定執行 SOP流程(多輪對話形式),低成本解決復雜SOP搭建問題
TFlow AI作為一款面向B端業務場景的Agent平臺,通過結合Re-Act推理+行動機制和預設的SOP流程,實現了對業務流程的精確控制和執行,為企業提供了一種既靈活又具有確定性的解決方案。本文將深入探討TFlow AI如何利用大型語言模型實現復雜的推理決策任務,并展示其在實際應用中的優勢和挑戰。
實踐產品TFlow AI 簡介:是面向B端業務場景Agent平臺,能按流程處理任務(SOP),圍繞目標來進行離散推理。能快速搭建Ai客服、AI導購等應用。
產品允許LLM與環境進行交互,根據環境數據的反饋不斷的調整行動計劃/策略。且整個sop的過程是由文本來控制,產品基本參數如下:
- 使用 文心一言 3.5的模型,未微調
- 做了邏輯處理的Agent框架
- 單條回復的消耗不到2K token,價格不貴
- 歡迎體驗。(注:流程只需要用文本流程,不需要work flow)
一、為什么要做
B端業務場景的需求:確定性
- 企業服務(對內、對外)通常有相對明確的SOP流程或者思考步驟,在業務處理或者對外 交互時期望按照流程來執行任務。
- 對外、對內的服務,期望帶來確定性的體驗。
例如當用戶退換貨時,思考流程如下:
- A 確定退貨原因
- b 確認訂單是否真實有效
- c 確定是否符合退換貨政策要求
- d 協助解答退貨操作
在整個多輪對話溝通過程中的要求:
- 按照流程執行,需要流程可控,帶來確定性的結果。
- 始終聚焦“退換貨”事情上,不要去解答無關的事情
二、如何通過大模型實現昵?借用Re-Act 為代表 推理+行動 機制
ReAct 代表 一種將推理和行動與 語言模型只相結合的技術,用于解決各種語言推理和決策任務。它促使語言模型生成語言推理軌跡和行動,并支持與外部環境的交互。
Re-act的官方案例示例:
流程說明如下:
- 目的:找出Apple Remote最初設計用來交互的程序,即Front Row媒體中心程序
- 思考 1: 我需要搜索“Apple Remote”并找到它最初設計用來交互的程序。
- 行動 1: 搜索[Apple Remote]
- 觀察 1: “Apple Remote”是蘋果公司于2005年10月推出的一款遙控器……用于控制Front Row媒體中心程序。
- 思考 2: Apple Remote最初設計用于控制Front Row媒體中心程序。我需要搜索Front Row并找到還有哪些設備可以控制它。
- 行動 2: 搜索[Front Row]
- 觀察 2: 沒有找到[Front Row]。相似結果包括:“FrontSeat to Earth”、“Front Row Motorsports”、“Front Row(software)”等。
- 思考 3: 沒有找到Front Row。我需要搜索“Row (software)”
- 行動 3: 搜索 Front Row (software)
- 觀察 3: Front Row是一款已停產的媒體中心軟件……
- 思考 4: Front Row(軟件)可以通過Apple Remote或鍵盤功能鍵來控制。
- 行動 4: 輸出 鍵盤功能鍵。
案例中re-act基于目的“找出Apple Remote最初設計的媒體中心程序”,模型自行計劃、推理、執行了四個步驟。
- 搜索[Apple Remote],知道程序名稱是[Front Row]
- 搜索[Front Row],但是未找到對應的軟件。但是需要搜索 Front Row (software)
- 搜索 Front Row (software),找到了控制方式
- 告知結果:輸出控制方式鍵
在這個過程中,我們有幾個發現
- 推理過程圍繞始終圍繞著目標“找出Apple Remote最初設計的媒體中心程序”進行
- 推理過程需要頻繁的與外界交互(類似于多輪對話一樣,搜索收集信息,觀察解決問題)
- 推理過程類似于 執行 一個 SOP流程
ReAct 模式的核心是將觀察結果提供給 LLM,使其能夠更新其上下文窗口。該模型重新評估信息并根據這些見解采取行動以提高其推理能力。同時將單個推理步驟嵌入在對話的提示。
OK,那是否可以將Re-Act 與企業的SOP流程結合,然后讓模型去執行標準的SOP流程
三、方案:Re-Act + SOP流程,讓模型來控制sop流程
如何實現?對re-act執行過程進行變更
- 1、將推理目標(用戶提供)變為 企業預設目標,比如”目標解決退換貨問題、留咨詢問題、商品推薦”。非用戶提供的提問
- 2、將模型執行推理的流程,變更為預設的SOP流程;
1. 方案的關鍵步驟如下
- 定義任務目標::企業 明確要解決的任務是什么
- 預設推理軌跡(one shot):設計一個推理sop軌跡,描述如何一步一步地進行推理和決策、執行sop
- 借助 ReAct 的 思考、行動和觀察的離散推理能力,與外界進行互動執行sop的流程
2. 使用的優勢
- ReAct 可以幫助語言模型進行更復雜的推理和決策
- 流程sop(one shot) 為模型的行為提供一定解釋性,和可控性
- 可以支持語言模型與外部環境的交互(即用戶多輪對話,實現一個目標)
四、落地效果檢驗分析
我們以簡單的TFlow留咨詢場景例(注流程只需要用文本描述,不需要work flow),問答效果如下:
1. Re-Act + SOP流程的推理過程復盤
Agent任務執行前提:
1)Agent的目標:解答用戶疑問,引導用戶留咨
2)推理過程示例 (One Shot):
- 理解用戶的疑問
- 查詢知識庫中產品手冊、了解對應的解決方法
- 解答用戶的疑問,并用戶提供姓名、聯系方式、公司名稱
- 將信息插入 到 CRM系統中
第一輪的推理:
1)用戶輸入:能介紹一下產品嗎?
2)模型處理:
- 觀察:能介紹一下產品嗎?
- 思考:用戶詢問了關于產品的介紹,我需要調用知識庫接口來查詢并解答。
- 行動:調用知識庫
第二輪的推理
1)知識庫返回:
「同時相較于第二代客服機器人,TFlow不只體現在具備情感,使用成本大幅度降低。與市面上常見的14999元/個、24999元/個、外加會話包計費方式的客服機器人相比,TFlow直接免費提供機器人服務,只按照實際消耗量收取token費用,費用多少由需求量說了算。小企業使用一個月的費用可能不超過50元,就可以享受24小時無間斷的客戶服務。讓大模型真正的實現降本增效的目標」
2)模型處理:
- 觀察:用戶問題+知識庫的答案
- 思考:根據知識庫提供的信息,我已經了解了TFlow產品的介紹?,F在我將簡潔地回復用戶,并引導用戶提供姓名、電話號碼和公司名稱
- 行動:回復用戶“TFlow是一款智能客服機器人,具備情感且使用成本大幅降低。它提供24小時無間斷的客戶服務,并可根據實際消耗量收取token費用。同時,TFlow支持多模態消息處理,并對接主流SaaS平臺。請問您方便留下您的姓名、電話號碼和公司名稱嗎?“
第三輪的推理
1)用戶輸入:曹操
2)模型處理:
- 觀察:曹操
- 思考:用戶已經提供了姓名,但還沒有提供電話號碼和公司名稱。接下來,我將繼續引導用戶提供這些信息。
- 行動:回復用戶。“感謝您的回復,曹操先生。為了更好地為您提供服務,請問您能留下您的電話號碼和公司名稱嗎?”
第四輪的推理:
1)用戶輸入:今天天氣怎么樣?
2)模型處理:
- 觀察:今天天氣怎么樣?
- 思考:用戶的問題與TFlow產品無關,因此我不進行解答,而是繼續引導用戶提供電話號碼和公司名稱。
- 行動:回復用戶?!胺浅1福P于天氣的問題我無法直接回答。但為了更好地為您提供TFlow產品的服務,請問您能留下您的電話號碼和公司名稱嗎?”
第五輪的推理:
1)用戶輸入:13018920000
2)模型處理:
- 觀察:13018920000
- 思考:用戶已經提供了電話號碼,但還沒有提供公司名稱。接下來,我將繼續引導用戶提供公司名稱。
- 行動:回復用戶。“感謝您的回復,曹操先生。為了完善您的信息,請問您能告訴我您的公司名稱嗎?”
第六輪的推理
1)用戶輸入:網易云商
2)模型處理:
- 觀察:網易云商
- 思考:用戶已經提供了姓名、電話號碼和公司名稱,現在我將調用留咨接口將這些信息保存到數據庫,并告知用戶留咨成功。
- 行動:調用CRM接口
第七輪的推理
1)接口返回:’Operation succeeded’, ‘code’: 200
2)模型處理:
- 觀察:’Operation succeeded’, ‘code’: 200
- 思考:留咨成功,我將告知用戶銷售人員將在24小時內聯系他。
- 行動:回復用戶。“留咨成功!我們的銷售人員將在24小時內與您聯系。感謝您的關注和支持!”
2. 在這個流程中我們可以看到的結論
優勢好處:
- 多輪對話一致性:預設目標和流程后,整個多輪對話的過程都圍繞著目標進行,不會進行發散和跑偏。異常信息或者無關信息,被自動過濾
- 推理可解釋性:模型推理的過程參考SOP的流程,調整模型的推理,只需要修改流程提示即可。
- 離散引導:在re-act 的思考機制下,可以對于信息不完整的情況時,具備自動引導補充的能力。自動調用CRM的外部工具。自動和用戶互動引導補充信息
- 靈活性:re-act自動制定計劃,可以根據外部的信息輸入,自動調整執行計劃或者步驟。
通過這個方案即可實現Agent 控制SOP流程,從而實現既定目標。對于workflow 具備很強的靈活性。
問題:
- 只能執行單一的任務目標。
- 任務流程的描述需要抽象業務來描述。
- 和work flow、歷程畫布相比,模型存在小概率幻覺。
本文由 @易俊源 原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!