久久久久人妻精品专区,99久久精品免费观看国产,久久久久久久综合狠狠综合

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

產品實踐分享： Re-Act+SOP，讓Agent穩定執行 SOP流程（多輪對話形式），低成本解決復雜SOP搭建問題

易俊源

2024-07-30

0 評論 1517 瀏覽 5 收藏

13 分鐘

TFlow AI作為一款面向B端業務場景的Agent平臺，通過結合Re-Act推理+行動機制和預設的SOP流程，實現了對業務流程的精確控制和執行，為企業提供了一種既靈活又具有確定性的解決方案。本文將深入探討TFlow AI如何利用大型語言模型實現復雜的推理決策任務，并展示其在實際應用中的優勢和挑戰。

實踐產品TFlow AI 簡介：是面向B端業務場景Agent平臺，能按流程處理任務（SOP），圍繞目標來進行離散推理。能快速搭建Ai客服、AI導購等應用。

產品允許LLM與環境進行交互，根據環境數據的反饋不斷的調整行動計劃/策略。且整個sop的過程是由文本來控制，產品基本參數如下：

使用文心一言 3.5的模型，未微調
做了邏輯處理的Agent框架
單條回復的消耗不到2K token，價格不貴
歡迎體驗。（注：流程只需要用文本流程，不需要work flow）

一、為什么要做

B端業務場景的需求：確定性

企業服務（對內、對外）通常有相對明確的SOP流程或者思考步驟，在業務處理或者對外交互時期望按照流程來執行任務。
對外、對內的服務，期望帶來確定性的體驗。

例如當用戶退換貨時，思考流程如下：

A 確定退貨原因
b 確認訂單是否真實有效
c 確定是否符合退換貨政策要求
d 協助解答退貨操作

在整個多輪對話溝通過程中的要求：

按照流程執行，需要流程可控，帶來確定性的結果。
始終聚焦“退換貨”事情上，不要去解答無關的事情

二、如何通過大模型實現昵？借用Re-Act 為代表推理+行動機制

ReAct 代表一種將推理和行動與語言模型只相結合的技術，用于解決各種語言推理和決策任務。它促使語言模型生成語言推理軌跡和行動，并支持與外部環境的交互。

Re-act的官方案例示例：

流程說明如下：

目的：找出Apple Remote最初設計用來交互的程序，即Front Row媒體中心程序
思考 1：我需要搜索“Apple Remote”并找到它最初設計用來交互的程序。
行動 1：搜索[Apple Remote]
觀察 1： “Apple Remote”是蘋果公司于2005年10月推出的一款遙控器……用于控制Front Row媒體中心程序。
思考 2： Apple Remote最初設計用于控制Front Row媒體中心程序。我需要搜索Front Row并找到還有哪些設備可以控制它。
行動 2：搜索[Front Row]
觀察 2：沒有找到[Front Row]。相似結果包括：“FrontSeat to Earth”、“Front Row Motorsports”、“Front Row(software)”等。
思考 3：沒有找到Front Row。我需要搜索“Row (software)”
行動 3：搜索 Front Row (software)
觀察 3： Front Row是一款已停產的媒體中心軟件……
思考 4： Front Row（軟件）可以通過Apple Remote或鍵盤功能鍵來控制。
行動 4：輸出鍵盤功能鍵。

案例中re-act基于目的“找出Apple Remote最初設計的媒體中心程序”，模型自行計劃、推理、執行了四個步驟。

搜索[Apple Remote]，知道程序名稱是[Front Row]
搜索[Front Row]，但是未找到對應的軟件。但是需要搜索 Front Row (software)
搜索 Front Row (software)，找到了控制方式
告知結果：輸出控制方式鍵

在這個過程中，我們有幾個發現

推理過程圍繞始終圍繞著目標“找出Apple Remote最初設計的媒體中心程序”進行
推理過程需要頻繁的與外界交互（類似于多輪對話一樣，搜索收集信息，觀察解決問題）
推理過程類似于執行一個 SOP流程

ReAct 模式的核心是將觀察結果提供給 LLM，使其能夠更新其上下文窗口。該模型重新評估信息并根據這些見解采取行動以提高其推理能力。同時將單個推理步驟嵌入在對話的提示。

OK，那是否可以將Re-Act 與企業的SOP流程結合，然后讓模型去執行標準的SOP流程

三、方案：Re-Act + SOP流程，讓模型來控制sop流程

如何實現？對re-act執行過程進行變更

1、將推理目標（用戶提供）變為企業預設目標，比如”目標解決退換貨問題、留咨詢問題、商品推薦”。非用戶提供的提問
2、將模型執行推理的流程，變更為預設的SOP流程；

1. 方案的關鍵步驟如下

定義任務目標:：企業明確要解決的任務是什么
預設推理軌跡（one shot）:設計一個推理sop軌跡，描述如何一步一步地進行推理和決策、執行sop
借助 ReAct 的思考、行動和觀察的離散推理能力，與外界進行互動執行sop的流程

2. 使用的優勢

ReAct 可以幫助語言模型進行更復雜的推理和決策
流程sop（one shot）為模型的行為提供一定解釋性，和可控性
可以支持語言模型與外部環境的交互（即用戶多輪對話，實現一個目標）

四、落地效果檢驗分析

我們以簡單的TFlow留咨詢場景例（注流程只需要用文本描述，不需要work flow），問答效果如下：

1. Re-Act + SOP流程的推理過程復盤

Agent任務執行前提：

1）Agent的目標：解答用戶疑問，引導用戶留咨

2）推理過程示例（One Shot）：

理解用戶的疑問
查詢知識庫中產品手冊、了解對應的解決方法
解答用戶的疑問，并用戶提供姓名、聯系方式、公司名稱
將信息插入到 CRM系統中

第一輪的推理：

1）用戶輸入：能介紹一下產品嗎？

2）模型處理：

觀察：能介紹一下產品嗎？
思考：用戶詢問了關于產品的介紹，我需要調用知識庫接口來查詢并解答。
行動：調用知識庫

第二輪的推理

1）知識庫返回：

「同時相較于第二代客服機器人，TFlow不只體現在具備情感，使用成本大幅度降低。與市面上常見的14999元/個、24999元/個、外加會話包計費方式的客服機器人相比，TFlow直接免費提供機器人服務，只按照實際消耗量收取token費用，費用多少由需求量說了算。小企業使用一個月的費用可能不超過50元，就可以享受24小時無間斷的客戶服務。讓大模型真正的實現降本增效的目標」

2）模型處理：

觀察：用戶問題+知識庫的答案
思考：根據知識庫提供的信息，我已經了解了TFlow產品的介紹?，F在我將簡潔地回復用戶，并引導用戶提供姓名、電話號碼和公司名稱
行動：回復用戶“TFlow是一款智能客服機器人，具備情感且使用成本大幅降低。它提供24小時無間斷的客戶服務，并可根據實際消耗量收取token費用。同時，TFlow支持多模態消息處理，并對接主流SaaS平臺。請問您方便留下您的姓名、電話號碼和公司名稱嗎？“

第三輪的推理

1）用戶輸入：曹操

2）模型處理：