如何手搓一個有“人格”的智能客服機器人?

0 評論 4865 瀏覽 31 收藏 14 分鐘

在大語言模型的趨勢下,是否可以使用大語言模型,自己做一款智能客服機器人出來?成本有多高?難度有多大?本文對此進行解析,一起來看看吧。

有非常多的朋友,聯系我推薦靠譜的智能客服產品,但在2023年的今天再次審視這個問題,我們面臨一個全新的選擇,是不是可以使用大語言模型,自己做一款智能客服機器人出來?成本有多高?難度有多大?

我們可以把智能客服拆分為“智能”+“客服”兩個不同的產品維度來看。

1. 客服

如果要實現客服系統,需要我們準備多渠道的接入管理和設置,常見的渠道包括電話、Web網站、H5移動端頁面、微信、企微、郵件、短信、微博等,如果是自己開發,則選擇自己需要用到的服務場景和獲客渠道。主要功能是實現渠道消息的接入,在線IM消息和座席人工消息工作臺。可以簡單的實現,配合自己的客戶信息系統,實現訪客的關聯和管理。

2. 智能

接下來就是智能的部分,以往自行開發智能客服系統,大部分受制于智能機器人的難度,只能實現人工方式的在線客服。傳統方式的智能客服機器人,需要搭建AI引擎,對接ASR和TTS能力接口,實現智能語音AI能力的接入。

建立機器人知識庫,實現問答模式的相似問,擴展詞、專有詞管理等建立機器人流程,配置機器人意圖、識別、分支流轉以及復雜的流程控制方式,以實現多輪會話和任務管理建立機器人數據統計分析模塊,方便運營管理和數據標準、訓練。將兩者結合,才可以完成智能客服的基本工作流程。

2022年大語言模型的爆發,對智能客服機器人產品帶來了最直接的沖擊。一個最核心的焦點問題就是:如何使用大語言模型,更快更好的搭建一個客服機器人呢?今天就和大家具體聊聊看,怎樣手搓一個有“人格”的大語言模型客服機器人,可以完成文本和語音的個性化接待工作。

一、為什么需要人格特征

其實在大語言模型到來之前,除了像小冰等獨立的AI產品,可以訓練不同人格,音色的機器人來唱歌,對話,作詩??头C器人領域就一直在探索如何實現機器人的性格,受限于技術能力和實現難度,以及經濟性,并沒有比較好的產品方案。大家使用的客服型機器人,幾乎千篇一律是標準化的問候,回答,處理問題,使用多輪會話處理特定任務。你說它們智障也好,人家就是不生氣,有啥說啥,主打一個兢兢業業。但是現在大語言模型來了,我們可以狠狠期待一波,那么今天就聊聊,怎么手搓一個有人格特征的大語言模型機器人

二、開始前的準備工作

如果你對客服機器人很熟悉了,那么我們直接開始。如果還需要補充一些基礎知識,可以關注我,翻翻我以前整理的關于大語言模型的一些應用,關于知識庫文檔提取,知識庫自動擴寫等方法,手搓機器人都要用得到。文末我也會貼上鏈接。另外就是,你需要有一定的編程基礎,尤其是對大語言模型相關的用法,對LangChain等框架和常用國內外LLM的調用已經學會,懂向量數據庫。

三、客服機器人的連接渠道

現在機器人的服務場景是確定的。就是微信、企微、網站、H5、以及一些視頻媒體、社交媒體,以及電話。電話的實現需要用到CTI通信集成技術,比較復雜,先實現以上渠道的在線客服,通過IM對話方式接入訪客到座席的消息連接。在這之間,就可以使用我們的客服機器人進行訪客接待,并且在適當的觸發情況下,設置出口,將消息轉發人工座席。以上是客服機器人的場景和基本原理。

四、向量數據庫的設置

要做出和以往不同的機器人來?;谙蛄繑祿炫cOpenAI Embedding,以及OpenAI chat/completions接口,實現的基于企業知識庫的大語言模型機器人。從產品化的角度考慮,應在多租戶賬戶中設置獨立的知識庫,提供文件上傳和訓練的功能。支持主流的docx 、txt、xlsx、pdf等格式。獲取文檔內容后,按字符長度分塊,調用OpenAI Embedding接口,存入到向量數據庫。如果是SaaS系統,要注意基于多租戶實現數據分割。

五、大語言模型客服機器人的設置

關鍵的步驟來了,我們要給機器人賦予“人格”除以往的客服機器人設置之外,增加大語言模型獨有的機器人性格參數,建議增加以下內容

1. 角色扮演設置

你要設定的機器人是什么身份、什么背景。比如“假設你是“AA公司”的銷售顧問,名字叫Alice,你的微信和電話是***,公司的網站是”“假設你是“唉呀馬呀旗艦店”的電商客服,你的名字叫首席體驗師,主要針對訪客的咨詢,訂單,售后,投訴等問題進行服務”“假設你是“天天優秀”醫院的服務代表,你的名字是林醫生,醫院的官微官網地址是**,你主要了解訪客的病情并推薦引導訪客來院進一步檢查”

如果是做產品化設計,也可以抽取字段作為配置項目:名稱、角色、職責、背景信息等。目的是開啟一段RolePlay的角色基本的設定,玩過游戲的都會吧。發揮你的想象力,給出demo,讓你的客戶自己來填寫也沒問題。

2. 限制范圍

如果不加以限制,機器人就會天馬行空的和訪客瞎講了。所以這里要加以明確的約束,比如“你只能根據對話的上下文回答問題”“你只能根據已知知識信息回答問題”“你絕對不能和訪客暴露自己是個“AI、機器人、人工智能、大模型、ChatGPT””目的是限定機器人的回答內容限定在歷史會話數據上下文和企業知識庫體系內作答,以及隱藏真實身份,如果有必要的話。這里也可以增加對歷史會話記錄和知識庫文檔的關聯配置。

3. 字數限定

為了防止大模型話癆,我們可以設定簡潔明快的字數限定。

當然,也為了節約一些寶貴的Token,可設置如下規則“你應該盡量口語化回應,并盡量安撫用戶的情緒,你的回答應該是簡潔的、不要超過50字”

4. 未知問題提示詞

還是一種限定,實在無法解答的問題,可以引導機器人如此回答,避免機器人自己“智能涌現”了,亂答一氣。

比如:對于訪客與知識無關的問題,你應明確拒絕并告知用戶“很抱歉哦,您的這個問題很有趣,但是我無法回答您。麻煩您提供描述的更細致詳細一點”產品化思路是,這里可以增加多樣性回復和人工座席的出口,推薦訪客點擊或者直接轉接人工座席服務。

5. 口語化語氣詞

為了讓大模型機器人更加有趣一些,可以增加語氣詞的設定。如“可以在回答過程中,適當地加入些語氣詞,如:“嗯嗯”、“哇”、“親”、“哈”、“哦”等詞語?!?/p>

6. 首次咨詢問答

一個引導語的配置,可以規范機器人在接待時與客戶打招呼的內容,交給客戶自行設定即可。當然,要和自己的人設盡量保持一致。

以上內容的組合,通過產品界面配置,生成promte工程化提示詞,來觸發角色扮演場景的初始化設定,并且限定了知識領域。

7. “溫度”

最后,再提一下一個隱藏參數:溫度在讓大模型回答問題時,Temperature溫度這個參數很有作用,是最重要的源指令之一。這個值一般介于0-2之間,數值越低就越精確,數值越高就越發散。原理是大模型生成回復內容是,為不同單詞分配不同概率的輸出。當溫度趨近于0時,模型傾向于保守的回復,選擇概率最高的單詞回復,這樣意義很準確,但可能不夠個性和多樣化。就是比較僵化一些。

當溫度為1時,默認初始化設置,兼顧多樣性和連貫性當溫度趨近于最大值2時,模型可以輸出更多樣性的內容,文案也更加跳脫。如果你希望獲得更具創造性的回答效果,調高溫度如果你希望機器人更保守精準一些,溫度就調低。大家可以實際測試下效果對比。

8. “監控保護”

大模型在判斷問題時,如果遇到涉及政策、宗教、暴力、血腥、色情等不合時宜問題時,根據自身知識庫深度會給出返回值。建議可以增加對這些觸發的處理。以一個通用引導語作為規避。

此處也可以外接擴展敏感詞字庫進行問題的過濾。

一些優秀產品實現效果截圖,僅供參考

使用Claude模擬角色扮演場景對話(注意,沒有限定本地化知識)

六、參考信息

以上基于原生chatGPT3.5會話接口,向量生成接口等,Fine-tuning和Embedding嵌入的搜索提問方式,客服機器人是文本對話聊天,不考慮多模態向量搜索方式,會比較簡單一些。定義人格機器人,已經有很多成熟的例子,推薦一個https://ora.ai大家可以上手定制下自己的人格機器人玩一下。腦洞大的話能玩出花來

人格機器人定制和社群ORA

以上內容,就是設置一個具有一定“人格”的客服機器人的一些要點。當然,要真的完整實現一個產品化的智能客服,那最少還是要有大量的配套功能要做的。

單一個在線客服功能,沒有幾百個參數,不好意思說自己是成熟產品。大家耐下心來好好打磨,也很期待能夠看到更多有趣的“人格”智能客服機器人出現在人工智能產品序列中。

專欄作家

通信產品的那些事,公眾號:通信產品的那些事,人人都是產品經理專欄作家。通信產品老兵。當過正規軍,干過游擊隊。智能客服、呼叫中心產品磚家。致力于大語言模型在行業的落地應用實踐。

本文原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!