AI大模型時代,如何用RAG技術(shù)重塑傳統(tǒng)智能客服問答機器人?
本文將主要介紹下大模型(LLM)如何融入到智能客服產(chǎn)品中從產(chǎn)品設(shè)計到技術(shù)實現(xiàn)(本文的智能客服僅包含該部分:智能對話機器人部分),以及英偉達給出的開源解決方案是什么。
2年前我寫過一篇保險行業(yè)智能客服的調(diào)研,因為當時的AI還無法像現(xiàn)在的大模型一樣理解大家的意圖(文本+圖片),所以原本智能對話機器人的實現(xiàn)不僅費時費力,且還沒有一個很好的效果,導致“在智能對話機器人的部分,在晚上10:50我還測試了部分淘寶店家,發(fā)現(xiàn)一般比較小的店使用的還是人工,而像回力這種相對來說比較大的店鋪也是機器人+人工一直在線,可能是目前智能對話機器人相對于人工對效益的影響只有在人力成本比較大的時候才有體現(xiàn),或者需要較長的適應(yīng)期,一般小企業(yè)等不了?!?/p>
但是最近我發(fā)現(xiàn)大模型給各領(lǐng)域的咨詢和智能客服真的帶來了天翻地覆的變化,具體有哪些變化將在后文中詳細說明。
由于本人非專業(yè)做技術(shù)的,因此如果有什么有問題的,或者目前業(yè)界已經(jīng)有了更加好的實現(xiàn)方式希望大家在評論區(qū)積極互動!
一、為什么需要用LLM重塑各行各業(yè)?
自從大型語言模型(LLM)問世以來,人們常將其對現(xiàn)代社會的影響與幾十年前互聯(lián)網(wǎng)對產(chǎn)業(yè)的革命性影響相提并論。本質(zhì)上,利用LLM的過程可以被看作是各行各業(yè)的一場重塑。
然而,這種重塑并非孤立進行,而是緊密依賴于技術(shù)發(fā)展的成熟度。
技術(shù)進步在某個關(guān)鍵時刻可能會引發(fā)行業(yè)格局的顛覆性變化。舉例來說,一些原本在技術(shù)(包括先前投入的人力資本積累和實際技術(shù)能力積累)上擁有壁壘的企業(yè),可能會因為某項技術(shù)革新而使得其之前的優(yōu)勢瞬間減少。如果這些企業(yè)不能及時變革,就更容易被競爭對手超越。這也為小型和創(chuàng)業(yè)公司提供了趕超的機會。
由于目前TTS技術(shù)是一個在ai領(lǐng)域比較成熟的技術(shù),因為我就以TTS技術(shù)的變革階段來說明技術(shù)大框架的躍升給市場帶來的變化:
首先技術(shù)躍升的節(jié)點說明:Tacotron 2是由谷歌在2017年12月20日發(fā)布的。這個系統(tǒng)是一個基于深度學習的端到端語音合成模型,它可以直接從文本生成類人語音。Tacotron 2結(jié)合了Tacotron和WaveNet的研究成果,使用神經(jīng)網(wǎng)絡(luò)從文本生成類人的語音,其中輸入數(shù)據(jù)僅使用了語音樣本和相關(guān)的文本記錄。這個系統(tǒng)的發(fā)布標志著TTS領(lǐng)域的一次重大進步,它在語音合成的質(zhì)量和自然度方面取得了顯著的效果。
如下圖所示,是百度TTS產(chǎn)品的發(fā)展流程:
從該發(fā)展流程可以看出,2017年學界的變化給工業(yè)界實現(xiàn)方案帶來了直接的變化,且新的企業(yè)雨后春筍般的出來,老牌企業(yè)也不斷投入且技術(shù)路線相對統(tǒng)一,下圖所示是各大廠的工業(yè)部署pipeline:
21年各大廠商TTS技術(shù)工業(yè)部署pipleline,當時各個做TTS的產(chǎn)商都用的類似的模型和實現(xiàn)方式,一般實現(xiàn)差異化的話只能通過在各個模塊進行微調(diào),且微調(diào)的目標主要集中在5個方向上:fast、Low-Resource、Robust、Expressive、Adaptive
最后在來說下為什么說Tacotron的出現(xiàn)是TTS技術(shù)躍升的點,首先當時的模型可用了,其次行業(yè)實現(xiàn)成本有了很大的降低,以及從現(xiàn)在來看雖然目前TTS行業(yè)主流程的模型有了一定的變化,但是比如21年出現(xiàn)的端到端的VITS系列以及擴散模型在tts領(lǐng)域的應(yīng)用,但是依然還是全量的深度學習模型,因此原本積累的數(shù)據(jù)基礎(chǔ)還可以套用以及原本積累的部署經(jīng)驗和優(yōu)化經(jīng)驗還是有延續(xù)的作用。
二、RAG重塑智能對話機器人
首先為什么選擇在現(xiàn)在使用RAG重塑智能對話機器人?
- 應(yīng)用范圍廣,盤子大,只要數(shù)據(jù)量夠各個行業(yè)都可以用
- 技術(shù)方案明確:rag技術(shù)以及能更加便捷實現(xiàn)該技術(shù)的平臺和框架(如langchain)網(wǎng)絡(luò)上信息多
- 對某些特殊的行業(yè)確實可以取得顯著的收益(如to c金融保險稅務(wù)咨詢等行業(yè)知識壁壘高的行業(yè),TO B需要做項目1-N的行業(yè)等)
應(yīng)用領(lǐng)域:
從一個人一生的發(fā)展來看智能對話機器人可以被應(yīng)用在各個階段:
出生
- 醫(yī)療健康:在醫(yī)療領(lǐng)域,智能對話機器人輔助醫(yī)生進行診斷和治療,提供患者教育和支持,管理預約和查詢系統(tǒng)
上學
- 教育培訓:智能對話機器人用于教育領(lǐng)域,提供學習輔導、教育咨詢、學習資源推薦等服務(wù),特別是在線教育和培訓機構(gòu)
日常生活
- 電子商務(wù):智能對話機器人用于電商平臺的售前咨詢和售后服務(wù),幫助用戶進行產(chǎn)品查詢、訂單處理等
- 生活服務(wù):在生活服務(wù)領(lǐng)域,智能對話機器人提供如旅游咨詢、酒店預訂、物流跟蹤等服務(wù),滿足用戶日常生活需求
工作
- 企業(yè)服務(wù):智能對話機器人還被用于企業(yè)服務(wù),如客戶關(guān)系管理(CRM)、銷售支持、市場調(diào)研、企業(yè)內(nèi)部員工咨詢?nèi)旱?/li>
- 金融行業(yè):在金融領(lǐng)域,智能對話機器人用于處理客戶咨詢,如銀行業(yè)務(wù)、保險咨詢、證券服務(wù)等,提供個性化的服務(wù)和建議
- 政務(wù)領(lǐng)域:智能對話機器人用于提高政務(wù)辦公效率,提供信息查詢、政策咨詢等服務(wù),助力智慧政務(wù)的發(fā)展
三、為什么需要RAG,RAG是什么?
1. 為什么需要這樣引入新的技術(shù)?
不使用LLM的自動回復系統(tǒng):現(xiàn)有的自動回復系統(tǒng)存在的問題是關(guān)鍵詞匹配的局限性,這種方法雖然簡單高效,但缺乏對上下文的理解和語義分析,容易造成匹配錯誤,比如登錄 VS登陸就無法識別。如下是2年前智能對話機器人主要使用的技術(shù):
如果直接使用大模型存在以下主要的問題:
- 知識的局限性:知識更新緩慢和答案缺乏透明度。模型自身的知識完全源于它的訓練數(shù)據(jù),而現(xiàn)有的主流大模型(ChatGPT、文心一言、通義千問…)的訓練集基本都是構(gòu)建于網(wǎng)絡(luò)公開的數(shù)據(jù),對于一些實時性的、非公開的或離線的數(shù)據(jù)是無法獲取到的,這部分知識也就無從具備。
- 幻覺問題:所有的AI模型的底層原理都是基于數(shù)學概率,其模型輸出實質(zhì)上是一系列數(shù)值運算,大模型也不例外,所以它有時候會一本正經(jīng)地胡說八道,尤其是在大模型自身不具備某一方面的知識或不擅長的場景。而這種幻覺問題的區(qū)分是比較困難的,因為它要求使用者自身具備相應(yīng)領(lǐng)域的知識。
- 數(shù)據(jù)安全性:對于企業(yè)來說,數(shù)據(jù)安全至關(guān)重要,沒有企業(yè)愿意承擔數(shù)據(jù)泄露的風險,將自身的私域數(shù)據(jù)上傳第三方平臺進行訓練。這也導致完全依賴通用大模型自身能力的應(yīng)用方案不得不在數(shù)據(jù)安全和效果方面進行取舍。
使用RAG技術(shù)后:
- 準確性提高:RAG通過與外部知識相關(guān)聯(lián)的答案來提高準確性,減少語言模型中的幻覺問題,使生成的響應(yīng)更準確、可靠。
- 保持信息的時效性和準確性:與傳統(tǒng)只依賴訓練數(shù)據(jù)的語言模型相比,RAG可以識別最新信息,保持響應(yīng)的時效性和準確性。
- 透明度:RAG通過引用來源提高答案的透明度,增加用戶對模型輸出的信任。
- 定制化能力:RAG可以通過索引相關(guān)文本語料庫來定制不同領(lǐng)域的模型,為特定領(lǐng)域提供知識支持。
- 安全性和隱私管理:RAG在數(shù)據(jù)庫中內(nèi)置了角色和安全控制,可以更好地控制數(shù)據(jù)使用。
2. RAG是什么?
RAG,即檢索增強生成(Retrieval-Augmented Generation),是一種結(jié)合了檢索和生成技術(shù)的人工智能系統(tǒng)。它是大型語言模型的一種,但特別強調(diào)檢索和生成的結(jié)合。RAG的最主要的工作流程包括:
- 檢索階段:系統(tǒng)會根據(jù)用戶的查詢,從知識庫中檢索出相關(guān)信息。這些信息可能包括文章、網(wǎng)頁、數(shù)據(jù)庫條目等。
- 生成階段:RAG使用檢索到的信息來增強其生成過程。這意味著,生成模型在生成文本時,會考慮到檢索到的相關(guān)信息,以生成更準確、更相關(guān)的回答。你可以直接將搜索到的返回給用戶也可以通過LLM結(jié)合后生成給用戶。如下圖所示是一個基礎(chǔ)的RAG模型:
四、如何在實際業(yè)務(wù)中使用該技術(shù)?
1. 產(chǎn)品構(gòu)思
需求業(yè)務(wù)背景:
有一家稅務(wù)咨詢公司,有一定的歷史因此有很多的數(shù)據(jù)。最近業(yè)務(wù)擴張快,因此招聘了一批有一定稅務(wù)基礎(chǔ)的咨詢?nèi)藛T,但是在實際的工作中發(fā)現(xiàn)這些員工能力參差不齊,且即使有些人能力出眾,但是因為稅務(wù)法規(guī)在不同的地區(qū)要求不同、國家為了更好的發(fā)展,每年會提出各種稅務(wù)概要要求,如2023年中國的稅務(wù)改革主要集中在深化稅收征管改革和優(yōu)化稅費政策上,還有社會上行業(yè)眾多,因此導致有些領(lǐng)域招聘的人不熟悉,沒有辦法給客戶的問題提出一個好的建議。
如何解決:
為此期望借助公司歷史積累的數(shù)據(jù)以及收集到的每年稅務(wù)變革資料和各地稅務(wù)法律法規(guī)給自家的客服系統(tǒng)接入智能問答機器人,方便稅務(wù)咨詢老師可以在不太明確時可以問智能問答機器人。且目前大模型對對話的了解能力確實有所提升因此想要用大模型來進行構(gòu)建,但是在構(gòu)建智能回答機器人的同時還需要注意些業(yè)務(wù)上的邏輯:
- 回答的準確率,不希望機器人回答非公司提供數(shù)據(jù)之外的答案,機器人可以回答不知道。
- 機器人不知道的問題和后面老師針對這個問題的回答需要收集起來,便于數(shù)據(jù)庫的更新
- 為了保證稅務(wù)行業(yè)的安全,對LLM輸出的答案需要檢測是否合規(guī),因為按照產(chǎn)品后續(xù)規(guī)劃想將該能力單獨賣給部分企業(yè)和個人進行使用
- 稅務(wù)行業(yè)位置因此很重要,因此需要將位置作為一個特征分別查詢不同數(shù)據(jù)來源
理想態(tài)測算指標:
畢竟這是個長遠的事情因此需要設(shè)計各種指標對該產(chǎn)品的效果以及商業(yè)化前景等內(nèi)容進行監(jiān)督:
1)效率和用戶體驗相關(guān)指標(實際使用中需要關(guān)注的指標:包含直接用戶稅務(wù)咨詢老師和間接用戶客戶)
- 響應(yīng)時間:機器人回答問題的平均時間,反映系統(tǒng)的響應(yīng)速度。
- 用戶滿意度:通過調(diào)查問卷或用戶反饋來衡量使用機器人前后客戶以及老師對咨詢體驗的滿意程度。
- 問題解決率:機器人能夠正確回答的問題占總提問的比例。
- 老師回答效率的提升:所有老師平均每月回答問題數(shù)量同比和環(huán)比變化
2)準確度和性能相關(guān)指標(訓練的時候需要關(guān)注的指標,后續(xù)實際使用的時候可以抽樣獲?。?/p>
- 準確率:機器人回答正確的次數(shù)與總回答次數(shù)的比例。
- 召回率:在所有應(yīng)該被機器人正確回答的問題中,實際上被正確回答的比例。(召回率特別重要,當關(guān)注的重點是確保所有正例都被識別出來時,例如在疾病篩查或欺詐檢測中,遺漏一個正例的代價可能非常高。)
- F1 分數(shù):準確率和召回率的調(diào)和平均值,綜合反映模型的準確性和全面性。
- 答案相關(guān)性:這個指標強調(diào)生成的答案需要與提出的問題直接相關(guān)。
- 忠實度:這個指標強調(diào)模型生成的答案必須保持對給定上下文的忠實,確保答案與上下文信息一致,不偏離或矛盾。這方面的評估對于解決大型模型中的幻覺問題至關(guān)重要
3)數(shù)據(jù)和知識庫相關(guān)指標(由于這是一個長期的產(chǎn)品,因此需要不斷的修改知識庫以及規(guī)范知識庫的書寫方式便于訓練,因此該指標主要針對數(shù)據(jù)管理流程中的相關(guān)人員)
- 知識庫覆蓋率:機器人知識庫中包含的信息占所有可能相關(guān)信息的比例。
- 知識更新頻率:知識庫更新的頻率,反映機器人對新信息的適應(yīng)能力。
4)商業(yè)收益相關(guān)指標(實際使用中,以及決策是否需要長期使用以及將該產(chǎn)品推廣大更大的場景需要的決策指標)
- 成本節(jié)約:通過機器人回答問題減少的人力成本。同樣的咨詢量情況下,需要的稅務(wù)老師成本為多少
- 收入增加:由于服務(wù)效率提升帶來的額外咨詢業(yè)務(wù)或產(chǎn)品銷售。
- 客戶留存率:使用機器人服務(wù)后,客戶的留存率變化。
- 市場份額:產(chǎn)品推出后,公司在稅務(wù)咨詢市場的份額變化。
5)安全和合規(guī)性指標(由于領(lǐng)域要求,因此需要注意數(shù)據(jù)敏感性問題)
- 合規(guī)性檢測通過率:機器人回答被判定為合規(guī)的比例。
- 數(shù)據(jù)泄露風險:評估機器人處理數(shù)據(jù)時可能的數(shù)據(jù)泄露風險。
6)技術(shù)和維護相關(guān)指標(為了后續(xù)直接給個人和企業(yè)使用需要關(guān)注系統(tǒng)穩(wěn)定性)
- 系統(tǒng)穩(wěn)定性:機器人系統(tǒng)的正常運行時間與總時間的比例。
- 維護成本:維護和升級機器人系統(tǒng)的平均成本。
- 模型訓練+知識庫維護總成本:因為后續(xù)需要對產(chǎn)品定價以及是否要延續(xù)該產(chǎn)品和擴張該產(chǎn)品進行決策
以上指標具體需要怎樣的目標可以結(jié)合實際場景和原本的數(shù)據(jù)結(jié)果進行規(guī)劃。
目前的這個解決方案有什么收益和成本?
- 公司內(nèi)部數(shù)據(jù)亂象可以借由該產(chǎn)品的規(guī)劃進行調(diào)整:原本公司的數(shù)據(jù)散落在各個平臺上,如釘釘、飛書、wiki等各類工具上,導致有時候需要查詢一個內(nèi)容需要去到多個工具,且不同的工具搜索機制不同,常常有搜索不出想要的答案的情況,且搜索的時間很長,很多返回的結(jié)果沒有按照期望的反饋,需要進行人工篩選
- 更高效的提升稅務(wù)老師的咨詢能力范圍,有了稅務(wù)咨詢小助手,老師即使不了解當?shù)囟惙ㄒ部梢钥焖賹€人知識和稅務(wù)咨詢小助手的回答結(jié)合回答問題
- 對公司來說可以通過更低的人力成本產(chǎn)出同樣效果的咨詢結(jié)果
- 從長遠的角度看本次整理的數(shù)據(jù)以及構(gòu)建稅務(wù)咨詢小助手,可以用于后續(xù)稅務(wù)知識學習軟件的構(gòu)建,以及稅務(wù)咨詢小助手可以單獨作為一個產(chǎn)品賣給企業(yè)和個人用戶
- 最后除了收益之外就是成本問題:模型訓練+知識庫維護總成本:因為后續(xù)需要對產(chǎn)品定價以及是否要延續(xù)該產(chǎn)品和擴張該產(chǎn)品進行決策
2. 設(shè)計邏輯
架構(gòu)圖:
實際開發(fā)中需要注意的點?
如何搭建整體和RAG相關(guān)框架:
總之,選擇什么樣的實現(xiàn)方式需要綜合考慮。
- 技術(shù)能力:如果您的團隊在機器學習和自然語言處理方面有較強的技術(shù)能力,自研模型可能是一個好選擇。
- 資源與時間:如果資源有限或希望快速推出產(chǎn)品,使用Langchain框架或現(xiàn)有LLM平臺可能更合適。
- 定制化需求:考慮稅務(wù)咨詢機器人的特定需求,是否需要高度定制化。
舉個例子,初期可以使用Langchain框架或現(xiàn)有平臺快速搭建原型,隨著項目的深入,再逐步引入自研模型以優(yōu)化性能。這樣的混合方法可以平衡開發(fā)速度和模型的定制化需求。
具體使用什么LLM、embedding模型?
需要根據(jù)你的成本和想要實現(xiàn)的效果做權(quán)衡,目前有很多開源模型(如GPT-3、BERT)或商業(yè)模型(如阿里云、騰訊云提供的模型)供我們選擇,可以多試幾個最后看下前面我們提到的各類目標指標是否符合期待。
按照業(yè)務(wù)需求設(shè)計對應(yīng)的業(yè)務(wù)邏輯模塊?
回到最初的產(chǎn)品設(shè)計,還是需要提醒下你的業(yè)務(wù)需求是什么,比如由于我們這個系統(tǒng)需要給多方接入因此需要做鑒權(quán),和數(shù)據(jù)權(quán)限控制,以及后續(xù)要開放給企業(yè)和個人直接使用以及需要計算項目成本和收益,因此存在計費模塊等。
3. 研發(fā)
第一步:數(shù)據(jù)管理
數(shù)據(jù)準備階段:數(shù)據(jù)清洗–>數(shù)據(jù)提取–>文本格式轉(zhuǎn)換–>文本分割–>向量化(embedding)–>數(shù)據(jù)入庫
數(shù)據(jù)管理為了更好的進行embedding以及讓大模型更好的理解我們的知識,對數(shù)據(jù)的處理就需要注意下,因為有一個好的干凈的數(shù)據(jù)才能保證問答系統(tǒng)的準確率和召回率等指標。
數(shù)據(jù)整理時需要注意的點:
第二步:模型設(shè)計研究和開發(fā)
如今LLM應(yīng)用技術(shù)棧中的模型(例如GPT-4)就相當于其中的CPU,開發(fā)框架(例如LangChain或Dify)則相當于主板,而內(nèi)存、向量存儲、插件就好比主板上的各種I/O設(shè)施。正如組裝計算機一樣,開發(fā)者在構(gòu)建LLM應(yīng)用時也需理解、精心挑選和配置每個組件。
第三步:按照測試結(jié)果對模型進行調(diào)優(yōu)
雖然rag整體來說是一個比較好的技術(shù),但是前文講到的基礎(chǔ)RAG模型還存在很多問題因此在實際使用中還需要結(jié)合實際業(yè)務(wù)場景和需求進行微調(diào)。
該技術(shù)可以通過微調(diào)來提升各方面的性能指標,以下僅舉例幾個實際使用中常見的問題,來詳細闡述如何微調(diào)模型使其符合業(yè)務(wù)要求:
以上如果都進行調(diào)整后原始的rag技術(shù)架構(gòu)會變?yōu)槿缦聢D所示:
第四步:部署
第五步:根據(jù)實際使用結(jié)果對模型進行不斷調(diào)優(yōu)
可結(jié)合理想態(tài)指標按照第三步的方法進行優(yōu)化模型,或者通過添加交互和邏輯判斷來完善用戶體驗。
4. 案例
【NVIDIA大模型結(jié)合 RAG 構(gòu)建客服場景自動問答系統(tǒng)】NVIDIA提供了如下的RAG優(yōu)化后的模型,其架構(gòu)如下圖所示:
以及在對原始RAG架構(gòu)進行調(diào)整后模型效果有了怎樣的提升:
如果你的項目也想要用該模型的話可以前往對應(yīng)的地址,該地址可以通過文末的參考內(nèi)容進行逐步查找。
五、在本文之外的思考-LLM vs 互聯(lián)網(wǎng):
AI大模型的出現(xiàn)對商業(yè)的影響確實可以與幾十年前互聯(lián)網(wǎng)的出現(xiàn)相類比,盡管它們在技術(shù)和應(yīng)用上存在一些差異。以下是一些相似之處和不同之點:
相似之處:
- 信息傳播和訪問:互聯(lián)網(wǎng)的出現(xiàn)極大地降低了信息傳播的成本,使得全球范圍內(nèi)的信息共享成為可能。類似地,AI大模型能夠處理和分析大量數(shù)據(jù),提供智能化的信息檢索和生成,進一步改變了信息的獲取和傳播方式。
- 創(chuàng)新和變革:互聯(lián)網(wǎng)催生了全新的商業(yè)模式和行業(yè),如電子商務(wù)、社交媒體、在線廣告等。AI大模型也在推動各行各業(yè)的創(chuàng)新,例如在醫(yī)療、金融、教育、制造業(yè)等領(lǐng)域。
- 工作效率提升:互聯(lián)網(wǎng)通過電子郵件、在線協(xié)作工具等方式提高了工作效率。AI大模型則通過自動化處理復雜任務(wù)、提供決策支持等方式,進一步提升了工作效率和質(zhì)量。
不同之點:
- 技術(shù)本質(zhì):互聯(lián)網(wǎng)更多地是一種基礎(chǔ)設(shè)施,而AI大模型是一種智能化的工具和服務(wù)。AI大模型能夠進行推理、學習和預測,而互聯(lián)網(wǎng)則是一個信息傳輸?shù)钠脚_。
- 應(yīng)用范圍:互聯(lián)網(wǎng)的影響幾乎遍及所有行業(yè)和日常生活,而AI大模型的應(yīng)用雖然廣泛,但主要集中在數(shù)據(jù)處理、分析和決策支持等領(lǐng)域。
- 社會影響:互聯(lián)網(wǎng)對社會的影響更為直接和廣泛,包括信息獲取、溝通方式、娛樂等。AI大模型的影響則更多地體現(xiàn)在工作效率提升、決策質(zhì)量改善等方面。
- 發(fā)展階段:互聯(lián)網(wǎng)已經(jīng)經(jīng)歷了數(shù)十年發(fā)展,其商業(yè)模式和應(yīng)用相對成熟。相比之下,AI大模型仍處于快速發(fā)展階段,其商業(yè)模式和應(yīng)用場景仍在探索和成熟中。就拿目前中國的各種LLM商業(yè)化來說卻是還處在探索階段沒有很有突破性的產(chǎn)品出現(xiàn),更多的是LLM模型平臺、優(yōu)化智能客服、優(yōu)化推薦算法、面向企業(yè)的LLM解決方案以及自己構(gòu)建LLM等。所有的產(chǎn)品形態(tài)還是原先互聯(lián)網(wǎng)行業(yè)普遍存在的沒有什么新意。不過看了以上的文檔也發(fā)現(xiàn)現(xiàn)在公司要使用LLM來提升在特定流程中的效率也變得越來越簡單。
所以最后還是期待下AI、LLM可以給世界帶來像科幻電影一樣的新意,如果我有幸參與到了這樣的產(chǎn)品和技術(shù)的變革之中,真的是榮幸之至!
參考內(nèi)容:
TTS:
語音合成(TTS)開源調(diào)研與測評 – 知乎 (zhihu.com)
TTS | 一文了解語音合成經(jīng)典論文/最新語音合成論文篇【20240111更新版】_tts原理架構(gòu)圖-CSDN博客
1.2020-CCF語音對話與聽覺專業(yè)組會議(主辦單位:中國計算機學會 |B站:BV1ST4y1F7mg)
智能對話機器人:
保險行業(yè)智能客服產(chǎn)品的發(fā)展現(xiàn)狀 | 人人都是產(chǎn)品經(jīng)理 (woshipm.com)
智能聊天機器人系統(tǒng):從原理到應(yīng)用 (baidu.com)
如何搭建一個智能對話機器人?行業(yè)應(yīng)用和問答技術(shù)梳理 – 知乎 (zhihu.com)
2021年中國對話機器人ChatBot行業(yè)發(fā)展研究報告_澎湃號·湃客_澎湃新聞-The Paper
RAG:
【NVIDIA大模型結(jié)合 RAG 構(gòu)建客服場景自動問答系統(tǒng)】 https://www.bilibili.com/video/BV1mu4m1A7tv/?share_source=copy_web&vd_source=ca9ea0e22eea39c61d75ac3f10aa43f2
一文搞懂大模型RAG應(yīng)用(附實踐案例) – 知乎 (zhihu.com)
爆火!基于檢索構(gòu)建RAG應(yīng)用大模型實戰(zhàn) – 知乎 (zhihu.com)
深度好文!最全的大模型 RAG 技術(shù)概覽 – 知乎 (zhihu.com)
同濟大學發(fā)布最新檢索增強(RAG)的LLM生成技術(shù)綜述-騰訊云開發(fā)者社區(qū)-騰訊云 (tencent.com)
LLM產(chǎn)品:
《The AI Product Manager’s Handbook》
文章輔助撰寫:
智譜清言
本文由 @4T 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
你好,可以交流下嗎?私信我的公眾號“策略PM”
寫得很全面深入,感謝作者分享!如果要把RAG系統(tǒng)部署到微信客服,有兩個問題想請教下:1、如果用戶發(fā)送的是非文本的內(nèi)容(語音、圖片或文件),能否識別處理 2、能否支持給用戶下發(fā)非文本的內(nèi)容
1、增加ocr是被或者asr語音識別,文件同文本一個意思,只需要用對應(yīng)的方法處理下
2、微信支持發(fā)送視頻、鏈接等消息格式,可以網(wǎng)上搜下企業(yè)微信開發(fā)中心看下微信的能力
前面評論寫錯字了,hh,希望大佬以及和我一樣對新技術(shù)產(chǎn)品感興趣的朋友們,來評論區(qū)討論
新手進行自己分析,希望大佬以及和我一樣的新的技術(shù)產(chǎn)品感興趣的朋友們,來評論區(qū)討論,分析你們在實現(xiàn)中的問題和見解