RAG實踐篇(三):向量檢索的AI應用,讓知識“活起來”

0 評論 1640 瀏覽 4 收藏 9 分鐘

向量檢索技術正在成為RAG智能問答的“隱形功臣”,讓很多企業/專業領域繁復龐大的知識庫真正“活起來”,而作為產品經理,理解他的“有效”和“有限性”,能真正地將這個檢索技術為產品所用。

產品經理小明收到一家大型科技公司的RAG項目需求:要構建一個用于員工QA的智能chatbot產品。

公司希望這個產品既能回答常見的、標準的公司政策問題(如“如何申請出差津貼”、“公司的年假福利是什么樣的?”),同時又能應對各類復雜的、非標準化問題(如“跨團隊合作的最佳實踐是什么?”)。

作為產品經理,小明與開發討論起技術實現。

開發摸著下巴,若有所思:“標準化問題還好說,但如果問題復雜,還是非標準化的。需要模型有更強的語義檢索能力,可以在知識庫里找到最合適用戶的答案。咱們就用向量檢索技術來做吧。”

聊到這里,小明也不免好奇,向量技術究竟是什么?它在RAG的實踐中起到什么作用?

這篇文章會介紹向量技術在RAG中的應用,其核心概念、實踐流程以及在產品中的具體應用場景。

一、向量:讓“文本”可以被計算

在機器學習領域,向量是一組用數字表示的數學對象,通常用于描述一個文本、圖像或其他數據的語義特征。這些數字是從深度學習模型中提取的,能夠捕捉文本或數據的含義,并用這種形式來表示語義關系。

你可以把“向量”想象成一個坐標點,處于一個高維空間中(比如3維空間、100維空間甚至更高)。在這個空間中,語義相似的內容會靠得更近,而語義差異大的內容則會距離更遠。

例如,“如何申請年假?” 和 “怎么請假?”這兩個問題的表達方式是不同的,但語義非常接近。如果用向量表示,它們會被映射到一個高維向量空間中相鄰的區域,從而使得計算機知道它們含義相近。而“公司年假政策是什么?”和“跨團隊合作的最佳實踐是什么?”,雖然語法結構有點相似,但含義天差地別,在向量空間中會有較遠的距離。

二、在RAG里的應用

RAG主要通過“檢索 + 生成”兩個階段結合來處理復雜的問題,簡單來說,它的步驟可以概括為:

  1. 問題理解(Query Understanding) 用戶輸入問題后,系統首先通過自然語言處理模型將問題轉化為模型可理解的形式。
  2. 知識檢索(Knowledge Retrieval) RAG會利用檢索技術(如向量檢索或傳統關鍵詞檢索)從知識庫中提取與問題語義相關的內容。
  3. 內容生成(Answer Generation) RAG通過生成式AI模型(如GPT-4、Claude)將檢索到的內容與用戶問題結合,生成自然語言回答。
  4. 答案輸出(Response Output) 最終生成的回答會以用戶可以理解的形式輸出。

由此可以看到,向量技術是語義檢索的核心。RAG需要從一個龐大的知識庫中找到與用戶問題最相關的內容,然后再將這些內容傳遞給模型進行回答。而向量的作用是把用戶的問題知識庫內容都轉化為高維語義向量,并通過數學方法找到兩者之間的距離。

具體應用:

  • 向量化過程: 用戶輸入問題“年假如何申請?” → 轉化為向量 V1 知識庫中存儲的文本片段“年假申請流程:登錄HR系統申請” → 轉化為向量 V2 向量檢索通過計算 V1 和 V2 的距離,判斷它們的語義是否相關,距離越近,匹配度越高。
  • 實際輸出: RAG通過向量檢索找到匹配的內容后,將這段知識傳遞給生成模型,生成回答:“請登錄HR系統,通過‘請假申請’模塊提交年假申請?!?/li>

三、亮點和局限

作為AI產品經理,了解向量檢索的“能做什么”和“不能做什么”也很重要。

亮點

向量檢索的最大亮點是可以理解用戶輸入中的語義。要知道在傳統的關鍵詞檢索中,對復雜句式或詞語變形無法很好的處理。而向量檢索可以通過語義相似性輕松解決,比如用戶提問“我想請年假應該怎么做?”,系統也能準確理解,并返回相關內容。

也正因此,它能更加游刃有余地處理非結構化數據,比如長文本、對話記錄等。而在企業的知識庫中,知識信息往往都是以文檔或長段落的形式存儲的。通過向量檢索,就可以將這些復雜內容進行語義分割,檢索出與用戶問題相關的段落。比如,當一個員工想知道“跨部門協作有哪些最佳實踐?”時,系統可以直接從企業的管理文檔中把“跨部門協作”的有關段落提取出來就能回答。

局限

向量檢索的本質是基于“相似度”的匹配,但相似度高并不等于答案相關性高。比如,用戶提了問題“年假申請需要哪些材料?”,由于知識庫里并沒有“年假申請材料”的相關知識。模型可能就會提供提供一段“年假政策”的內容,因為這是它所能檢索到的“相似度”系數最高的內容了。像這種“語義相似度高但不正確”的情況,就會影響用戶體驗。

另外,由于向量檢索是基于語義相似度的匹配。而用戶的問題是橫跨多個領域或者多個主題的時候,語義的向量分布就比較“稀疏”。比如用戶提問“AI在醫療和教育中的應用區別是什么?”。向量的相似度檢索可能只能找到“AI與醫療”或“AI與教育”單獨相關的內容,但難以整合兩者的區別進行回答。結果它就只會返回到單一行業進行回答,而忽略問題的整體意圖。

結語

總體來說,向量檢索正在成為RAG智能問答的“隱形功臣”,讓很多企業/專業領域繁復龐大的知識庫真正“活起來”,而作為產品經理,理解他的“有效”和“有限性”,能真正地將這個檢索技術為產品所用。

本文由 @AI 實踐干貨 原創發布于人人都是產品經理。未經作者許可,禁止轉載

題圖來自 Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!