99RE视频热这里只有精品7,日韩欧美国产AⅤ另类

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

RAG實踐篇（三）：向量檢索的AI應用，讓知識“活起來”

AI 實踐干貨

2024-12-13

0 評論 1640 瀏覽 4 收藏

9 分鐘

向量檢索技術正在成為RAG智能問答的“隱形功臣”，讓很多企業/專業領域繁復龐大的知識庫真正“活起來”，而作為產品經理，理解他的“有效”和“有限性”，能真正地將這個檢索技術為產品所用。

產品經理小明收到一家大型科技公司的RAG項目需求：要構建一個用于員工QA的智能chatbot產品。

公司希望這個產品既能回答常見的、標準的公司政策問題（如“如何申請出差津貼”、“公司的年假福利是什么樣的？”），同時又能應對各類復雜的、非標準化問題（如“跨團隊合作的最佳實踐是什么？”）。

作為產品經理，小明與開發討論起技術實現。

開發摸著下巴，若有所思：“標準化問題還好說，但如果問題復雜，還是非標準化的。需要模型有更強的語義檢索能力，可以在知識庫里找到最合適用戶的答案。咱們就用向量檢索技術來做吧。”

聊到這里，小明也不免好奇，向量技術究竟是什么？它在RAG的實踐中起到什么作用？

這篇文章會介紹向量技術在RAG中的應用，其核心概念、實踐流程以及在產品中的具體應用場景。

一、向量：讓“文本”可以被計算

在機器學習領域，向量是一組用數字表示的數學對象，通常用于描述一個文本、圖像或其他數據的語義特征。這些數字是從深度學習模型中提取的，能夠捕捉文本或數據的含義，并用這種形式來表示語義關系。

你可以把“向量”想象成一個坐標點，處于一個高維空間中（比如3維空間、100維空間甚至更高）。在這個空間中，語義相似的內容會靠得更近，而語義差異大的內容則會距離更遠。

例如，“如何申請年假？” 和 “怎么請假？”這兩個問題的表達方式是不同的，但語義非常接近。如果用向量表示，它們會被映射到一個高維向量空間中相鄰的區域，從而使得計算機知道它們含義相近。而“公司年假政策是什么？”和“跨團隊合作的最佳實踐是什么？”，雖然語法結構有點相似，但含義天差地別，在向量空間中會有較遠的距離。

二、在RAG里的應用

RAG主要通過“檢索 + 生成”兩個階段結合來處理復雜的問題，簡單來說，它的步驟可以概括為：

問題理解（Query Understanding） 用戶輸入問題后，系統首先通過自然語言處理模型將問題轉化為模型可理解的形式。
知識檢索（Knowledge Retrieval） RAG會利用檢索技術（如向量檢索或傳統關鍵詞檢索）從知識庫中提取與問題語義相關的內容。
內容生成（Answer Generation） RAG通過生成式AI模型（如GPT-4、Claude）將檢索到的內容與用戶問題結合，生成自然語言回答。
答案輸出（Response Output） 最終生成的回答會以用戶可以理解的形式輸出。

由此可以看到，向量技術是語義檢索的核心。RAG需要從一個龐大的知識庫中找到與用戶問題最相關的內容，然后再將這些內容傳遞給模型進行回答。而向量的作用是把用戶的問題和知識庫內容都轉化為高維語義向量，并通過數學方法找到兩者之間的距離。

具體應用：

向量化過程：用戶輸入問題“年假如何申請？” → 轉化為向量 V1 知識庫中存儲的文本片段“年假申請流程：登錄HR系統申請” → 轉化為向量 V2 向量檢索通過計算 V1 和 V2 的距離，判斷它們的語義是否相關，距離越近，匹配度越高。
實際輸出： RAG通過向量檢索找到匹配的內容后，將這段知識傳遞給生成模型，生成回答：“請登錄HR系統，通過‘請假申請’模塊提交年假申請?！?/li>

三、亮點和局限

作為AI產品經理，了解向量檢索的“能做什么”和“不能做什么”也很重要。

亮點

向量檢索的最大亮點是可以理解用戶輸入中的語義。要知道在傳統的關鍵詞檢索中，對復雜句式或詞語變形無法很好的處理。而向量檢索可以通過語義相似性輕松解決，比如用戶提問“我想請年假應該怎么做？”，系統也能準確理解，并返回相關內容。

也正因此，它能更加游刃有余地處理非結構化數據，比如長文本、對話記錄等。而在企業的知識庫中，知識信息往往都是以文檔或長段落的形式存儲的。通過向量檢索，就可以將這些復雜內容進行語義分割，檢索出與用戶問題相關的段落。比如，當一個員工想知道“跨部門協作有哪些最佳實踐？”時，系統可以直接從企業的管理文檔中把“跨部門協作”的有關段落提取出來就能回答。

局限

向量檢索的本質是基于“相似度”的匹配，但相似度高并不等于答案相關性高。比如，用戶提了問題“年假申請需要哪些材料？”，由于知識庫里并沒有“年假申請材料”的相關知識。模型可能就會提供提供一段“年假政策”的內容，因為這是它所能檢索到的“相似度”系數最高的內容了。像這種“語義相似度高但不正確”的情況，就會影響用戶體驗。

另外，由于向量檢索是基于語義相似度的匹配。而用戶的問題是橫跨多個領域或者多個主題的時候，語義的向量分布就比較“稀疏”。比如用戶提問“AI在醫療和教育中的應用區別是什么？”。向量的相似度檢索可能只能找到“AI與醫療”或“AI與教育”單獨相關的內容，但難以整合兩者的區別進行回答。結果它就只會返回到單一行業進行回答，而忽略問題的整體意圖。