檢索增強生成（RAG）：如何讓AI大模型更懂我？

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

AI小當家

2024-02-21

0 評論 4656 瀏覽 21 收藏

8 分鐘

大模型的局限性體現在缺少實時性、無法獲取私有知識等方面，而RAG可以幫助解決私有知識問題，讓私有知識庫和AI大模型更好地融合。怎么理解RAG的原理、應用場景和優缺點？一起來看看本文的分享。

上文簡單介紹了AI大模型非常重要的提示工程，今天我們繼續學習檢索增強生成（Retrieval-Augmented Generation，RAG）。

RAG可以將私有知識庫和AI大模型融合，讓大模型“知道”我們的私有知識，變得越來越“懂”我們。

一、AI大模型的局限性

使用過大模型的小伙伴應該知道，雖然大模型看起來無所不能，但是它也經常胡編亂造，沒有足夠的確定性，這也限制了大模型在各種場景的落地。

大模型的局限性，可以簡單歸納為以下兩點：

針對實時性問題，一般通過Actions或Function Calling（函數調用，可以理解為接口回調）等方式，讓大模型實時調用搜索、地圖、甚至企業自己實現的api，獲取各種需要的實時信息，減少幻覺，提升確定性。

而RAG可以解決私有知識問題，它通過外掛知識庫的方式，讓大模型可以根據檢索到的內容，回答私有庫的相關問題，也就是所謂的檢索增強，目的同樣是提升確定性。

RAG的核心目的是通過某種途徑把我們的知識告訴給AI大模型，其核心流程就是根據用戶提問，從私有知識中檢索到“包含答案的內容”，然后把“包含答案的內容”和用戶提問一起放到prompt（提示詞）中，提交給大模型，此時大模型的回答就會充分考慮到“包含答案的內容”，看起來也就更“懂”我們。

那么具體要如何實現呢？再看一下核心流程，會發現有一個必須解決的問題，就是如何“根據用戶提問，從私有知識中檢索到包含答案的內容”，用戶的提問是自然語言（包含復雜的語義理解），傳統的關鍵字檢索（Elastic Search）是無法理解語義的，這時候就需要引入向量檢索的概念了。

向量：文本的語義關系在底層被處理為向量，向量就是一組浮點數，例如[0.72, 0.42, …]，代表該文本在N維空間里的坐標。在空間中距離越近的向量，語義也就越接近。一般使用歐式距離或余弦距離來衡量向量的相似度。
向量檢索：向量檢索實際上是將文本分段轉換成了一個個向量，通過余弦距離或歐式距離來計算兩個向量之間的相似度，向量相似度越高，表示對應的文本語義相似度越高。
向量數據庫：專門為向量檢索設計的中間件。

我們可以通過向量檢索來獲得與用戶問題語義最相近的私有知識庫的內容，即便用戶問題中沒有包含關鍵字，也可以通過語義的相關性搜索到“包含答案的內容”。

實現RAG的具體步驟如下：