国产一区二区三区高清资源在线,精品久久久无码人妻中文字幕豆芽,亚洲欧美国产国产一区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

RAG-大模型的知識(shí)庫「外掛」｜兼?zhèn)涑杀九c效益的行業(yè)解決方案

在野在也

2024-03-25

0 評(píng)論 3693 瀏覽 18 收藏

7 分鐘

RAG-檢索增強(qiáng)生成技術(shù)已經(jīng)可以看作是大語言模型應(yīng)用的核心技術(shù)之一，怎么理解RAG這項(xiàng)技術(shù)的價(jià)值和局限性呢？這篇文章里，作者做了梳理和總結(jié)，一起來看一下。

Hi，見字如面。

今天我們來聊一聊RAG-檢索增強(qiáng)生成這項(xiàng)技術(shù)應(yīng)用。

想象一下，如果大語言模型（LLM）能夠接入一個(gè)實(shí)時(shí)更新的知識(shí)庫，那它會(huì)給我們帶來一個(gè)什么樣的體驗(yàn)？

當(dāng)它與醫(yī)療數(shù)據(jù)庫結(jié)合時(shí)，LLM成為醫(yī)生和護(hù)士的AI伙伴，可隨時(shí)提供精準(zhǔn)的診斷建議和患者的護(hù)理方案。
當(dāng)它與市場(chǎng)數(shù)據(jù)結(jié)合時(shí)，LLM成為金融分析師的虛擬助理，輔助分析市場(chǎng)走勢(shì)，并提出明智的投資策略。
當(dāng)它與企業(yè)知識(shí)庫結(jié)合時(shí)，LLM轉(zhuǎn)變?yōu)槠髽I(yè)的全方位AI助理，從自動(dòng)化客戶服務(wù)到員工培訓(xùn)，再到銷售策略和市場(chǎng)洞察，助力企業(yè)實(shí)現(xiàn)智能化運(yùn)營(yíng)。

檢索增強(qiáng)生成（RAG，Retrieval-Augmented Generation）；

這項(xiàng)技術(shù)已經(jīng)被視為大語言模型應(yīng)用的核心技術(shù)之一，它有效地解決了大語言模型中誤導(dǎo)性的輸出問題、缺乏知識(shí)時(shí)效性的問題、以及特定領(lǐng)域?qū)I(yè)知識(shí)不足的問題。

一、什么是RAG？

簡(jiǎn)單的說RAG就是給大語言模型外掛一個(gè)“實(shí)時(shí)可更新的知識(shí)庫”，是一種使用外部數(shù)據(jù)來提高LLM的準(zhǔn)確性和可靠性的技術(shù)。

要實(shí)現(xiàn)RAG的過程，一共可分為三步：

第一步：準(zhǔn)備數(shù)據(jù)

我們需要準(zhǔn)備好知識(shí)庫中所需要的文檔數(shù)據(jù)，并且將這些數(shù)據(jù)上傳至知識(shí)庫中。

此時(shí)，上傳的數(shù)據(jù)會(huì)由「嵌入模型-Embedding Model」進(jìn)行向量化的處理，這個(gè)過程就是將文本內(nèi)容轉(zhuǎn)化為計(jì)算機(jī)理解的語言。

轉(zhuǎn)換后，再存儲(chǔ)在一個(gè)特定的數(shù)據(jù)庫中，這個(gè)數(shù)據(jù)庫通常被稱之為「向量數(shù)據(jù)庫-Vector Database」。

第二步：將用戶輸入的信息與知識(shí)庫的文檔進(jìn)行匹配

用戶輸入一段文本時(shí)，這段文本也會(huì)被「嵌入模型」進(jìn)行向量化處理；

然后計(jì)算機(jī)將用戶輸入的內(nèi)容與向量數(shù)據(jù)庫中的內(nèi)容進(jìn)行【相似匹配】，從而找到數(shù)據(jù)庫中最相關(guān)的文檔內(nèi)容。

在匹配的過程中有一些優(yōu)化的技術(shù)方式，常見的就是ANN，近似最鄰近搜索（Approximate Nearest Neighbor, ANN）。

第三步：匯總信息與生成內(nèi)容

將匹配到的信息與用戶輸入的信息結(jié)合（這里涉及到一些預(yù)處理的過程，比如讓模型能夠區(qū)分哪些是用戶輸入的信息，哪些是檢索到的知識(shí)）；再將處理后的信息輸入給模型生成一個(gè)綜合回答。

輸出的內(nèi)容不僅包括文本，還附有相關(guān)的引用來源。

二、RAG的優(yōu)勢(shì)與局限

現(xiàn)在，你應(yīng)該對(duì)RAG的核心工作原理有了清晰地理解；接下來，讓我們進(jìn)一步探討RAG的優(yōu)勢(shì)與局限。

優(yōu)勢(shì)方面，可以總結(jié)為以下四大優(yōu)勢(shì)：

1. 成本低且效益高

由于RAG技術(shù)是通過檢索現(xiàn)有的知識(shí)庫來增強(qiáng)模型的回復(fù)質(zhì)量，因此無需對(duì)模型（LLM）進(jìn)行重新訓(xùn)練，就能夠提升模型的輸出質(zhì)量。

2. 增強(qiáng)模型輸出的可信度

RAG生成的回答可以附帶對(duì)應(yīng)的引用來源，用戶可以輕松驗(yàn)證模型回答的準(zhǔn)確性，從而增加對(duì)模型輸出的信任。

3. 增強(qiáng)模型輸出的準(zhǔn)確性和專業(yè)性

通過檢索知識(shí)庫中的信息，可以有效減少模型作出錯(cuò)誤判斷的可能性，并利用特定的知識(shí)和提示（Prompt)，可以滿足不同行業(yè)或用戶的定制需求。

4. 始終訪問最新的數(shù)據(jù)

知識(shí)庫可以實(shí)時(shí)更新，便于模型調(diào)用最新的信息和數(shù)據(jù)。這對(duì)于需要實(shí)時(shí)獲取最新信息的領(lǐng)域尤為重要，如教育、醫(yī)療和金融領(lǐng)域。

5. 最后敲個(gè)黑板

RAG技術(shù)雖然有以上顯著的優(yōu)勢(shì)，但它不是萬能的，只是錦上添花的一種手段，因?yàn)樗饕莾?yōu)化了模型的輸入過程，通過豐富輸入信息的方式，來增強(qiáng)模型的輸出質(zhì)量。

但這項(xiàng)技術(shù)并不改變模型本身的推理能力，不會(huì)改變模型任何的參數(shù)。

如果模型本身的參數(shù)不足、在理解和推理上存在固有缺陷，單純用RAG技術(shù)也無法提高模型的輸出能力。

三、最后的話

這篇文章我們探討了RAG的技術(shù)原理、優(yōu)勢(shì)和其局限性，希望對(duì)你有所幫助和啟發(fā)。如果你有任何想法、疑問或者想要分享的經(jīng)驗(yàn)，請(qǐng)隨時(shí)留言交流。

祝你在AI應(yīng)用的探索之路上充滿收獲和進(jìn)步。

我是在野，歡迎關(guān)注，咱們下篇再見??

參考資料

《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》
《什么是檢索增強(qiáng)生成？》 from：NVIDIA-Blog

作者：在野在也，公眾號(hào)：在野在也

本文由 @在野在也原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

在野在也

分享偏見，終身成長(zhǎng) 同名公眾號(hào)&bilibili：在野在也

6篇作品 30030總閱讀量

如何做好B端產(chǎn)品的安全感設(shè)計(jì)？

03-205433 瀏覽

海底撈營(yíng)銷管理策略探究 ——基于7Ps營(yíng)銷管理理論中的促銷與過程

02-024858 瀏覽

如何展開公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)？

06-123642 瀏覽

C端線上標(biāo)準(zhǔn)活動(dòng)設(shè)計(jì)思路

07-0110501 瀏覽

如果你在工作中感到痛苦，一定是這里出現(xiàn)了問題

12-042352 瀏覽

評(píng)論

目前還沒評(píng)論，等你發(fā)揮！

ChatGPT曝光新進(jìn)展，中國(guó)OpenAI們瘋狂追趕

06-303939 瀏覽
字節(jié)跳動(dòng)再戰(zhàn)長(zhǎng)視頻，這次有何不一樣?

09-235563 瀏覽
干貨！6 條提升用戶體驗(yàn)的小貼士

02-217187 瀏覽