99久久伊人精品综合观看,日韩亚洲av无码三区二区不卡

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

RAG一周出Demo，半年上不了線，怎么破？

風叔

2025-01-20

0 評論 1409 瀏覽 5 收藏

16 分鐘

許多從業者發現，盡管RAG能在短時間內快速搭建出Demo，但在實際生產環境中落地卻困難重重。本文從AI大模型領域創業者的視角出發，深入剖析了RAG在產業落地中的核心問題——問題分級，并詳細探討四類問題的挑戰與解決方案，供大家參考。

很多熟悉RAG的產品經理和工程師會吐槽，“做RAG一周就可以出Demo，但真正做到能上生產環境的水平，半年時間都不夠！”。

這是現階段RAG在產業落地的現實問題。RAG框架非常簡單易懂，也有很多優化RAG全流程的方式和手段，風叔在此前的文章中也做過詳細介紹，《Rag系統的發展歷程，從樸素、高級到模塊化》。

但無論是企業內部使用，還是面向C端用戶，大家最直接的感受是，RAG只能檢索和回答相對淺顯直觀的問題。

企業知識庫領域的獨角獸Hebbia也曾經做過實驗，RAG實際上只能解決企業內部16%的問題，這到底是什么原因呢？

答案是問題分級。

任何用戶檢索問題都可以分成四類，顯性事實查詢、隱性事實查詢、可解釋性推理查詢和隱性推理查詢，這四類問題的復雜度和解題難度依次提升。

下圖列出了每類問題面對的挑戰和解決方法?？梢钥闯觯挥酗@性事實查詢和部分隱性事實查詢，可以通過RAG、Iterative Rag或GraphRag來解決。而可解釋性推理查詢和隱性推理查詢問題，RAG就沒有用武之地了，需要依靠其他更復雜和針對性的解決方案。

在實際企業應用場景中，絕大多數對業務部門有價值的問題都處于Level 3和Level 4，因此導致了“RAG一周出Demo，半年上不了線”的窘境。

接下來，風叔將詳細闡述這四類問題的特點和解決方案?？吹阶詈螅嘈拍阋欢〞惺斋@！

一、顯性事實查詢

顯性事實是指外部數據中直接存在的事實信息或數據，不需要進行額外的推理。比如“2016年奧運會在哪里舉辦的？”、“某傳感器的品牌和工作溫度是多少？”、“門店A上個月的營業額是多少？”。

顯性事實查詢是最簡單的查詢形式，直接從提供的數據中檢索到明確的事實信息，不需要復雜的推理和思考，因此非常適合使用RAG。

當然，要準確、高效地檢索和生成相關內容，還需要對RAG系統進行優化?？梢酝ㄟ^風叔之前介紹的方法，這里再做個簡單的回顧。

索引構建

塊優化：通過滑動窗口、增加元數據、從小到大等方式，更加合理地對內容塊的大小、結構和相關性進行分塊。
多級索引：指創建兩個索引，一個由文檔摘要組成，另一個由文檔塊組成，并分兩步搜索，首先通過摘要過濾掉相關文檔，然后只在這個相關組內進行搜索。
知識圖譜：提取實體以及實體之間的關系，構建一種全局性的信息優勢，從而提升RAG的精確度。

預檢索

多查詢：借助提示工程通過大型語言模型來擴展查詢，將原始Query擴展成多個相似的Query，然后并行執行。
子查詢：通過分解和規劃復雜問題，將原始Query分解成為多個子問題，最后再進行匯總合并。
查詢轉換：將用戶的原始查詢轉換成一種新的查詢內容后，再進行檢索生成。
查詢構建：將自然語言的Query，轉化為某種特定機器或軟件能理解的語言，比如text2SQL、text2Cypher。

檢索

稀疏檢索器：用統計方法將查詢和文檔轉化為稀疏向量。其優勢在于處理大型數據集時效率高，只關注非零元素。
密集檢索器：使用預訓練的語言模型（PLMs）為查詢和文檔提供密集表示，盡管計算和存儲成本較高，卻能提供更復雜的語義表示
檢索器微調：基于有標記的領域數據微調檢索模型，通常借助對比學習來實現

檢索后

重排序：對于檢索到的內容塊，使用專門的排序模型，重新計算上下文的相關性得分。
壓縮：對于檢索到的內容塊，不要直接輸入大模型，而是先刪除無關內容并突出重要上下文，從而減少整體提示長度，降低冗余信息對大模型的干擾。

二、隱性事實查詢

隱性事實并不會直接在原始數據中顯現，需要少量的推理和邏輯判斷。而且推導隱性事實的信息可能分散在多個段落或數據表中，因此需要跨文檔檢索或跨表查詢。

比如，“查詢過去一個月營收增長率最高的門店”，就是一個典型的隱性事實查詢。需要先獲取所有門店這個月和上個月的營收，然后計算每個門店的營收增長率，最后排序得出結果。

隱性事實查詢的主要挑戰是，不同問題依賴的數據源和推理邏輯都各不相同，如何保障大模型在推理過程中的泛化性。

隱性事實查詢的主要解題思路包括以下方法：

多跳檢索和推理

Iterative Rag：在檢索前先生成檢索計劃，然后在檢索過程中不斷根據檢索結果進行優化。比如利用ReAct框架，沿著Thought – Action – Observation的分析思路，逐步逼近正確答案。

Self-Rag：構建四個關鍵的評分器，即檢索需求評分器、檢索相關性評分器、生成相關性評分器和回答質量評分器，從而讓大模型自主決定何時開始檢索、何時借助外部搜索工具、何時輸出最終答案。

利用圖和樹結構

Raptor：RAPTOR 根據向量遞歸地對文本塊進行聚類，并生成這些聚類的文本摘要，從而自下而上構建一棵樹。聚集在一起的節點是兄弟節點；父節點包含該集群的文本摘要。這種結構使 RAPTOR 能夠將代表不同級別文本的上下文塊加載到 LLM 的上下文中，以便能夠有效且高效地回答不同層面的問題。

GraphRag：一種將知識圖譜與Rag相結合的技術范式。傳統Rag是對向量數據庫進行檢索，而GraphRag則對存儲在圖數據庫中的知識圖譜進行檢索，獲得關聯知識并實現增強生成。

將自然語言轉換成SQL查詢

text2SQL：主要用于數據庫查詢，尤其是多表查詢場景，可參考《一文讀懂ChatBI的實現難點與解決方案，問答準確率超過99%》

三、可解釋性推理

可解釋性推理，是指無法從顯性事實和隱性事實中獲取，需要綜合多方數據進行較為復雜的推理、歸納和總結的問題，并且推理過程具備業務可解釋性。

ChatBI中的歸因分析，就是典型的可解釋性推理，比如”過去一個月，華南區域營收下滑5%的原因是什么？“。這個問題無法直接獲取，但可以通過一定方式進行推理，如下所示：

總營收 = 新客 * 轉化率 * 客單價 + 老客 * 復購率 * 客單價

經過分析，新客數量、轉化率和客單價并未發生明顯變化，而老客復購率下滑約10%，因此可以推斷出可能是”服務質量、競品競爭“等原因，引起了老客復購率的下滑，從而導致了總營收的下降。

可解釋性推理問題主要有兩個挑戰，多樣化的提示詞和有限的可解釋性。

多樣化的提示詞：不同的查詢問題，需要特定的業務知識和決策依據。比如推理營收下滑的原因可以用上述的業務規則，但如果是推理毛利率下滑的原因，就需要另一種業務規則。這種多樣化的規則沉淀，既需要行業專家進行梳理和沉淀，也需要將其轉換為合適的提示詞，讓大模型理解背后的邏輯。
有限的可解釋性：提示詞對于大模型的影響是不透明的，我們很難評估提示詞對模型的影響，因此會妨礙我們構建一致的可解釋性

面對這樣的挑戰，風叔主要有以下建議：

提示詞工程優化

優化提示詞：需要有效地將業務推理邏輯，整合到大語言模型中，比較考驗提示詞設計人員的行業know-how。

提示詞微調：手動設計提示詞會很耗時，可以通過提示詞微調技術解決這個問題。比如通過強化學習，將大模型生成正確回答的概率作為獎勵，指導模型在不同數據集上發現最佳提示詞配置。

構建決策樹

決策樹：將決策流程轉換為狀態機、決策樹或偽代碼，讓大模型執行。比如在設備運維領域，構建故障樹就是一種非常有效的故障檢測方案。

利用智能體工作流

Agentic Workflow：通過workflow構建大模型思考和行動的具體步驟，從而約束大模型的思考方向。這種方法的優點是能夠提供相對穩定的輸出，但缺點是靈活性不足，同樣需要針對每類問題設計工作流。

四、隱性推理查詢

隱性推理查詢，是指難以通過事先約定的業務規則或決策邏輯進行判斷，而必須從外部數據中進行觀察和分析，最終推理出結論。

比如IT智能運維，并不存在先驗的完整文檔，詳細記錄每種問題的處理方法和規則，只有運維團隊過去處理的各種故障事件和解決方案。大模型需要從這些數據中挖掘出針對不同故障的最佳處理方案，這就是隱性推理查詢。

同樣，在產線智能運維、智能量化交易等場景中，都涉及大量的隱性推理查詢問題。

隱性推理問題的主要挑戰是邏輯提煉困難、數據分散和不足，是最為復雜和困難的問題。

邏輯提煉困難：在海量數據中挖掘隱性邏輯，需要開發復雜且有效的算法，能夠解析和識別隱藏在數據背后的邏輯。因此，僅依靠表面的語義相似性是遠遠不夠的，需要構建專門的小模型來應對。
數據分散和不足：隱性邏輯往往隱藏在非常分散的知識中，因此要求模型具備強大的數據挖掘和綜合推理能力。同時，當外部數據有限或者數據質量不滿足要求時，也很難從中挖掘出有價值的信息。

對于隱性推理問題所面臨的挑戰，有以下解題思路：