從喧囂回歸理性:從大模型回歸業務

4T
1 評論 2051 瀏覽 6 收藏 17 分鐘

一個新技術的誕生,因為大家一開始不夠了解,總會夸大想象。其實上手一段時間之后就會發現不過如此。這篇文章,作者就分享了自己對大模型的態度變化和思考的過程,供大家參考。

四月,我滿懷期待與渴望發布了關于 RAG 重塑智能客服行業的文章。那時,對未來充滿無限幻想。然而,歷經幾個月的 AI 產品經理之旅,如今的我與市場一同回歸理性。

這段時間,我見證了大模型的奇妙變化,看到了它的無限可能性,也掉入過它的 “坑”。雖有諸多問題,但不可否認,大模型為工作帶來極大便捷,數據分析精準高效、代碼編寫輕松省力、文章創作才華盡顯。從最初的滿心憧憬到探索中的迷茫困惑,再到如今的冷靜思考,我深刻體會到 AI 之路的波瀾起伏。

接下來就講述下我這段時間遇到的問題和我后續的思考:

一、技術日新月異的時代,速度意味著一切嗎?

1、第一階段

年初,市場一片火熱,大模型技術如同一顆璀璨的新星,吸引著眾人的目光。大家對其充滿狂熱,仿佛看到了未來的無限可能。我們也不例外,懷著激動的心情測試了大模型在某個垂類領域問答的準確率,結果在合格分數上下波動,但這足以讓我們看到希望,覺得這是一個可以給垂類行業帶來第二增長曲線的機遇,因為通用大模型無法實現可用的準確率。

1.1 垂類大模型訓練

于是,我們開始思考如何提升問答準確率這個關鍵參數。縱觀市面上的各種宣傳,各行各業都在宣稱自己是首個某某垂類大模型。

確實,以人的認知方式類比,看過學過更多領域知識的人會成為專家,大模型似乎也遵循著這個邏輯。從 AI 的發展史來看,它是一個數據驅動的領域,像李飛飛教授的 imagenet 數據集,大模型也是因龐大的數據量而產生質的突變。按照慣性思維,單獨訓練垂類大模型似乎是個明確的方向。

而且,當與各大大模型廠商合作時,可以要求他們訓練的大模型達到特定的準確率數值,在上半年,這看起來確實是個花錢就能達成目標的事情。然而,故事往往不會一帆風順。

1.2 垂類大模型+rag

除了垂類大模型的訓練,我們還引入了 RAG(檢索增強生成)技術。

通用大模型存在一些問題,而 RAG 仿佛是舞臺上冉冉升起的新星,在第一階段,我們對它充滿期待,認為它會給這個舞臺帶來無數激動人心的時刻,灑滿鮮花。

考慮到后續商業化以及項目的自主性,我們毅然選擇了自研這條路。但沒想到,這條自研之路也是荊棘叢生。

從自有知識庫準備好的 QA 對,到非結構化文章的切片、子切片,再到向量化、相似度檢索、排序、重排序等幾個大模塊,我們艱難地建立起自己的 RAG 問答流程(ps:之所以叫艱難的建立起,是因為,在另外一家公司我們使用的是選擇現有的LLM平臺來實現以上的流程,完全沒有自己從0-1建立起來時的諸多困擾)。

在這個過程中,我們的心情從最初的滿懷期待,逐漸變得焦慮和審慎,深刻體會到了 AI 探索之路的不易。但我們知道,只有不斷前行,才能在這片充滿挑戰的領域中找到屬于自己的成功之路。

補充說明:純大模型的缺陷

知識的局限性:知識更新緩慢和答案缺乏透明度。模型自身的知識完全源于它的訓練數據,而現有的主流大模型(ChatGPT、文心一言、通義千問…)的訓練集基本都是構建于網絡公開的數據,對于一些實時性的、非公開的或離線的數據是無法獲取到的,這部分知識也就無從具備。

幻覺問題:所有的AI模型的底層原理都是基于數學概率,其模型輸出實質上是一系列數值運算,大模型也不例外,所以它有時候會一本正經地胡說八道,尤其是在大模型自身不具備某一方面的知識或不擅長的場景。而這種幻覺問題的區分是比較困難的,因為它要求使用者自身具備相應領域的知識。

數據安全性:對于企業來說,數據安全至關重要,沒有企業愿意承擔數據泄露的風險,將自身的私域數據上傳第三方平臺進行訓練。這也導致完全依賴通用大模型自身能力的應用方案不得不在數據安全和效果方面進行取舍。

補充說明:不同rag構建方式優劣勢對比

在經歷了一系列提升準確率的操作后,我們確實看到了成果的提升。然而,正如生活中總是充滿意外,新的發展也接踵而至。此時,我們認為自身的基礎技術能力已有了一定積累,于是懷揣著為企業帶來新發展的期望,著手打造一個能夠運用這些能力并實現商業化可能性的產品。

在這個產品的發展過程中,我們迎來了重大的轉折點。我們深刻認識到傳統程序構建方式與算法工程化之間的巨大差異。傳統程序以跑起來為首要目標,只要能夠順利運行,便達成了基本要求。

但算法工程卻截然不同,它更像是一個個精心設計的實驗,需要在每個小閉環中不斷地進行測試、再測試。每一次的嘗試都是一次探索,每一次的調整都是為了更接近完美。

2、第二階段

2.1 回答不夠完整和有條理,且存在某些不適合垂類領域的偏向。

問題表現:由于產品的目標是商業化,因此我們將我們的產品給客戶進行試用,客戶反饋產品準確率不行且回答不夠完整和有條理、且存在事實性錯誤。

原因分析:

  • 垂類大模型被訓練成更偏向簡潔回答模式:訓練前我們只關注問答準確率,未確認好期望的問答結構和回答方式。如雖然我們知道 rag 問答知識準備中雖注意到一個問題一個答案及數據多樣化,但在相似其他相似領域未獲得我們重視。
  • 垂類大模型被訓練成回答會有某些偏向的模式:訓練所需數據確認方式有問題,若放入有偏向性及后續需要不斷更新的數據,會導致問答結果有偏向性。比如在法律領域不同地區法律存在差異,你給大模型的數據偏向于北京的數據,后續回答就容易在不明確地區的情況下回答北京,導致存在實時性的誤差,因此后續要么確保數據沒有地區,在rag中使用這些地區的數據,要么不斷的訓練防止以上的問題產生。

2.2 內部知識庫+垂類大模型不如通用大模型+聯網搜索?

問題表現:測試結果顯示大半年努力不如通用大模型包裝出來的流程調用,即使在法律這樣對數據及時性有效性要求高的行業也如此。

思考困惑

  • 讓人迷茫做這個東西的流程意義何在,也理解了為何媒體宣傳 AI 搜索有前景。
  • 可能是我們的測試方式也要點問題,因為使用的是小的模型對比市場上的通用大模型。

2.3 回答的召回率不高

問題確認:結果,我們從 0 – 1 剖析整個流程,發現文檔拆分未按要求進行,導致無法召回效果一直不是很好。且由于我們是特定的行業,存在很多行業內相似的詞匯,但是 embedding 模型轉換出來的向量相似度不高導致無法召回等等。

嘗試措施:測試不同的 embedding 模型、增加稀疏向量、使用不同重排序策略、利用上下文信息、對 chunk 進行不同拆分、擴充問句、重新梳理整套流程然后進行各個模塊的測試。

注意事項:

算法和工程同學進行各種改動時先使用 MVP 測試效果,避免按照原本工程思維,只關注是否可以跑起來,不管每個模塊跑的各種細節是否穩定是否符合預期,從而導致發布后出現問題需大量的改動。

技術日新月異的時代,實現速度雖重要,也要注重對實現效果的反復驗證。

二、理性回歸,反思技術

1、《讓大象飛》引發共鳴,技術并非萬能

近期閱讀了《讓大象飛》這本書,其中的一些觀點讓我產生了強烈的共鳴。書中提到技術并沒有我們以為的那么重要,任何新的技術通常都會經歷一個 25 年的接受和采用周期。這讓我深刻反思了在大模型創業過程中的經歷。在追求技術創新的道路上,我們往往容易陷入對技術的過度熱愛,而忽略了其他重要的因素。

在公司內部創業過程中,我們也曾陷入技術陷阱。在探索產品功能的算法方案時,花費了將近一個月的時間,期間還換了人,但最終結果卻充滿戲劇性。這讓我意識到,技術并非萬能,不能僅僅依靠技術來推動企業的發展。我們需要更加關注用戶需求、商業模式創新、設計創新,以及如何將技術與現有業務相結合,滿足商業上的需求。

2、用戶需求、商業模式與設計創新更受關注

在經歷了大模型創業的波折后,我越發認識到商業模式與設計創新的重要性。正如書中所說,采用新技術的動力應該來自商業上的需求,而不是相反。商業模式創新就像一座燈塔,引導企業駛向未知的、有利可圖的水域。

商業模式創新展示了公司如何為客戶提供價值,無論是開發新的收入流還是拓展分銷渠道都至關重要。它不僅僅是產品的創新,更是關于改變企業的本質、收入流、市場以及客戶對價值的認知。例如 Airbnb 以其共享經濟模式顛覆了酒店行業,Spotify 的訂閱服務也顛覆了傳統音樂購買模式,這些都是商業模式創新的成功案例。

3、對于初創企業來說,先 “活下來” 是首要問題

雖然好的商業模式和設計模式很重要,但是在在創業早期,我們應該更多地關心市場需求,因為從本質上來說商業模式無非就是用戶/客戶給你錢或者廣告商給你錢,而愿意給你錢的本質是你能滿足他們的需求。

通過觀察世界,找出存在的問題,對現有技術做出調整以適應目標,測試市場來發現需求,探索可能的市場機會。只有這樣,我們才能避免落入 “技術陷阱”,實現企業的可持續發展。

三、未來展望,穩步前行

1、對于自我:實踐出真知

目前的感受是實踐出真知,看了很多文章看了很多項目,直到自己實際去體驗的時候才發現,哪哪都是坑,一個不留意都可能對最后的結果產生影響。

在 AI 的世界里,處處皆是挑戰。傳統的程序以運行起來為首要目標,而算法工程則如同一個個精心設計的實驗。每一個小閉環都需要我們不斷地測試、再測試。一個細微的疏忽,都可能對最終結果產生重大影響。我們必須時刻保持警惕,以嚴謹的態度對待每一個環節。

2、對于大模型:持續探索,在 AI 領域穩步邁進

過往我不斷的探索三維深度信息,思考它如何被人類記憶,如何影響其他信息的認知。如今,AI 領域不斷拓展,語義 AI 之外,具身智能嶄露頭角。

具身智能強調智能體與真實世界的多模態交互,通過 “眼耳鼻舌身” 五根主動獲取物理世界的真實反饋,推動智能化向更高層次進化。未來的 AI 產品有望從傳統的 2D 平面人工智能邁向 3D 空間、4D 時序的新領域。具身的虛擬數字人、AI 智能助理、人形機器人等,這些充滿想象力的發展方向令人期待。它們將實現多模態、主動交互式的人工智能體,為人類生活帶來翻天覆地的變化。

最后,在這個充滿無限可能的時代,我們作為 AI 產品經理,雖無法進行金錢上的大規模投資,但我們可以將自身的資源投入到我們所向往的未來。正如一位我所喜愛投資人所言:“投資是什么?是將我的資源投給我想要的未來?!?盡管這其中存在風險,但如果有幸參與到那個令人激動的未來之中,將是無比榮幸之事。

相關參考

書籍《讓大象飛》

大模型:豆包/智譜清言

文章:https://mp.weixin.qq.com/s/tuOrnzmW3gzBbnlV31hmJg

本文由 @4T 原創發布于人人都是產品經理。未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 大模型框架有創新,細節部分需要改進創新,抓取重點。

    來自廣東 回復