大語(yǔ)言模型時(shí)代來(lái)臨,交互式對(duì)話搜索如何落地

0 評(píng)論 6387 瀏覽 10 收藏 10 分鐘

傳統(tǒng)的搜索模式有諸多受限,隨著互聯(lián)網(wǎng)的發(fā)展進(jìn)步,帶來(lái)了AI對(duì)話式搜索,這一搜索模式為用戶帶來(lái)了更好的搜索體驗(yàn),其發(fā)展機(jī)遇是可見的,但是在未來(lái)AI對(duì)話將面臨什么挑戰(zhàn)呢?讓我們看看作者的觀點(diǎn)。

2022年11月30日:OpenAI發(fā)布ChatGPT,短短兩個(gè)月時(shí)間月活過(guò)億 ,預(yù)示著大模型時(shí)代的來(lái)臨!

2023年2月8日:微軟宣布上線 New Bing 和 Edge瀏覽器,整合 OpenAI 的 GPT 技術(shù),可以與用戶進(jìn)行對(duì)話式搜索、交互聊天。

2023年4月6日:《華爾街日?qǐng)?bào)》報(bào)道稱,谷歌也計(jì)劃在其搜索引擎中,添加對(duì)話式AI功能。

業(yè)界大佬紛紛入局搶占先機(jī),國(guó)內(nèi)大廠也紛紛入場(chǎng)開啟“軍備競(jìng)賽”。

今天小編就帶大家粗淺了解下什么是大模型,大模型未來(lái)對(duì)企業(yè)、人們的日常生活到底會(huì)有哪些顛覆和影響。各行業(yè)又能將LLM大語(yǔ)言模型應(yīng)用到哪些業(yè)務(wù)中去。

一、什么是LLM大語(yǔ)言大模型?

LLM=Large Language Model 大語(yǔ)言模型,是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理模型。它能夠?qū)W習(xí)到自然語(yǔ)言的語(yǔ)法和語(yǔ)義,從而可以生成人類可讀的文本。

所謂“語(yǔ)言模型”,就是只用來(lái)處理語(yǔ)言文字(或者符號(hào)體系)的AI 模型,發(fā)現(xiàn)其中的規(guī)律,可以根據(jù)提示(prompt),自動(dòng)生成符合這些規(guī)律的內(nèi)容。

簡(jiǎn)言之:能夠理解輸入的文字、語(yǔ)言,并給出相應(yīng)回答。

典型代表有ChatGPT(OpenAI)、通義千問(阿里)、文心一言(百度)、ChatGLM(清華)、Chatlaw(北大)。

二、大模型訓(xùn)練門檻有多高?

  • 需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練
  • 非常大的參數(shù)數(shù)量的人工神經(jīng)網(wǎng)絡(luò)(數(shù)十億)
  • 需要投入大量的機(jī)器資源進(jìn)行優(yōu)化和調(diào)整
  • 技術(shù)團(tuán)隊(duì)的工程實(shí)現(xiàn)能力要求非常高

總結(jié)下來(lái)就是財(cái)力及投入意愿、工程能力、技術(shù)熱情,都有極高的要求,目前市面上能支撐上述要求的機(jī)構(gòu)少之又少。

并且這些模型訓(xùn)練數(shù)據(jù)來(lái)自世界知識(shí),無(wú)論是多強(qiáng)大的LLM,能壓縮的知識(shí)量仍然是有限的。當(dāng)遇到企業(yè)專屬知識(shí)時(shí),這些模型也很難給出準(zhǔn)確答案。

舉一個(gè)例子,下圖中的問題是關(guān)于阿里巴巴內(nèi)部的技術(shù)產(chǎn)品,屬于企業(yè)專屬知識(shí),就算是強(qiáng)大的ChatGPT模型給出的答案也是完全錯(cuò)誤不相關(guān)的。

針對(duì)這個(gè)問題,OpenAI提出了chatgpt-retrieval-plugin、WebGPT,開源社區(qū)提出了DocsGPT、ChatPDF、基于langchain的檢索增強(qiáng)chatbot等等一系列解決方案,足以證明業(yè)界對(duì)如何在個(gè)人/企業(yè)專屬數(shù)據(jù)上結(jié)合LLM需求強(qiáng)烈。

三、傳統(tǒng)搜索VS對(duì)話式搜索

下面舉幾個(gè)例子給大家直觀感受下對(duì)話式搜索的的優(yōu)勢(shì):

1. 傳統(tǒng)的客服問答

下面畫面常常發(fā)生在我們線上購(gòu)物和機(jī)器人客服的對(duì)話,答案分散,不能快速抓到用戶的搜索意圖,用戶體驗(yàn)較差。

同理,這也是很多人打銀行客服電話還是喜歡轉(zhuǎn)人工處理的原因。

2. 傳統(tǒng)搜索引擎搜索

傳統(tǒng)搜索引擎的沒有目共睹。即時(shí)通信已經(jīng)取代搜索引擎成為移動(dòng)互聯(lián)網(wǎng)時(shí)代新的核心流量入口。即使是全球市場(chǎng)占有率最高的谷歌搜索,其用戶量也面臨著被社交網(wǎng)站、短視頻APP瓜分的危機(jī)。

傳統(tǒng)搜索引擎的痛點(diǎn)首先是信息過(guò)剩,不能直接召回到用戶搜索意圖,需要在信息網(wǎng)里自行查找篩選,耗時(shí)耗力也不一定找到問題的解。其次信息壁壘。

從PC互聯(lián)網(wǎng)時(shí)代走入移動(dòng)互聯(lián)網(wǎng)時(shí)代,信息散落到了各個(gè)App當(dāng)中,用戶隨之流向其內(nèi)部的搜索。

3. AI對(duì)話式搜索

更快、更準(zhǔn)、更豐富,給予用戶有建設(shè)性、拓展性的答案。將用戶獲取信息和服務(wù)的方式從輸入冰冷的關(guān)鍵詞轉(zhuǎn)向人機(jī)“多輪對(duì)話”。

四、對(duì)話式搜索在業(yè)務(wù)中的應(yīng)用

  • 電商:用戶答疑、直播選品、售前咨詢、售后服務(wù)等
  • 內(nèi)容:IT、文娛、專業(yè)領(lǐng)域等個(gè)性化場(chǎng)景
  • 企業(yè)知識(shí)庫(kù):企業(yè)內(nèi)部資料、產(chǎn)品文檔、技術(shù)資料等
  • 教育:知識(shí)總結(jié)、搜題生成答案

AI對(duì)話式搜索在這些場(chǎng)景的應(yīng)用可以有效提升用戶信息獲取效率、產(chǎn)品體驗(yàn)、業(yè)務(wù)轉(zhuǎn)化、用戶粘性、用戶活躍。有效降低人工成本,運(yùn)營(yíng)成本。

目前這些典型場(chǎng)景卻無(wú)法直接使用ChatGPT等大模型,實(shí)際用于到自身業(yè)務(wù)中去。

首先是數(shù)據(jù)問題,大模型來(lái)自公網(wǎng)數(shù)據(jù),無(wú)法滿足企業(yè)業(yè)務(wù)搜索需要。其次存在安全風(fēng)險(xiǎn),生成內(nèi)容不可控,風(fēng)險(xiǎn)較高。

企業(yè)需要基于自身數(shù)據(jù)構(gòu)建垂直領(lǐng)域問答式搜索。

五、是機(jī)遇也是挑戰(zhàn)

目前雖然大模型熱度高,很多企業(yè)也關(guān)注到了對(duì)話式搜索給業(yè)務(wù)帶來(lái)的機(jī)遇,但實(shí)際能應(yīng)用起來(lái)的還很少。

一是落地難度大,技術(shù)能力要求高;二是缺乏場(chǎng)景,除頭部客戶以外,業(yè)務(wù)需求還未達(dá)到這個(gè)層次,處于觀望了解階段。

那如果是創(chuàng)業(yè)公司在選擇大模型接入時(shí),是選開源還是閉源呢?

各有優(yōu)勢(shì)。開源你只需要買TOKEN就好了,再加上 Prompt engineering和向量數(shù)據(jù)庫(kù)等。閉源的優(yōu)勢(shì)在于,保護(hù)數(shù)據(jù)隱私,并且可以不斷用數(shù)據(jù)填充完善自己的模型。

給大家介紹下市面接入較多的兩種方案

1)企業(yè)自建方案:基于開源大模型,企業(yè)自行微調(diào)自建。

  • 需要使用A100卡或單機(jī)多卡支持
  • 專業(yè)的算法研發(fā)人員,數(shù)據(jù)處理→開發(fā)調(diào)試→訓(xùn)練模型→模型部署
  • 對(duì)企業(yè)數(shù)據(jù)質(zhì)量有要求,否則影響訓(xùn)練效果
  • 涉及圖文、音視頻數(shù)據(jù),需要轉(zhuǎn)為向量化數(shù)據(jù)

2)產(chǎn)品化方案:阿里云OpenSearch LLM問答版端到端方案,可以構(gòu)建企業(yè)專屬模型。

  • 基于阿里模型+企業(yè)自有數(shù)據(jù)進(jìn)行模型微調(diào)拓展,自動(dòng)生成Query對(duì)應(yīng)的問答搜索結(jié)果,接入門檻較低
  • 問答結(jié)果基于業(yè)務(wù)數(shù)據(jù)搜索生成,保證問答結(jié)果穩(wěn)定性與數(shù)據(jù)安全性
  • 支持圖文多模態(tài)信息搜索,支持問答結(jié)果的人工干預(yù)

六、AI對(duì)話式搜索行業(yè)應(yīng)用展望

1)助力企業(yè)創(chuàng)新能力

LLM可根據(jù)大量數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,為企業(yè)提供有針對(duì)性的戰(zhàn)略建議,提供新的創(chuàng)新途徑;開展垂直領(lǐng)域或行業(yè)子模型的研究,做應(yīng)用場(chǎng)景和用戶數(shù)據(jù)反哺、調(diào)優(yōu),實(shí)現(xiàn)企業(yè)定制化搜索。

2)優(yōu)化客戶支持和服務(wù)

智能客服可根據(jù)客戶輸入的問題,提供即時(shí)、準(zhǔn)確的解答,減輕傳統(tǒng)客服壓力;對(duì)于復(fù)雜問題,LLM可為技術(shù)支持團(tuán)隊(duì)提供問題解決方案,提高問題解決效率。

3)復(fù)雜信息提煉,提升信息獲取效率

利用LLM數(shù)據(jù)整合與分析能力,將復(fù)雜信息進(jìn)行要點(diǎn)提煉,觀點(diǎn)的歸納整理,節(jié)省用戶信息獲取效率,從而有更多的時(shí)間進(jìn)行深度和系統(tǒng)的思考。

4)低代碼應(yīng)用

通過(guò)API融入到產(chǎn)品的標(biāo)準(zhǔn)模塊里,更低的開發(fā)成本、更少的時(shí)間投入,來(lái)滿足日益增長(zhǎng)的客戶個(gè)性化需求。

本文由 @KKai 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!