一文讀懂AI搜索
大模型興起之后,有人說(shuō)所有的行業(yè)都值得用AI重做一遍。那如果是AI和搜索結(jié)合,是不是能產(chǎn)生更好的效果?這篇文章,作者分享了AI搜索的一些底層知識(shí),能夠幫你,更好的用AI搜索。
早上朋友發(fā)信息給我:
智遠(yuǎn),你可以呀,現(xiàn)在厲害了,不僅寫(xiě)作,還成了當(dāng)代藝術(shù)家,還去悉尼、新加坡辦畫(huà)展,業(yè)務(wù)夠多,忙得過(guò)來(lái)嗎?
我頓時(shí)不知道怎么回應(yīng),驚訝又好奇的回了句:納尼?
緊接著,朋友發(fā)來(lái)一張截圖說(shuō):你看。我一看,天吶,AI搜索把我的資料和另一位同名人的資料,混在一起了,太壞了。認(rèn)識(shí)我的還行,不認(rèn)識(shí)的明顯會(huì)被誤導(dǎo)。
這兩年,不少大模型公司布局AI搜索,很多人也感受到技術(shù)帶來(lái)的快捷,不過(guò),使用過(guò)程中,根本沒(méi)意識(shí)到信息是否準(zhǔn)確。
所以,怕你被AI誤導(dǎo)。
我抽出時(shí)間,做了一個(gè)簡(jiǎn)單科普,比如:AI搜索的決策模型什么樣?為啥機(jī)器味嚴(yán)重?AI搜索和內(nèi)容平臺(tái)的關(guān)系是什么?未來(lái)搜索會(huì)發(fā)生什么革命性變化等等。
畢竟了解底層知識(shí),能夠幫你,更好的用AI搜索。
01
有個(gè)詞叫缸中之腦(Brain in a Vat)。什么意思呢?
想象一個(gè)血腥的畫(huà)面:
你(或者別人)被一位瘋狂的科學(xué)家,進(jìn)行一次可怕的實(shí)驗(yàn)。他把大腦從身體上取下來(lái),放進(jìn)一個(gè)裝有維持大腦存活的營(yíng)養(yǎng)液的玻璃鋼中。
然后,大腦神經(jīng)末梢,連接到一臺(tái)超級(jí)計(jì)算機(jī),計(jì)算機(jī)按照設(shè)定程序,向你的大腦發(fā)送各種信息,讓你以為以前很正常。
那么,對(duì)取出來(lái)的大腦來(lái)說(shuō),世界是不是依然和原來(lái)的一樣?你看到的人、物體、天空,感受,還有記憶,是不是都還在?
這個(gè)實(shí)驗(yàn),常用來(lái)說(shuō)明懷疑論、唯我論和主觀唯心主義的觀點(diǎn),簡(jiǎn)單講:即我所體驗(yàn)的、看到的、到底是真的假的呢?
怕你共情不多,我再舉個(gè)例子:
好不容易休息半天,躺在沙發(fā)上,看著外面陰雨天,突然想到昨天剛上映的恐怖片,還沒(méi)看。于是,打開(kāi)影片,剛看一半,心跳加速,你決定不看了。
為什么?因?yàn)樘植懒???植喇?huà)面的信息,一次次傳遞到“缸中之腦”,讓你覺(jué)得太真實(shí),似乎恐怖畫(huà)面馬上要出現(xiàn)在自己身上。
但你知道嗎?這些都是大腦模仿出來(lái)的,看似真實(shí),未必真實(shí),我們的感知,不僅由大腦產(chǎn)生,身體,也會(huì)影響它。
比如:
521到了,即便沒(méi)有見(jiàn)面,你總送心愛(ài)的人一些溫暖的東西,一杯奶茶、一束鮮花,她收到禮物那一刻,在遠(yuǎn)方也能感受到你對(duì)她的好看。
這就是具身認(rèn)知,是思考,感覺(jué)、行為三者共振的結(jié)果,認(rèn)識(shí)到它,你能感受到,外面我們接收到的任何信息,故事是一個(gè)個(gè)畫(huà)面,所描繪的場(chǎng)景只要大腦熟悉,它都會(huì)共鳴。
而AI搜索,是什么呢?本質(zhì)像一個(gè)“缸中之腦”。
運(yùn)行在一個(gè)強(qiáng)大的模型上,模型像它的基礎(chǔ),幫它站穩(wěn)腳跟,外面信息是它的食物,通過(guò)你的搜索,不斷訓(xùn)練自己推理能力。
不論什么AI搜索軟件,當(dāng)你問(wèn)題時(shí),它都會(huì)遵循一個(gè)六步走的公式:
- 理解問(wèn)題
- 檢索信息
- 整合答案
- 生成回答
- 結(jié)果驗(yàn)證
幻想一下,現(xiàn)在來(lái)到未來(lái)時(shí)代,站在圖書(shū)館里,面前有一個(gè)人工智能,現(xiàn)在要找一本《窮查理寶典》,你會(huì)怎么做?
你可以手動(dòng)輸入,或者對(duì)著它說(shuō):“幫我找一本叫《窮查理寶典》?!贝藭r(shí),AI會(huì)利用語(yǔ)言技術(shù),快速分析你的意圖,提煉出最重要的部分,比如:書(shū)名、作者、人名。
然后,它會(huì)把你的問(wèn)題和圖書(shū)館里的文檔、圖片快速匹配,從中找出重要的段落和句子。接著,它會(huì)做降噪處理,去掉干擾的內(nèi)容,比如廣告、重復(fù)的段落,確保剩下的都是有用的信息。
最后,AI會(huì)把所有找到的信息整合起來(lái),生成一個(gè)答案,這就是AI搜索的過(guò)程。不難理解吧。
我突然想到一個(gè)畫(huà)面:
小時(shí)候,老師經(jīng)常說(shuō):“哎,你們是我?guī)н^(guò)最差的一屆,要是無(wú)法理解,就把這段內(nèi)容死機(jī)硬背下來(lái)?!?,可你有沒(méi)有想過(guò),考試對(duì)死記硬背來(lái)說(shuō),意圖是什么?
從人工智能角度看,答案只有一個(gè)詞:檢索。
也就是說(shuō):你背誦的所有資料,最后一刻,學(xué)校用一張?jiān)嚲韥?lái)檢索大腦有沒(méi)有記住,當(dāng)成績(jī)達(dá)標(biāo)時(shí),證明你通過(guò)了。
02
明白AI搜索的六步公式,能得到什么啟發(fā)呢?
有兩點(diǎn):
- 知道AI的回答為什么很干巴
- 知道它為何缺乏情感和個(gè)性。
AI搜索生成邏輯有一些限制,為避免產(chǎn)生錯(cuò)誤信息和不準(zhǔn)確的信息,AI會(huì)傾向于保守地給你高頻、標(biāo)準(zhǔn)化的表達(dá)。這種傾向自然會(huì)使回答顯得更加刻板。
比如:
你問(wèn)AI如何做好品牌營(yíng)銷(xiāo)?它一定會(huì)告訴你,首先要了解目標(biāo)市場(chǎng),然后創(chuàng)建一個(gè)獨(dú)特的品牌定位,接著進(jìn)行市場(chǎng)推廣,最后通過(guò)反饋不斷優(yōu)化品牌策略。
另外,作為“缸中之腦”,AI只有一個(gè)搜索框,無(wú)法感受你的語(yǔ)氣,看不到其他信息,所以也無(wú)法理解你的情感。
這樣一來(lái),AI生成的答案就缺乏人類(lèi)的情感色彩和個(gè)性,看起來(lái)很機(jī)械,或者像是官方的回答。
值得一提的是:人們常說(shuō),一個(gè)人學(xué)習(xí)什么知識(shí),他的見(jiàn)識(shí)就有多高。AI也是一樣的。你給它喂草料,它自然吐不出鉆石來(lái)。
所以,大公司為了防止AI搜索出來(lái)的內(nèi)容很水,就會(huì)限制訓(xùn)練內(nèi)容,會(huì)給AI喂新聞報(bào)道、學(xué)術(shù)論文和正式文本。這些文本風(fēng)格比較客觀,所以,AI學(xué)完后,回答也會(huì)是類(lèi)似的風(fēng)格。
現(xiàn)在AI搜索雖然看似有推理能力,但我測(cè)試了很多,發(fā)現(xiàn)整體推理還是比較弱。
一個(gè)主要原因,人類(lèi)說(shuō)話時(shí),本身推理性就不強(qiáng)。所以,AI學(xué)習(xí)的內(nèi)容也會(huì)相對(duì)較弱。在文字相關(guān)的搜索上,這種情況很常見(jiàn),理科的內(nèi)容相對(duì)更嚴(yán)謹(jǐn)一些。
顯然,“缸中之腦”就是“缸中之腦”??此坡斆?,但離不開(kāi)三點(diǎn):
- 大模型作為基礎(chǔ)
- 固定的模型
- 知識(shí)庫(kù)。
因此,重要的結(jié)論是:用AI搜索時(shí),你不給它一個(gè)很健全的 prompt,它的解析能力會(huì)變得很弱,得到的答案自然很難讓人滿意。
03
你有沒(méi)有想過(guò),AI搜索平臺(tái)和內(nèi)容生態(tài)到底什么關(guān)系?
我覺(jué)得,從過(guò)去的傳統(tǒng)搜索,到現(xiàn)在AI搜索,用一句話來(lái)形容轉(zhuǎn)變的過(guò)程便是:從獨(dú)立到融合,再到獨(dú)立。
為什么呢?
沒(méi)有大模型之前,谷歌在1998年開(kāi)始做大規(guī)模搜索,后來(lái)進(jìn)軍中國(guó),由于數(shù)據(jù)方面的問(wèn)題,谷歌被限制,隨后,百度在2000年快速崛起,靠爬蟲(chóng)抓取大量網(wǎng)頁(yè),然后分發(fā)和售賣(mài)廣告起家。
這兩家公司商業(yè)模式基本相似。
谷歌做了一個(gè)叫Knowledge Graph的知識(shí)庫(kù),還有Google Answers,百度則推出了“百度知道”和“百度百科”。
后來(lái),國(guó)內(nèi)360、搜狗也跟著做類(lèi)似的產(chǎn)品。網(wǎng)頁(yè)時(shí)代落幕,張一鳴用一個(gè)算法推薦,讓今日頭條拔地而起。頭條采用推薦機(jī)制的同時(shí),也嘗試建立內(nèi)容生態(tài)。
比如:
孵化垂類(lèi)創(chuàng)作者,推出各種與內(nèi)容相關(guān)的產(chǎn)品,但直到現(xiàn)在,我都覺(jué)得它還沒(méi)成功,今日頭條增長(zhǎng)停滯后,頭條搜索也沒(méi)法跟著增長(zhǎng)。
后來(lái)短視頻涌現(xiàn),抖音起來(lái),它建立一個(gè)良好的內(nèi)容生態(tài)和增長(zhǎng)模式,所以,抖音搜索成功了。
不管怎么樣,它們的核心目的只有一個(gè),把內(nèi)容控制在自己手里,通過(guò)掌握內(nèi)容,建立壁壘,因?yàn)閮?nèi)容生態(tài)對(duì)搜索平臺(tái)有很大的依賴(lài)性。
內(nèi)容提供者,要依靠搜索引擎,來(lái)讓內(nèi)容被更多人看到,而搜索引擎,則要高質(zhì)量的內(nèi)容來(lái)吸引用戶,并提供有用的搜索結(jié)果。
有了大模型之后呢?
微軟推出新版必應(yīng),緊接著谷歌、百度、360和昆侖萬(wàn)維等企業(yè)也開(kāi)始布局AI搜索。
李彥宏一直強(qiáng)調(diào),把生成式AI技術(shù)和搜索深度整合在一起。周鴻祎也說(shuō),做搜索引擎的企業(yè),最有機(jī)會(huì)研究像ChatGPT這樣的產(chǎn)品,還有昆侖萬(wàn)維、秘塔AI也在加緊跟上。
不管怎么說(shuō),它們有相似之處:整合全網(wǎng)信息,讓用戶用自然語(yǔ)言表達(dá)需求,并提供經(jīng)過(guò)組織和提煉的答案,這樣可以減少冗余信息的時(shí)間消耗,確保答案的可追溯性、可信賴(lài)性。
不過(guò),盡管這些搜索引擎,憑借原有的知名度、用戶基礎(chǔ)在市場(chǎng)上占據(jù)主導(dǎo)地位,由于移動(dòng)互聯(lián)網(wǎng)時(shí)代APP的“信息孤島”現(xiàn)象,它們并沒(méi)有完全掌控所有信息,反而,垂直搜索引擎正在逐漸崛起。
比如:
小紅書(shū)推出自己的搜索,今日頭條推出豆包,淘寶推出原生AI應(yīng)用——淘寶問(wèn)問(wèn),它嵌入淘寶搜索框,服務(wù)于月活躍用戶近9億、每日產(chǎn)生數(shù)百億次搜索的龐大流量。
現(xiàn)在,抖音搜索量在移動(dòng)端已經(jīng)超過(guò)百度,小紅書(shū)通過(guò)用戶的真實(shí)分享和有用的筆記,建立了強(qiáng)大的社區(qū)氛圍,這都是各自的優(yōu)勢(shì)。
因此,我看到兩種趨勢(shì)正在出現(xiàn):一是通用搜索的AI升級(jí),二是垂類(lèi)搜索的崛起。
垂類(lèi)搜索數(shù)據(jù),主要來(lái)自自己的平臺(tái),類(lèi)似于站內(nèi)搜索,信息更服務(wù)于細(xì)分場(chǎng)景。當(dāng)信息量足夠多時(shí),就會(huì)自然涌現(xiàn)。
長(zhǎng)遠(yuǎn)來(lái)看,擁有優(yōu)質(zhì)內(nèi)容的社區(qū),做的搜索會(huì)更有優(yōu)勢(shì),因?yàn)楹脙?nèi)容平臺(tái)能夠吸引和留住用戶,進(jìn)而提升搜索功能的價(jià)值和使用頻率。
明白這些也就理解了,我為什么說(shuō),搜索會(huì)經(jīng)歷從獨(dú)立到融合,再到獨(dú)立的過(guò)程。畢竟,獨(dú)立,是全新的獨(dú)立,是細(xì)分的獨(dú)立。
實(shí)在不信的話了,你想想360AI、秘塔AI,天工AI到底有什么區(qū)別?把它們和淘寶問(wèn)問(wèn)、抖音搜索一比更明確呢?因此,未來(lái)優(yōu)質(zhì)內(nèi)容社區(qū)的搜索功能將會(huì)勝出。
04
到這里,我們可以思考下:AI搜索的本質(zhì)是什么?
我認(rèn)為,AI搜索真正的關(guān)鍵在于AI技術(shù)本身,而不是傳統(tǒng)的搜索方式。這就像“AI+”和“+AI”的區(qū)別。
AI+,更像把AI技術(shù)加到已有的系統(tǒng)或產(chǎn)品上。比如,在傳統(tǒng)搜索引擎上加入AI功能,這種方式主要在現(xiàn)有技術(shù)基礎(chǔ)上,增強(qiáng)功能。
+AI,不一樣。
要求從一開(kāi)始就以AI為核心,建立一個(gè)系統(tǒng)或產(chǎn)品。比如,設(shè)計(jì)一個(gè)完全依賴(lài)AI進(jìn)行的搜索引擎,它所有功能都圍繞AI技術(shù)展開(kāi),更像是從頭開(kāi)始,完全依賴(lài)AI技術(shù)運(yùn)作。
很顯然,“AI+”是改進(jìn)現(xiàn)有系統(tǒng),而“+AI”是從零開(kāi)始,完全依靠AI技術(shù)。AI搜索真正力量在于后者,也就是“+AI”。
對(duì)于一般簡(jiǎn)單問(wèn)答,AI搜索只彌補(bǔ)傳統(tǒng)搜索的不足。但要真正創(chuàng)新和突破,要尋找新的應(yīng)用場(chǎng)景和特定領(lǐng)域,比如學(xué)術(shù)、醫(yī)療、法律等。這些領(lǐng)域中,AI驅(qū)動(dòng)的搜索才能真正發(fā)揮戰(zhàn)略意義。
“AI原生”(AI Native)很重要,因?yàn)榻?jīng)過(guò)多年的發(fā)展,傳統(tǒng)方法已經(jīng)挖掘了所有可能性,AI原生的定義是,只有在引入AI能力的情況下,產(chǎn)品才能實(shí)現(xiàn)。
這種情況下,AI是最大的變量,但AI比例并不重要。
關(guān)鍵在于產(chǎn)品需要找到交叉點(diǎn):哪些場(chǎng)景是只有AI才能實(shí)現(xiàn)?同時(shí)又滿足大規(guī)模用戶需求。這種探索越多越快,競(jìng)爭(zhēng)優(yōu)勢(shì)就越大。這也是對(duì)各家產(chǎn)品經(jīng)理的巨大考驗(yàn)。
那么,問(wèn)題來(lái)了:
有人會(huì)覺(jué)得,傳統(tǒng)搜索市場(chǎng)還有價(jià)值嗎?肯定的。
傳統(tǒng)搜索的強(qiáng)項(xiàng)在于尋址和尋找資訊。從商業(yè)角度看,PC端搜索市場(chǎng)增量有限,移動(dòng)端又被抖音、小紅書(shū)等平臺(tái)分流,不過(guò),百度財(cái)報(bào)中,搜索引擎依然是基本盤(pán)的重要組成部分。
還有人認(rèn)為,谷歌和百度壟斷這么多年,其他玩家還有機(jī)會(huì)嗎?來(lái)看一組美國(guó)statcounter機(jī)構(gòu)的數(shù)據(jù):
截至2024年5月6日,美國(guó)搜索市場(chǎng)中,谷歌份額下降到了77.52%,其他市場(chǎng)被Bing和Yahoo蠶食,但谷歌基本盤(pán)還算穩(wěn)。國(guó)內(nèi)截至4月,電腦端必應(yīng)的份額是37.24%,百度是22.53%,但百度的主導(dǎo)地位已經(jīng)不在了。
雖然數(shù)據(jù)會(huì)存在偏差,但能看出搜索市場(chǎng)的變化和機(jī)會(huì),AI搜索更應(yīng)該理解用戶意圖,完成復(fù)雜的任務(wù)。
比如:
用戶搜索不僅僅是尋找信息,還包括找地址,或查找短內(nèi)容的源頭;再比如,通過(guò)AI找到過(guò)去5年城市人口的發(fā)展趨勢(shì),甚至,搜索新能源汽車(chē)的滲透率趨勢(shì)和原因。
還有找電影、追溯圖片等等……,所以,需求背后,是AI搜索目前還沒(méi)有攻克的場(chǎng)景。
總結(jié)而言
AI+,還是+AI,要看企業(yè)選擇。
不論哪條路,我都認(rèn)為,垂直領(lǐng)域的數(shù)據(jù),將成為重要開(kāi)采對(duì)象,不然怎么向數(shù)據(jù)要增量?那么問(wèn)題來(lái)了:什么樣的垂直數(shù)據(jù)還未被開(kāi)采呢?嗯,值得思考的問(wèn)題。
專(zhuān)欄作家
王智遠(yuǎn),公眾號(hào):王智遠(yuǎn),暢銷(xiāo)書(shū)《復(fù)利思維》作者,人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家?;ヂ?lián)網(wǎng)學(xué)者,左手科技互聯(lián)網(wǎng),右手個(gè)體認(rèn)知成長(zhǎng)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
AI+ 和 +AI 是不是搞反了