十問AI搜索
在人工智能的浪潮中,AI搜索技術正迅速發展,成為信息檢索領域的新熱點。本文探討了AI搜索的多個關鍵問題,包括數據壁壘、索引庫的重要性、垂直搜索的機遇與挑戰,以及用戶習慣對AI搜索的影響等。文章還對模型微調的必要性、AI搜索與Agent結合的趨勢、AI搜索生成內容的潛力,以及AI SEO的未來進行了深入分析。
一、AI搜索最大的壁壘在數據?
閉門會有一個小伙伴在某大廠做搜索,給出的洞察是:
沒有數據的話都是白扯!
后面在和胡寧交流的時候,她也明確指出了這一點。
否則外殼做得再好、交互做的再好,用戶一問,出來的內容渣渣!
這也是內容型產品做自己AI搜索的巨大優勢:微信讀書的AI問書、知乎&抖音&小紅書等產品的AI搜索、騰訊元寶整合了公眾號的數據。
我最近使用了小紅書的達芬奇AI搜索,效果出奇的驚人:
為什么呢?小紅書在旅游、美食、美妝、寵物、健身等等品類上,有全網最優質的內容,只要在它優質內容的垂域里搜索,自然也最容易得到優質的答案!
當然這也帶來了國內過去這么多年百度逐漸沒落的老問題:數據被分散在各個App內。
二、索引庫必備么?
結論:做通用AI搜索不必,但垂直搜索必備!
很多AI搜索依賴Google或者Bing的API來獲得檢索結果,為何呢?
這是因為Google和Bing自建了非常強大的搜索引擎,其中包含了強大的索引庫,可以較好的保證搜索結果的質量,以及提供了不錯的排序。
此時依靠這些傳統搜索引擎,已經能解決95%的問題了!
(以上是公眾號 艾逗筆 在《我做了一個AI搜索引擎》一文內的流程圖,在信息源檢索下面我加了兩個小方框)
從上圖來看,自檢索引庫的關鍵在于要能提供比Google和Bing返回的結果更優的內容!想要做到,那就需要付出極大的成本和時間。
所以上面的結論就是如果你要做通用AI搜索,就別考慮自建索引庫了,不管是資源的消耗還是時間的投入,都極其困難。靠第三方提供的API快速的把商業模式跑通,可能才是王道。
當然這是大多數人不看好創業公司做通用AI搜索的一個主要原因。
那垂直搜索呢?這里進行到第二點:優質索引庫!
索引庫分很多種,剛才說的是一個最大的索引庫,要在里面去撈到合適的內容,其實效率還是比較低的??梢栽谶@個大庫上面再整一個優質索引庫,里面存著更優質、更權威的內容,這樣的優質索引庫對于垂直AI搜索就會很有幫助。
因為前面第一章節也說了,AI搜索最大的關鍵點是數據!你知道這個垂直品類的優質內容和信息或者數據在哪里的話,是不是就能讓AI搜索的結果質量更高了?
這是為何Perplexity在一開始從Academic啟動,也是錨定垂類也方便去提前構建垂直索引庫,保證初始的AI搜索效果非常優質。
打個比喻來幫助大家理解索引庫是否必備:
我們設想一個各種菜系都提供的餐館,思考一下,你增加了一個菜品的供貨渠道,能讓餐館有更多客人嗎?這個就離得有點遠了。
但如果你只做大阪和牛,找到了一個精品貨源,對于用戶的口碑可能就會有很大的幫助。
三、垂類更方便于AI搜索初創公司切入?
結合前兩點,我們可以發現,不管是數據,還是索引庫,給到創業者的選擇都是先從垂直切入會是更好的一種方式。
toC層面有兩點:有利于用戶口碑和心智的建立;垂類更好整合進用戶的工作流。
秘塔之所以被口口相傳,也是科技工作者,或者學生,查詢資料時,可以快速獲得海量的結構化信息,相信秘塔本身索引庫也會在這些用戶群體關注的內容品類上做更多覆蓋,提高AI生成的內容質量。
前陣子秘塔又上線了播客搜索,這也是秘塔的用戶群體喜聞樂見的:
Repotify則更加具體,聚焦在財報研報等投融資用戶的需求方向上:
有時我自己查詢一些企業的財報、電話會信息,也會打開使用。
再比如Devv,可以指定信息源,連接到指定的Github倉庫來進行搜索:
這種深入就是心智的建立:知道這款AI搜索產品能解決自己的問題!
對應的,垂直AI搜索也知道很多信息源在哪里,包括還有一些獨到的用戶需求能夠更好地滿足。
四、用戶習慣的慣性對于AI搜索的意義?
結論:非常重要!
上圖是夸克瀏覽器最近全面更新的AI搜索。
如果你是夸克的用戶,會不會天然的就體驗到了AI搜索呢?
我們設想一下,即使是過去百度最鼎盛的時期,依然有大量的用戶不會去用它,為什么?還有其他的產品會占據用戶的習慣呀,比如說搜狗和360的三級火箭里面,就會用瀏覽器來滿足用戶的搜索需求,你百度做的比Google更好也不可能搶走那批用戶。
通用AI搜索很難做的一點是,用戶習慣很難遷移,他用慣了夸克瀏覽器,就會繼續用夸克的AI搜索,并且各家大廠包括Google都已經很堅決的推進AI搜索的情況下,你很難做的遠超出Google去讓用戶轉過來用你的,或者說,在Google全量上AI搜索之前,只會留出很短的時間窗口。
五、模型微調是必備的么?
結論:當前階段非常有價值!
搜索是一個用戶需求很泛化的場景,用戶會問各種各樣的問題,比如說:
黃河有多長?這種問題簡短回答就行了
怎么哄小孩睡覺?這種問題可能需要給你個手把手的教程
所以搜索依賴的大模型能力需要在不同分支下,具備不同的回答能力。
360AI搜索已經把query的意圖識別分類做到了4000多種,每一種需求配對應的Prompt。工作做得已經相當精細了,但梁志輝告訴我,這仍然只是很粗顆粒度的匹配。
你會好奇的是,為何360要做這么多Prompt工程,似乎也沒說到微調的事情呀。
是的,這就是不同的解決方案。
Prompt也好,微調也罷,是對模型做不同力度的勸導!
目前階段大模型對于指令的跟隨效果不是特別優秀,所以當前階段下,微調非常有價值。
六、AI搜索+Agent會逐漸盛行?
結論:大模型提供信息,Agent提供服務
未來大概率會演變成AI搜索是平臺,上面的Agent是一個個的服務。
目前的Agent更多是用Prompt調教的,對于垂直的能力深度還是非常有限的,如果未來能做到AI搜索和AI Agent之間的緊密配合,就很厲害了。
換個思路,思考下微信平臺里的小程序。微信提供基礎的服務/信息,小程序提供各種垂直的服務。
Agent進階的一種形態是:Multi-Agent
Miku AI搜索就很典型是一個基于Agent框架開發的AI搜索,吳恩達在AI Ascent 2024大會上指出:“基于GPT-3.5構建的AI智能體工作流在實際應用中表現比GPT-4更好”
除此之外,ThinkAny的創始人idoubi也考慮后續增加工作流Workflow,就是Multi-Agents,你可以認為前端是AI搜索,去檢索信息,然后進入到用戶自定義的Multi-Agnets里,最后經過智能體們的處理,獲得用戶自己想要的信息:
或者說,AI搜索+Coze。
七、AI搜索生成內容,AI小紅書會來么?
結論:是一個明確的趨勢
我們在《拳打Google,腳踢Perplexity,Genspark要做美女給你打好飯還喂進嘴!的新物種》一文里,也提到了Sparkpage這套邏輯:
AI可以先生成一次結果,用戶再在此基礎上進行修改,相當于AI+人共同生成一個網頁。
包括Perplexity也做了一樣的Page能力。
從某種角度來說,這種邏輯是直接和人類創作者PK,是AI搜索+人去PK人類創作者。
參考即刻@余一 的普通人的AI使用說明書,相當于中間那一層。
其實AI搜索走到這一步非常自然,就像我們理解各大廠和各大模型廠的效率工具都會加入搜索能力一樣,只要理解搜索是為了后續效率工具獲取信息,就可以很絲滑的get到這一點。
也就容易理解小紅書很擔心類似的產品:未來如果是AI+人也能生成高質量的內容,并且形成自己的社區生態,那必然和小紅書是帶來競爭關系。
八、AI SEO會逐漸形成共識?
上面這一點,其實衍生出一個結論:AI SEO馬上就會成為共識
新的產品如何獲得流量,已經開始逐步變成大家關注的話題了,那AI搜索也同樣會面臨這個困境,我們在Genspark一文里,提到了Genspark通過Agent生成Sparkpage的內容質量“很高”,這樣的內容可以被Google收錄,從而獲得源源不斷的流量:
類似的流量獲取機制,Perplexity已經深深受益了:
同樣的,360AI搜索也通過每天晚上定時跑任務,并且通過更高優先級的方式插入到360搜索的索引內,用AI生成網頁的方式,既滿足了用戶的長尾Query,又給AI搜索本身帶去了流量。
AI搜索本身就是非常好的內容生成框架,結合AI SEO從傳統搜索引擎吸取流量,也是前期快速成長的好方式。
九、有人說Sparkpage的內容質量一般,重要么?
結論:可能并不重要
沿著上面的思路,我們可以嘗試去思考一個點:
不是所有問題都要直達終點
答案可以是一個過程,是一個中間態,這依然有很大的價值。
直白點說,Sparkpage能給到你一些啟發,幫助你去優化自己的攻略/購買決策,已經很有效了。如果未來更多用戶基于它去生成高質量的人+AI共創的內容,那真的就是AI小紅書。
換個角度:傳統搜索里,Top10%的Query占據了95%以上的流量。這意味著AI搜索有一定的可能性把用戶最關注的答案優先生成好!
十、AI搜索是一種退化?
結論:搜索從10個鏈接到1個答案是進化,但從視頻到文字是退化
這是閉門會的一位小伙伴說的,傳統搜索是菜市場,AI搜索是送外賣,但是,從視頻到文字是退化!
相信你也會思考,為何AI搜索大部分都是文字結果的呢?
我們來看看一些可能性:
這里面廣義的AI搜索可以包含,并且可以實現的擴展能力有:
輸入變得更加豐富和自由:
Query多模態:從只能文字+語音轉文字輸入,到Circle to Search、智能鏡頭,圖片、視頻輸入等等
360AI搜索App已經上線了AI圖片識別搜索能力:
Google的Take a video,微軟的Copilot陪你一起玩,在技術層面已經開始進入到了視頻交互層面了,這是非常大的一個跨越。不難想象的是,一旦這類能力進一步整合到隨身的硬件上,會有多么大的體驗提升。
輸出也會更多元:
1.信息整合:AI OverView(鏈接、圖片、POI、郵件、文檔等),典型的可見產品為Genspark的Sparkpage;Perplexity和Tako信息卡片合作,使得輸出內容可以支持圖標,還有秘塔AI搜索可以直接把生成的結果信息生成PPT;
(秘塔AI搜索實現:Search Query to PPT)
2.服務整合:Planning、Agent、Prompt-pic-Shopping等等
兩者的邊界同時在擴充,并且都可以更深度的理解用戶的意圖,這會讓AI搜索可滿足的用戶需求,從過去僅僅提供信息/內容整理,擴充到工作生活學習的方方面面。
最近的一步,AI搜索更應該是把答案組織成用戶更喜歡的載體,這可能是圖文混排,或者包含視頻,這涉及到的是信息的組織,Genspark的Sparkpage就非常典型,我們之前畫過結構圖:
所以,目前看只能生成文字的AI搜索,在局部確實是退化的。
十一、總結
這篇文章,是一個階段性的思考,期間有大量的使用AI搜索完成日常信息的搜集,有大量和行業從業者的溝通交流,這里感謝參與其中的各位。
這里感謝愿意署名的共創者:
AI產品經理 小邵,即刻 “小邵嘚啵嘚”
Miku AI創始人 Franco,微信:aigeek2024
ThinkAny 創始人 idoubi,即刻: 艾逗筆
參考:
我做了一個 AI 搜索引擎 from 艾逗筆
《普通人的AI使用說明書》 from 即刻@余一
https://gamma.app/docs/AI-Dev-9y7n4vslcp2bol2?mode=doc
本文由人人都是產品經理作者【Super黃】,微信公眾號:【AI產品黃叔】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!