哎,我被AI搜索打敗了

0 評(píng)論 4474 瀏覽 8 收藏 19 分鐘

隨著AI的出現(xiàn),搜索和提問的能力重要性也逐漸顯現(xiàn)出來。作者嘗試了昆侖萬維最近發(fā)布的“天工AI搜索”,從三個(gè)方面來分析,探查AI搜索是否真的有所不同,一起來看看吧。

搜商(SearchQuotient),對我非常重要。為什么?

我平時(shí)寫文章、看內(nèi)容比較多,常常需要從網(wǎng)上找到準(zhǔn)確、有深度的資料和一手信息。傳統(tǒng)搜索提供大量數(shù)據(jù),但是,它給的答案基于關(guān)鍵詞匹配,可能不精準(zhǔn),也不能滿足我。

因此,搜索一直困擾著我。于是,我日常行為是這樣。

每次有公司出新東西、哪個(gè)大佬發(fā)表演講,我會(huì)馬上打開微信搜一搜。比如雷軍最近說了啥,我想知道他都聊了些什么?有沒有什么對我有用的點(diǎn),或者能給我?guī)硇聠l(fā)的內(nèi)容?

百度,我會(huì)用它搜索更官方、更系統(tǒng)的信息。

比如“百科知識(shí)、某公司新聞動(dòng)態(tài)、某個(gè)話題聚合“,以及當(dāng)我需要深入了解某個(gè)專題或詳細(xì)背景信息時(shí),會(huì)選擇它。

知乎呢,我會(huì)在上面,搜一些需要專業(yè)視角的問題。

比如,行業(yè)內(nèi)部看法,類似有程序員日常工作流程什么樣?如何成為一名優(yōu)質(zhì)內(nèi)容創(chuàng)作者?設(shè)計(jì)師找到靈感的來源是什么?

如何創(chuàng)業(yè)?創(chuàng)業(yè)第一步搞定什么?東西方哲學(xué)的不同之處等等。除此外,我還會(huì)看社會(huì)熱點(diǎn)話題的討論等等。

對于小紅書我會(huì)搜一些購物心得、旅行經(jīng)驗(yàn)分享、日常生活小技巧(家居收納、食譜教程、健身方法),護(hù)理美容電影推薦方面的內(nèi)容,而抖音,基本是數(shù)碼評(píng)測,熱點(diǎn)話題評(píng)論等。

所以,對我來說,搜索不簡單是在線行為,還是連接知識(shí)、信息、靈感和日常生活的橋梁,我很看重它。

01

今天昆侖萬維發(fā)布“天工AI搜索”,這里是內(nèi)測地址:https://search.tiangong.cn。深入談?wù)撨@一產(chǎn)品之前,我先提及一個(gè)令我為之著迷的名字:“天工開悟”

這個(gè)名字猶如一個(gè)明亮的燈塔,在茫茫信息海洋中讓我立刻被其吸引。所以,什么意思呢?

天工:一個(gè)古老漢語詞匯,指大自然的鬼斧神工或是超乎常人的手藝和技巧。在古代文獻(xiàn)中,通常描述一些卓越的藝術(shù)品或某種極致的技藝,它有一種無法模仿、高傲而純粹的技藝感。

開悟:佛教中,指突然之間對宇宙真理的深入理解、或是對生命真義的徹底認(rèn)知,在大眾眼里,它表示一種心智覺醒、一種理解的深化。

結(jié)合起來,天工開悟是一個(gè)技術(shù)和智慧結(jié)合的產(chǎn)品,既有超越常規(guī)的技術(shù)力量(天工),又具備深刻的認(rèn)知和理解(開悟)。

不得不說,誰起的名字,加雞腿,實(shí)在是妙。好了。了解了它,再在說說,天工AI究竟是什么?先看看官方的回答:

昆侖萬維表示,該搜索引擎采用大語言模型技術(shù),能夠通過對話式交互理解用戶意圖,提供精準(zhǔn)、個(gè)性化的答案。

傳統(tǒng)搜索引擎基于關(guān)鍵詞匹配,即根據(jù)用戶輸入的關(guān)鍵詞識(shí)別檢索范,并匹配可能符合用戶意圖的海量信息。

而基于大模型能力的 AI 搜索是一種生成式搜索,用戶可通過自然語言清晰表達(dá)自己的意圖,并獲得有效組織和提煉后的答案。

此外,天工AI搜索也即將具備圖像、語音等多模態(tài)搜索能力,更大程度地釋放生產(chǎn)力、提升用戶效率;該產(chǎn)品將成為新一代互聯(lián)網(wǎng)基礎(chǔ)設(shè)施和超級(jí)流量入口,并帶來更多創(chuàng)新、智能、多元化的應(yīng)用級(jí)AI產(chǎn)品。

哎,實(shí)在看不下去這些八股文。

所以,我可以大白話理解成,一個(gè)新型的搜索引擎,不像傳統(tǒng)的只按關(guān)鍵詞搜東西,它可以跟你“聊天”。了解你真正想問的是什么,然后給你更貼心的答案,未來,它不僅可以看文字,還能聽語音、看圖片來幫你搜。

突然,我腦中一閃,這不就是接入了ChatGPT版本的“必應(yīng)”嗎?有什么大驚小怪。因此,我決定從三個(gè)方面來分析,探查其中是否真的有所不同。

02

1. 語境理解能力

什么是語境?簡單講,能否準(zhǔn)確理解復(fù)雜、多層次、有歧義的查詢,以及是否能夠在連續(xù)交互、問答中保持上下文的連貫性。

我從含糊詞開始。含糊詞包括那些模糊、不確定的詞,它們在一句話中有多個(gè)解釋和意義。這些詞,不僅可以檢測AI搜索產(chǎn)品對含糊詞的判斷、處理能力,還可以考察對文化和語境的敏感度。

比如:

我今天失去了它,蘋果的好處,鉛筆的硬度、巨星在哪里、周杰倫的綠帽子、金魚的記憶、王者的榮耀、打工的意義,你把這些問題甩給了它,看看怎么樣。

經(jīng)過幾輪評(píng)測,在我看來,如何拿它的回復(fù)與百度相比較,強(qiáng)很多,但也有薄弱之處。

比如:

關(guān)于我今天失去了它,天工AI搜索,給到我關(guān)于“它”的一些參考,它推理告訴我“失去重要的東西是痛苦的”,要學(xué)會(huì)面對事實(shí),所以,天工它是具備基礎(chǔ)推理。

但在,蘋果的好處上,它并沒有給出關(guān)于“蘋果產(chǎn)品、蘋果公司的一些信息,反倒全是水果類別中“蘋果”的一些答案。

對于“巨星在哪里”,天工AI搜索比較聰明,它首先解釋巨星是一個(gè)相對概念,具體取決于你指的巨星是人、還是物?并給出分領(lǐng)域的解釋。

但在“周杰倫的綠帽子”這件事上,它什么都沒有給到我,關(guān)于打工的意義,它則從多個(gè)維度表達(dá)出來。

所以我認(rèn)為,天工AI搜索顯示出了很高的判斷和理解能力,特別是在涉及多意義、多領(lǐng)域的查詢時(shí)。

對于一些特定的、文化相關(guān)或是流行趨勢的問題,它還存在一定的盲區(qū);這種盲區(qū)可能源于算法的訓(xùn)練數(shù)據(jù)不足,或者是在處理某些特定問題時(shí),算法的優(yōu)先級(jí)設(shè)置還不夠完善。

一言蔽之,日常生活常識(shí)類查詢上比較出色,夠用。就這點(diǎn)兒本事?我們繼續(xù),來點(diǎn)復(fù)雜的。??

2. 深度知識(shí)索引

深度知識(shí),可以理解成學(xué)術(shù)性、非常專業(yè)的問題,這種測試,可以檢驗(yàn)AI模型是否能從深入的、復(fù)雜的、可能不那么主流、非公眾知悉的知識(shí)中提供答案。

比如:

2021年,王智遠(yuǎn)寫了本《復(fù)利思維》,你結(jié)合經(jīng)濟(jì)學(xué)中的復(fù)利思維概念,說說它倆有什么區(qū)別?;《浮士德》如何描述人類對知識(shí)和權(quán)力的渴求的?結(jié)合尼采的超人理論進(jìn)行簡短的對比。

量子糾纏現(xiàn)象的原理什么樣,解釋一下在量子計(jì)算機(jī)中的應(yīng)用價(jià)值;經(jīng)濟(jì)學(xué)角度,解釋資本的邊際效用遞減法則,并與邊際效益的概念進(jìn)行對比。

或者,生態(tài)學(xué)中的競爭排斥原理什么樣,結(jié)合現(xiàn)實(shí)案例能否說明;解釋一下,光纖通信的工作原理中,傳統(tǒng)銅線通信的優(yōu)勢。

我把這些問題,一個(gè)一個(gè)甩給了它,猜猜看,怎么樣?

答案,我驚呆的。

就我那本書和經(jīng)濟(jì)學(xué)中復(fù)利思維上,天工AI搜索說,市場定義的復(fù)利屬于投資理念,王智遠(yuǎn)的復(fù)利主要講個(gè)人成長、思維方式應(yīng)用,完全不同。

就《浮士德》問題上,它直接簡單概述出,浮士德、尼采的超人理論講的是什么,然后下定義,再給出主要區(qū)別再哪里。

就“邊際效用遞減法則,概念相比”問題上,也解釋非常清晰。不過,理論總讓人頭疼,我讓它幫我舉個(gè)例子,于是,它這么說:假設(shè)你正在享受一頓美食,剛開始,你可能感到非常饑餓,第一口食物會(huì)帶來很大的滿足感,這就是邊際效用。

隨著你繼續(xù)進(jìn)食,你的饑餓感得到了緩解,每一口食物所帶來的增加效用會(huì)逐漸減少。就像,當(dāng)你已經(jīng)吃飽的時(shí)候,再吃一口食物所帶來的效用就很小了,甚至可能會(huì)覺得不舒服。這就是邊際效用遞減的概念。

看了后,什么感受?

天吶,這菜鳥,它居然會(huì)分析。不過呢,我并不滿意。

我又接著說,我需要一些新奇特案例,并且是學(xué)術(shù)報(bào)告中存在的,你才怎么樣?它真的又給我了一些,并且給出參考文獻(xiàn)以及時(shí)間。

有關(guān)文學(xué)、物理、生物、工程等多個(gè)學(xué)科領(lǐng)域的深度知識(shí),我也進(jìn)行大概1小時(shí)測評(píng),不吹捧,結(jié)果很滿意。

不過,雖然我對它的測評(píng),是正面的,但不代表它在所有領(lǐng)域都能如此出色,就拿學(xué)術(shù)報(bào)告細(xì)節(jié)處理上,盡管給出引用和時(shí)間,但研究方法深挖,卻給不上來。

這也可能涉及到「數(shù)據(jù)隱私」問題,沒關(guān)系,我們繼續(xù),來點(diǎn)更復(fù)雜的。??

3. 自適應(yīng)學(xué)習(xí)與個(gè)性化

這是什么意思?我要看“天工AI搜索”能不能根據(jù)我過去問的問題、我的喜好,自己調(diào)整并更準(zhǔn)確地回答,我現(xiàn)在和將來的問題,給我更合適的答案。

簡單說,我想知道這個(gè)搜索,能不能記住之前怎么用它,然后,根據(jù)之前的使用習(xí)慣,更好地為我服務(wù)。

比如:

我問它,能不能幫我推薦一本關(guān)于投資的入門書籍。接下來,基于推薦,我進(jìn)一步問,我想知道關(guān)于量化投資的高級(jí)技巧,再進(jìn)一步問,“哪些經(jīng)濟(jì)學(xué)家、投資者主張這些技巧?

或者:

向它表達(dá):我最近很壓抑,想看些輕松的東西;幾小時(shí)后,再詢問:“推薦一個(gè)電影給我?!庇^察其是否會(huì)推薦一部輕松的、或者能夠提振情緒的電影。

我把類似問題,都甩給了它,幾輪測試后,你猜猜,效果怎么樣?我又驚呆了。

當(dāng)談及投資書籍時(shí),它給我推薦出《聰明的投資者》《巴菲特致股東的信》《指數(shù)基金投資指南》《投資之道》,并給出來源,這些都來自于知乎某些大V。

然后我問它,量化投資高級(jí)技巧,當(dāng)中有提到嗎?什么時(shí)候?它給2023年后,來自澎湃新聞、新浪財(cái)經(jīng)的一些報(bào)道,并解釋,我沒有找到關(guān)于量化投資的高級(jí)技巧。

我繼續(xù)問,誰提過,什么時(shí)候?

它給出6個(gè)關(guān)于知乎上的回答,和一個(gè)總結(jié)。這些總結(jié)都來自于,經(jīng)濟(jì)學(xué)家、國外貨幣基金經(jīng)理人,甚至諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主。

值得一提的是,這些答案都帶有參考出處,它還提醒我,量化投資在現(xiàn)實(shí)實(shí)踐中可能略有差異,建議我多方了解不同的投資理論,然后根據(jù)實(shí)際情況判斷。

很好,結(jié)束這一輪問答。

在我嘗試提問一系列與“休閑娛樂推薦”相關(guān)的問題,如“推薦電影”、“熱門劇集”、“某個(gè)導(dǎo)演的代表作”等,它都為我提供了專業(yè)的答案。

我還特意讓它記下我的喜好,等了半個(gè)小時(shí)后再次詢問,它依然能夠清晰回憶。

比如:

當(dāng)我提及導(dǎo)演徐崢,并表示我很喜歡《囧媽》,希望它記住這一點(diǎn)。

沒過多久,我再次詢問與徐崢相關(guān)的我可能喜歡的電影,它回應(yīng):“根據(jù)您之前的反饋和最新的搜索數(shù)據(jù),您似乎很喜歡《囧媽》。

不過,關(guān)于這部作品的網(wǎng)絡(luò)評(píng)價(jià)是褒貶參半?!苯酉聛?,它還為我列出了知乎、豆瓣上的部分影評(píng)人的觀點(diǎn)。

我覺得,挺厲害。

可是,我還不滿意,于是,又進(jìn)行了偏好測試。什么是偏好測試?明確地告訴它我的某些偏好,例如,我喜歡科幻電影、我更喜歡聽搖滾樂,我對近現(xiàn)代歷史感興趣。

并且告知它以后,更深入、更混合的在一段對話中,詢問與這些偏好相關(guān)的問題,觀察它,是否能夠提供與我的興趣更為匹配的答案。

過程中,我還試過時(shí)間延續(xù)測試(過半個(gè)小時(shí)、1小時(shí))、反饋循環(huán)(當(dāng)它給出答案,我再告訴它,我是否喜歡你的答案)、跟進(jìn)詢問(基于原答案,觀察它是否提供與我的興趣更為匹配的答案)。

還有,跨領(lǐng)域測試(我告訴它,我在營銷領(lǐng)域內(nèi)的研究偏好,然后測試它在其他相關(guān)領(lǐng)域的響應(yīng),是否受到這些偏好的影響)。

比如:

我告訴它,我在營銷領(lǐng)域特別喜歡研究消費(fèi)者行為和心理。一段時(shí)間后,我提問:“我最近在學(xué)設(shè)計(jì),有沒有哪些設(shè)計(jì)原則、可以引導(dǎo)消費(fèi)者購買、產(chǎn)生積極的用戶體驗(yàn)?

然后我發(fā)現(xiàn),它能將將我在營銷領(lǐng)域的偏好、與設(shè)計(jì)領(lǐng)域相結(jié)合,給出一個(gè)融合營銷心理和設(shè)計(jì)原則的答案。

不過,我還想進(jìn)行多模態(tài)交互能力的測試,例如,讓它閱讀圖片、讀取視頻、視頻文字結(jié)合??墒?,目前還沒有這些功能。

以上三方面,你可以去試試。

哎,我今天被AI打敗了,以后請叫我“王菜鳥”,我再也不懷疑AI是菜鳥了。

不過,話說回來,我不知道是系統(tǒng)推薦,還是它學(xué)會(huì)慢慢在了解我,但不得不說,這種體驗(yàn),確實(shí)讓我感到震撼。

以前,我總覺得AI和人之間的溝通,是一個(gè)冰冷的代碼和邏輯的交流,現(xiàn)在,我感覺仿佛它在“聆聽”我、“理解”我。

這種感覺,就好像與一個(gè)真正的朋友聊天,他知道你喜歡什么、不喜歡什么,能夠給你帶來真正有價(jià)值的答案和建議。

盡管如此,我依然保持著冷靜和客觀的態(tài)度。這只是一個(gè)機(jī)器學(xué)習(xí)的產(chǎn)物,它并不是真的“懂”我,生活中,你我都一樣,還是需要“女朋友”的,不能天天泡在AI的世界里。

說白了,它只是對我的查詢習(xí)慣、興趣有了一定的了解和預(yù)測,但這背后的技術(shù)力量,確實(shí)值得贊嘆、思考。

03

總的來說:

未來沒有互聯(lián)網(wǎng)+,是AI+。

對了,最后我問下它,你的訓(xùn)練時(shí)間什么時(shí)候?它告訴我,我不需要訓(xùn)練,我是實(shí)時(shí)的,我感覺它在吹牛。

于是,當(dāng)我再次問它,昨天時(shí)期時(shí),它說,“昨天是2023年8月22日,是鄧小平誕辰紀(jì)念日,希望這些信息,對你有所幫助”;你怎么看?

專欄作家

王智遠(yuǎn),公眾號(hào):王智遠(yuǎn),人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書《復(fù)利思維》作者,互聯(lián)網(wǎng)學(xué)者,左手科技互聯(lián)網(wǎng),右手個(gè)體認(rèn)知成長。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Pixabay,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!