AI搜索,一鍵直達答案
AI技術的介入,為搜索領域帶來了革命性的變革。本文通過深入分析“天工AI搜索”、“夸克”和“元寶搜索”等AI搜索功能,探討了它們如何利用先進的算法和大數據分析,為用戶提供更精準、更直觀的搜索結果。
時間,是怎樣被無情吞噬?
輸入關鍵詞、在一長串網頁結果中點擊瀏覽、規避隱藏的廣告,甚至有時還得看個視頻才能找到想要的結果。這是傳統的搜索引擎,為了找到自己想要的答案,不得不耗費大量時間和精力大海撈針,是讓人著急的體驗。
搜索的下半場,是AI。
昆侖萬維發布國內第一款AI搜索引擎“天工AI搜索”;夸克推出以AI搜索為中心的一站式AI服務;騰訊元寶上線深度搜索模式……大模型廠商們不約而同押注此方寶地,騰訊、百度、360等眾多大廠均發布AI搜索產品或功能。
數據顯示,當前在大模型相關產品的使用中,超過65%的用戶需求集中于提升工作與學習效率,其中“搜索問答”需求占比高達45%。可以說,AI搜索顛覆了幾十年來一成不變的搜索格局,一切變得簡潔、高效,真是“懶人必備”。
一、搜常識,形式內容,缺一不可
醫學、地理、歷史、文學、物理……一搜索,無數紛繁復雜的信息撲面而來,需要自己甄別。當搜索融入了AI基因,能幫助用戶選出最佳答案嗎?
“紅細胞和白細胞有什么區別”,這是天工、夸克和元寶得到的第一個問題。
天工參考了全網的12個信源,畫出了一張表格,從大小、形狀、顏色、主要功能等進行比較,比如白細胞直徑10~15微米,可以進行免疫防御和炎癥反應,紅細胞直徑7~8微米,主要運輸氧氣和二氧化碳。表格的形式讓“小白”用戶一目了然,并且還有簡單的總結。如果覺得表格中的信息過于簡單,想要了解更多,天工直接從一些醫學網站上“拿來”相關內容,讓用戶自選。
夸克雖然沒有給出表格,在形式上略遜于天工,參考資料也只有一篇,但從生理功能、臨床意義、形態、數量等方面給出了兩者的區別。像“臨床意義”是天工沒有提到的,白細胞計數偏低,可能是再生障礙性貧血、脾功能亢進癥等引起,紅細胞偏低可能是長期處于缺氧環境、真性紅細胞增多癥等引起。和天工一樣,在給出答案后,又給出了不少其他平臺上的信息。
元寶參考了11篇資料,同樣從形態、數量、功能等方面替用戶總結好了,甚至還有一些衍生問題,引導用戶繼續提問,比如“紅細胞減少的常見原因是什么”“白細胞減少癥的癥狀有哪些”等。雖然元寶也沒有表格,但它給出了更多帶有圖片的鏈接,像微信公眾號病理柳葉刀的《一圖讀懂紅細胞VS白細胞》等。
從這個問題看,三大AI搜索平臺的表現各有千秋,從形式上看,天工最為出新,從信息量上看,夸克略勝一籌,從問題衍生性看,元寶稍占上風。
回答完了醫學問題,再回答一個地理問題:世界上最長的河流是哪一條,主要流經哪些國家?相較于上一道題,這道題的答案指向性比較單一。世界上最長的河流是尼羅河,天工除了給出這個答案,還告訴用戶尼羅河的長度、發源地、對途經國家的作用等;元寶也抓住了問題的關鍵點,并且提出了不少延伸問題。但夸克卻“拉垮”了,沒能理解這道題,給出的答案是“埃及”,它把題目理解成了“世界上最長的河流在哪個國家”。
二、搜新聞,深層搜索,“卷”出天際
在信息爆炸的時代,搜索是獲取新聞的重要窗口,但通常搜索一條新聞,會出現各種五花八門的消息,甚至還有“舊聞”摻雜其中,降低了搜索效率。
最近,關于“蘿卜快跑”的新聞非常多,讓這些AI搜索梳理一下吧。
天工綜合了騰訊、百度等平臺上4篇信源,總結出蘿卜快跑近期有技術故障和識別能力不足等新聞,比較簡單,也并不全面。
夸克同樣也引用了4篇報道,相較于天工信息,其梳理得更為詳細,比如把蘿卜快跑和行人發生輕微接觸的過程都寫了出來,也總結了這起事故帶來的后果。對于用戶體驗不佳的事,夸克蜻蜓點水般提了一下,并沒有詳細說明。
在這條新聞的梳理方面,元寶的表現明顯占優,不僅參考的資料多,達到了10篇,還總結出了6件事情,分別是武漢街頭無人駕駛汽車引發熱議、日均訂單量趕上出租車、與行人相撞、網絡水軍事件、面臨安全挑戰以及和真人司機“搶飯碗”,每一個事件都可以跳轉到相關網站查看詳細報道。
對于蘿卜快跑的消息,這三個平臺在梳理完后,都給出了一些延伸問題,比如蘿卜快跑的技術故障是什么原因引起的、蘿卜快跑何時將覆蓋更多的城市、蘿卜快跑的訂單量增長對傳統出租車行業有何影響等……
大模型是需要“教導”的,天工第一次給出的答案是三個平臺中最簡單的,被要求“重答”后,它認真了一點,不僅梳理的信息更加多元,包括交通故障、服務問題投訴、公眾對蘿卜快跑的態度等,還進行了分類,看上去更加清晰。
在此輪中表現不錯的元寶非?!熬怼保溆小吧疃妊芯吭搯栴}”功能,就這個問題,元寶參考了53篇資料,相較于一開始的10篇增加了43篇。深度回答在內容方面也更加詳細,以蘿卜快跑在武漢發生的交通事故為例,不僅有事故概況,還分析了責任問題和回應措施。值得一提的是,元寶用一張腦圖展現了深度梳理出的信息,看起來更為直觀。
三、搜觀點,思想火花,各抒己見
想法不碰撞,就像花兒不斗艷,少了那份活力和色彩。大多數事件都會產生各種不同的觀點和看法,在信息時代,搜索觀點變得尤為重要,這些AI搜索能挖掘出深藏于網絡的思想寶藏嗎?
“大模型如雨后春筍般涌現,現在的大模型好用嗎?”這是一個仁者見仁智者見智的問題。
面對這個問題,天工給自己做起了廣告,說“天工大模型”的設計和優化都是基于最新的技術進展和用戶反饋,通過不斷的學習和迭代,可以成為用戶信賴的伙伴。
這顯然不是記者想要的答案,雖然在“相關資訊”中,天工提供了不少和大模型相關的報告和觀點,但這些信息都比較零散,需要自己梳理。
元寶依然參考了最多的資料,總結了各類評測結果,但給出的答案主要側重于大模型的優點。比如根據浙江大學、香港中文大學的一些評測結果顯示,大型語言模型在專業領域知識測試中表現優秀,多個大模型的中文能力超過了GPT—3.5。
在用戶反饋方面,元寶得出的結論是大語言模型在意圖識別和內容結果呈現方面表現良好,能夠提供全面深入的信息。
雖然這樣的結論有其合理性,但大模型畢竟還處于發展上升階段,有許多不足之處。
在這個問題上,夸克提煉出的觀點更為中立,除了肯定大模型在能力、易用性、效率等方面的優勢,也直言不諱地表示,目前大模型在安全性、隱私保護、能力提升等方面依然有進步的空間,比如“用戶擔心個人數據可能被濫用,或者模型可能被用于不道德或非法目的,目前,大模型仍處于發展初期,還面臨諸多挑戰和限制”等。
總之,這些AI搜索應用在接受“拷問”時展現了不同的優勢,但也會有“迷糊”的時候。當然,每一次“迷糊”可能是它們邁向更智能、更完善的一步。
作者/ IT時報記者 潘少穎
編輯/ 潘少穎 孫妍
本文由人人都是產品經理作者【IT時報】,微信公眾號:【IT時報】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!