搜索引擎30年,視頻搜索在崛起
編輯導語:“遇事不決,先問度娘”這句話曾經風靡網絡,足以見得搜索引擎的重要性。從文字搜索到圖片搜索,再到視頻搜索,30年來搜索引擎不斷隨著互聯網的用戶需求而改變。本文作者梳理了搜索引擎30年的發展歷程,并對視頻搜索的未來展開分析,與你分享。
伴隨文明信息載體的演變,視頻和圖文需求的此消彼長,視頻搜索趨勢同樣無法逆轉,注定會成為更多互聯網巨頭又一個爭奪的戰場——視頻搜索,也就會凸顯出它的更大價值所在。
“視頻搜索這種更具畫面感、個性化的搜索方式,會成為未來搜索引擎新趨勢嗎?”
這是2月17日,字節跳動CEO張楠透露,抖音視頻搜索月活用戶超5.5億,日均視頻搜索量已達4億,抖音將加大對搜索的投入力度之后,在知乎,由官方“知乎科技”發起,已有400來人參與的熱門問答。
在移動端積極布局搜索業務的不止抖音,其早已成為所有巨頭布局方向。2021年微信公開課上,微信搜一搜首次完整亮相。更早之前,字節跳動等互聯網巨頭也公開宣布發力搜索業務。區別在于,無論是微信搜一搜,還是其他互聯網巨頭,重點發力方向都是通用搜索,而不是視頻搜索。
搜索,英文名Search。過去30年來,作為用戶需求、依賴最多的領域,搜索對互聯網發展有天翻地覆的影響,如果沒有搜索,那么大概率不會有如今的互聯網。
從文字搜索到整合搜索、圖片搜索、音頻搜索,乃至現在的視頻搜索,搜索成為互聯網進化最快的領域之一。直到如今,智能設備和信息技術大爆炸仍持續影響著搜索方式,推動搜索變得越來越更聰明。
這也讓過去多年來,眾多業界人士,甚至谷歌搜索產品和用戶體驗副總裁瑪麗莎.梅耶爾(Marissa Mayer),在十多年前的《搜索的未來》中發出相同提問:
搜索引擎會成為過去時嗎?未來的搜索,又會是什么模樣?
毋庸置疑。也許谷歌、百度會沒落,但搜索引擎不會過時,它本就是一部在技術不斷革新中變得更好的搜索簡史——面對日益復雜的各種內容,越來越懂得用戶的查詢需求,并迅速為用戶提供更精準的信息和答案,本就是搜索引擎誕生以來一直致力的前進方向。
歸根結底,無論百度、谷歌、微軟、雅虎、Pintrest,還是YouTube、抖音、微信搜索,盡管各大搜索引擎獲取信息的方式已不盡相同,但其目標都一致:誰更準確理解用戶想找什么,誰就將引領下一代搜索潮流。
01 PC時代:從萌芽到百度谷歌爭霸
搜索引擎原理,很大程度源于傳統文件檢索技術。它的簡史,要從30多年前互聯網萌芽并興起時代說起。
1990年以前,萬維網還未出現,沒人能搜索互聯網。這一年,加拿大麥吉爾大學的三位學生發明了Archie。Archie是第一個自動索引互聯網上匿名FTP網站文件的程序,它沒有機器人(Robot)程序,還不是真正的搜索引擎。
時代巨輪,正悄然啟動。1993年,美國副總統戈爾提出“信息高速公路計劃”,并由此爆發了互聯網超常規發展的黃金十年。
信息高速公路網,也許就是搜索引擎。1994年,Lycos推出基于人工分類目錄的搜索引擎,用戶輸入關鍵詞就可根據內容需要查找網頁,在此之前,用戶需要通過人工收集和整理“網址索引”才能進入網頁,雅虎正是這方面的代表。
早期的搜索引擎百花齊放,雖然功能都不完善、命運多舛,但為后來跨時代發展奠定了基礎。
跨時代變革在1998年到來。這一年,拉里·佩奇和謝爾蓋·布林在斯坦福大學學生宿舍開發了谷歌,他們發明了叫做PageRank的鏈接分析技術,使得搜索結果相關性大大增強,并且在界面等實現了革命性創新。
谷歌搜索引擎的出現,標志著全民互聯網時代的來臨。從此,世界網民都認識到,搜索是一個簡單動作,輸入關鍵詞,就能在一頁頁藍色鏈接中尋找到結果。
在國內,李彥宏攜120萬美元風險投資回國,成立眾里尋他千百度的“百度”,通過建立在海量網站基礎上的“超鏈分析”技術,走到了舞臺中央。
此后,更多公司受搜索市場前景和谷歌神話吸引,積極進入搜索引擎市場,謀求一席之地。但也因為瀏覽器劫持、惡意捆綁等行為,在備受爭議后寂然無聲。
2004年9月,谷歌推出簡體及繁體兩種中文版本的搜索引擎,與百度在內地市場分庭抗禮,加上360、搜狗、網易有道等的出現,搜索引擎大戰在國內爆發。
2010年谷歌退出內地市場,百度開始在國內一家獨大無人撼動,一度在國內PC搜索市場占據83%以上市場份額。盡管它與谷歌占據全球90%以上市場份額相比,從全球來看依然是小眾搜索。
回頭看去,雖然外界對谷歌、百度迄今仍有諸多爭議,但歸根結底,他們能在PC時代占據統治地位,是通過技術讓搜索質量有了質的飛躍,用戶獲得信息更快更準確,讓搜索引擎真正成為互聯網的第一流量入口。
在這個基礎上,還誕生了搜索廣告、搜索引擎優化(SOE)、搜索引擎營銷(SEM)等技術與商業化形式。而知識圖譜、個性搜索、云計算、乃至人工智能等技術的發展,某種程度上也被搜索技術的進步所影響和推動。
這是谷歌、百度在搜索歷史中所起到的巨大重要作用,也是谷歌、百度能成為科技巨頭的根本原因,如同李彥宏所說:“搜索是百度成功的所有秘密”。
無論是谷歌,還是百度,他們仍然一直沿用的是上世紀的關鍵詞來生成網址索引的模式——在互聯網內容日益復雜、龐雜后,通用搜索越來越難以滿足用戶的搜索細分意圖,導致大把時間都被消磨殆盡了。
這就是過去多年來,搜索引擎是否過時說法的主要原因。2011年,時任微軟Bing的主管就如此批評:“在過去12年里,搜索本質上沒有什么改變,傳統搜索正在走向失敗。搜索的概念不再有效,在網頁上、在反向鏈接上、在所有一切上尋找文本不再管用了?!?/p>
02?移動十年:三大搜索方式潛力未兌現
潮起潮落,隨著移動互聯網興起,PC端逐漸向移動端流量轉移,搜索也開始進入移動時代。
移動搜索與傳統搜索有著很大不同,搜索訴求、搜索方式、輸入方式、輸出結果,都因為各種移動設備而變得更自然、更廣泛和更智能——人們不僅可以隨時隨地通過 Siri搜索,還可以在跑步時用可穿戴設備搜索,也可以懶洋洋地躺在沙發上用Alexa搜索。
文字搜索遠遠滿足不了億萬網民需求后,語音搜索、圖片搜索、視覺搜索,是過去移動互聯網10年三大最有代表性的搜索方式。
2011年開始,在智能手機、可穿戴設備、智能語音助手、智能音箱等助推下,語音搜索讓眾多巨頭興奮不已。不過,幾年發展后,盡管大多數語音識別技術識別率已達到了一個較高水準,但識別并不等同于理解,算法速率和準確率需要進一步提升,同時無法排除嘈雜的環境干擾,對使用者的說話語氣、語速、口音等要求頗高。
從咨詢公司Roast2018年一份研究22個垂直行業的語音搜索情況來看,Google智能助理能回答的問題不足一半,即使是能回答的問題,答案類型也是千差萬別。
語音搜索在某些人士看來,目前還是雞肋的同時,圖片搜索、視覺搜索又開始興起。
圖片搜索和視覺搜索背后的技術邏輯相通,比如都是基于算法和數據,與數據庫中的特征照片進行對比,識別和搜索目標圖片中的語義標簽。因此無論是谷歌、百度、Facebook、微軟、亞馬遜,還是Pinterest(圖片版的推特),他們都早早進入了上述領域并投入了大量的研發資金。
兩者在輸入上卻完全不同。前者是一種以反饋圖像有效信息結果的搜索模式,只需輸入文本、關鍵字或者圖片就可以得出結果,門檻相對較低;后者是用智能手機或其他攝影頭來識別物理世界所有對象信息的模式,再使用發展近30年歷史的圖像識別技術,結合用戶特征和搜索場景得出相關信息。
谷歌在2011年推出圖片搜索,這個功能的意義是,讓互聯網信息共享跨入新時代。不過,基于單幅圖片來進行搜索,相對有局限性。
業界持有更大希望的是視覺搜索。2009年,谷歌為安卓手機開發的Google Goggles可以說是最早的視覺搜索應用。Goggles目的在于搜索識別現實世界中拍攝對象的圖片信息,并且能夠使用物品的條形碼進行產品搜索。
但Goggles技術非?;A,本質上是一個搜索引擎公司的Pinterest也在2015年就推出了它的視覺搜索功能,并取得了技術上的重大突破,比如如何更有效將圖像識別和視覺搜索功能結合起來,包括能夠在更廣的可視范圍內中逐個建立單個識別對象,并在視覺應用上顯示搜索信息。
2019年2月,Pinterest推出了圖片搜索功能Lens。經過1年探索,Pinterest用戶每月至少進行6億次視覺搜索,且搜索總數在不斷上升。其受歡迎原因在于,它能夠為每一位用戶創建一個獨特的“品味圖譜”,激發用戶購買欲。
谷歌也在2017年通過圖像識別和OCR技術推出了Lens功能,讓機器學會“看圖說話”,并且用它正式取代了Goggles。不過,直到2020年6月,谷歌才宣布可以在所有穩定版本中使用Google Lens。
03?內容壁壘:搜索引擎多元化和差異化
和傳統搜索相比,用戶在使用圖片搜索、視覺搜索時,尋找的是圖片而不是關鍵詞,進一步滿足了用戶的搜索需求和體驗需求。
這并不能宣告,搜索引擎已從文本搜索進入了圖片或視覺搜索時代。
因為哪怕圖像識別技術已有很大進步,比如利用深度學習來訓練視覺搜索并從圖像中提取信息,但由于設備問題,加上對圖片中各種元素的識別、標記效率不夠、交互不夠自然,以及隱私保護等原因,都是視覺搜索模式已經出現多年,卻很少在日常生活中使用它們的原因。
必須承認,20多年來,一直在努力變得更聰明的搜索引擎,圖文搜索依然占據搜索主要份額——其根本原因,是互聯網上內容都是以HTML圖文方式呈現,搜索圍繞圖文為重點,是時代必然,也是圖文搜索很難被完全取代重要原因。
但時代終究不同。移動互聯時代,APP成為各自領域內容重要入口,也讓每一個APP都成為一座數據孤島。傳統通用搜索引擎難以搜到APP優質內容,無論是國外的Facebook、YouTube,還是國內的抖音快手、攜程美團中的內容,傳統通用搜索引擎都很難搜索到。
這讓搜索引擎市場格局開始發生變化。比如百度,由于內容壁壘加深,以及用戶注意力被分散到短視頻、電商、垂直應用等各個移動端口,搜索及相關業務也被其他不同搜索業務和平臺緩慢蠶食。
從市場份額來說,百度搜索在國內獨占鰲頭格局雖暫時無人撼動,但搜索業務正呈現出多元化與差異化發展的趨勢——如同知乎答主“PANSZ”所說,人們用淘寶搜商品,用知乎搜問題,用美團搜團購,用哈羅搜自行車,用滴滴搜快車,用高德搜地點,同樣也會用抖音搜視頻。
可以說,這些互聯網巨頭和平臺都有同一的目的:在最擅長領域內,做自己的搜索引擎,以縮短搜索和服務目標之間的鏈條。
但放在更宏大歷史背景中,上述絕大部分搜索,不過是基于自身APP內部的用戶需求行為,其對互聯網的改變和推進意義,遠遠小于谷歌、百度帶來的圖文搜索。
那么,當通用搜索到更豐富內容越來越難的時候,有沒有一種搜索方式,可能在圖文搜索之后,代表著未來趨勢和方向?
04?未來需求:視頻搜索與圖文搜索終極對決
詹姆斯·格雷克在《信息簡史》一書中說:信息僅僅存在是不夠的,它還必須為人所知。
事實上,無論是哪種搜索模式,最重要的,仍是以所有用戶為中心,精準提供其他渠道沒有的、更有價值的信息和服務。
目前來看,滿足上述搜索核心價值理念,并且符合人類文明、互聯網未來發展趨勢的,只有視頻搜索。
當前,伴隨5G、大數據、云計算、物聯網、人工智能等技術的飛躍,人類文明記載方式,正從圖文到視頻演變——盡管以圖文為媒介的內容,在短時間內依然還會是主體,但在感官、現場、個性化、直觀等全面碾壓圖文內容的視頻,早在各領域井噴。
CNNIC數據就顯示,截至2020年12月,我國網絡視頻用戶規模達9.27億,較2020年3月增長7633萬,占網民整體的93.7%。其中短視頻用戶規模為8.73億,較2020年3月增長1.00億,占網民整體的88.3%。視頻化表達將成為接下來內容領域的重要方向,這一點早在業內達成共識。
視頻需求的井噴,一方面意味著視頻的形式,可以降低專業內容的受眾門檻,吸引更多大眾用戶;而另一方面,意味著用戶對答案直觀、有效信息的搜索追求、體驗需求與日俱增,這同樣是一場不輸于短視頻崛起的變革。
視頻搜索有著和短視頻技術融合的天然性。無論是國外的YouTube,還是國內的抖音,都早已經搭建好了基礎的搜索架構,能通過對算法的提高,和搜索引擎技術相融合,去改善搜索質量和搜索體驗——抖音崛起過程中,備受推崇的核心技術正是基于智能推薦引擎。
從技術角度而言,以用戶興趣推薦驅動搜索,其結果會更加個性化、精準化。這意味著,在進行視頻搜索時,搜索結果相比圖文搜索的內容豐富度、匹配準確度有了相當大提升(這也是搜索的兩大核心需求重點),用戶體驗會更好。這也是視頻搜索,與傳統搜索最大的區別。
比如,在抖音搜索“紅燒肉”,縱向信息流里是推薦與“紅燒肉”相關的熱門視頻和頭部主播視頻,“紅燒肉”的話題入口等。橫軸上則提供“視頻”、“直播”和“商品”等一些細分入口。
這就是視頻搜索的最大好處,不用高度抽象的文字、不用靜態的圖片,通過短短幾分鐘直觀視頻,一種接近于人和人之間的真實溝通交流,照葫蘆畫瓢就能燒出一份紅燒肉。從創作者角度來說,這樣的搜索算法,也降低了內容競爭門檻,提高內容曝光,增加粉絲黏性。
某種程度上,這正是YouTube成為全球最大短視頻平臺的同時,也早在2008年就成為全球第二大搜索引擎的關鍵原因——注意,YouTube的基礎設施,是搜索引擎而不是社區。
抖音也是同樣如此。2018年5月,抖音上線了第一個搜索入口,不到三年的時間,抖音視頻搜索的月活就達到5.5億。這個數字,甚至超過百度APP在2020年9月份的月活數據5.44億。
對抖音來說,視頻搜索能在三年內時間里就達到5.5億日活,與推薦形成互補,其空間可以想象。由此可以理解,為何視頻搜索會成為抖音在2021年,甚至更長未來大力發展的重要戰略級動作。
和通用搜索全網檢索結果不同,視頻搜索難度顯然更大。比如,內容豐富度的前提,是平臺自身儲備有內容池,才能快速找出并推薦用戶想要的內容。而匹配精準度,則依賴于平臺對更豐富視頻內容的理解。
事實上,無論是YouTube,還是抖音,目前距離終極形態的“視頻檢索”,也就是視頻語義層面的多模態檢索,都還有一段距離——目前的視頻搜索,仍比較依賴文本檢索,通過關鍵詞匹配視頻的標題、介紹、關鍵詞、以及字幕信息(OCR),得到答案。
字節跳動CEO張楠承認:“把視頻搜索做好很難?!钡詫σ曨l搜索寄予厚望。張楠表示,如果抖音希望成為人類文明的視頻版百科全書,那視頻搜索就將是這部書的索引,是尋找答案,收獲新知的入口。
現階段看,作為一種全新搜索方式,視頻搜索目前與圖文搜索仍是互為補充階段,無論是今日頭條發力搜索,還是微信對話框全量上線搜一搜功能,可以看出通用搜索仍是當前搜索領域競爭重點。
但在不久的未來,伴隨文明信息載體的演變,視頻和圖文需求的此消彼長,視頻搜索趨勢同樣無法逆轉,注定會成為更多互聯網巨頭又一個爭奪的戰場——到那時,視頻搜索,也就會凸顯出它的更大價值所在。
作者:楊銘,編輯:黃槍槍
本文由 @極點商業? 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Pexels,基于 CC0 協議
不知道什么時候開始收集瀏覽器百度一些內容,強制要求你下載百度知道APP,才能獲得。隨著越來越多的不同大類的APP出現,遇事不決,真的不在問度娘。作為一個二次元,看一些番,上國內幾個站或者FQ;看一些視頻,有專門視頻播放APP;想知道一些熱點事情,微博熱搜;想了解一些知識,B站有很多這種視頻。后來仔細想想,現在搜索步入,每個人都想獲取認知,但是每個人也在釋放自己的認知,信息搜索逐漸的去中心化。越來越多的平臺,像抖音、B站、微博已經分割很多搜索渠道。