微信搜一搜邁出新的一步,好戲來了
從曾經的黃頁到現在的算法推薦,我們雖然觸達更多的信息,但是并非一定是質量更高的信息。搜索市場有著龐大的流量池,這是無法抵御的巨大誘惑。微信搜一搜的動作可能正是未來搜索引擎的發展方向,各家搜索發力,也許正在醞釀一場大戰。
01
信息不對稱,是這個時代的核心競爭力之一。
一件事情如果我知道,你不知道,競爭的時候你就必然會面臨劣勢,乃至被收割。所以信息收集和整理的能力,是這個信息爆炸的年代中最重要的能力之一。
過去我們面臨的問題是信息不夠多,找不到;現在我們面臨的問題是垃圾信息太多,有效信息和垃圾放在一起。
很多人問我最常用的收集資料的工具是什么?
其實答案是不唯一的,因為我都是針對要收集的資料的特性,來選擇匹配工具,不同工具對應的內容方向是不一樣的。
如果找深度的內容,除了用學術論文搜索之外,我用的最多的是大家平時了解不多的東西,微信搜一搜。
搜一搜這個東西一直被當成微信上的一個附屬功能,很多人都用過,但是未必了解,這個產品在我眼中屬于是非常高效的搜索引擎。
舉個例子,醫療。
我用搜一搜搜 “頭痛”這個關鍵詞, 它會告訴你,這個內容交給了某市某醫院的具體哪個醫生評審,而且是評審通過了的。
這個標注看起來就是非常小的一行字,也沒有重點突出。但是從信息上講,這個信息的來源是透明的,并且是由專業人士提供的,這就決定了這個信息大概率是可以相信的。信息檢索的一大常識是,如果不知道來源和統計源,這個信息是不能被完全相信的。
把搜出來的每一條健康信息都歸責到具體的人,是一件很麻煩、很復雜的事情,但是對搜索引擎很重要。
信息在可信的前提下,才有意義。
其他搜索引擎當然也可以搜健康信息,但是互聯網上的共識,就是醫療“移不動”,健康信息并不推薦完全使用搜索引擎,這屬于常識。
搜索引擎的信息可信度問題一直是一個毒瘤,以健康領域舉例。
搜索引擎和健康聯系起來,最大的隱患就是一般的搜索引擎沒有能力去識別醫療信息的真假,所以既不能給正確的知識提供專業醫生的背書,也不能篩掉灰產的偽醫療偽科普。
搜一搜給出的解法很簡單粗暴。
1)規范化搜索結果
直接在搜索結果上給到具體醫生鑒定的溯源信息,并保證相關醫師可以在醫院官網查詢驗證。這就在最大程度上,拉近了搜索引擎上獲得的信息,和線下去醫院里從醫生那里獲取的信息,二者在專業程度上的差距。
2)直接提供在線掛號服務
這就讓用戶不同以往的可以更便捷掛號,最終走向都是在把用戶導向規范的線下醫院,而不是作為一種牟利的渠道。
對于掌握了流量和內容分發的搜索引擎來說,這種自我規制和審慎非常重要,這不但是在保護用戶,也是在保護自身。
嚴格來說,一個搜索引擎沒有必要去做這樣的事情,搜索引擎只提供爬蟲不提供鑒別是業內公認的規則,但是做了這樣的事情,其實會對用戶更負責一些。
用戶的搜索行為得到的結果,不僅僅是“信息”,還可以是“服務”,甚至是為用戶量身定做的服務(一對一咨詢醫生)。
并且把這一功能集合在微信這種國民APP上,背后是微信的棋局。
使用搜索引擎激活存量資源,形成更大的協同生態。
人無我有,人有我優,人優我便利。
不僅僅是技術的問題,更是思路上的差異。
02
搜索引擎這個東西并不新鮮。
我們一般把搜索引擎分成四代,導航網站(黃頁模式)是第一代,給你什么你看什么。
提供最簡單的文本檢索功能的是第二代,人們可以簡單錄入自己的需求內容,但是受限于網站的內部數據庫。在第二代的后期,搜索引擎解決了內部數據庫問題,使用爬蟲來爬公域信息,理論上數據庫是無限的。
我們最常用的,其實是第二代搜索引擎。
從第三代開始,搜索引擎開始去預測用戶的意圖和習慣,在搜索結果中插入高亮信息。這些信息可以是搜索引擎認為更有效的資料,也可以是廣告。
前三代搜索引擎主打的都是圍繞廠商端的需求。
第四代搜索引擎是基于移動互聯網出現的用戶中心時代,最大的特點就是搜索的私人化,依據對用戶的了解,從搜索方式,搜索類型乃至搜索結果,都要往千人千面上靠。
搜索引擎的歷史不算長,但是技術躍遷得非???。
雖然給用戶帶來更便利的內容分發體驗這個核心邏輯沒有變過,但是在搜索引擎的進步過程中,也產生了很多非常有意思的技術原理,甚至和道德、法律、社會公序良俗相關。
首先是爬蟲技術。
網站其實并不歡迎私人的爬蟲,因為爬蟲的訪問量會增加網站負擔,但是又無法帶來真人流量。
所以現在很多網站都設置有驗證碼,就是為了確保訪問請求都來自真人用戶。
但是網站對搜索引擎的爬蟲是非常歡迎并且來者不拒的,被搜索引擎爬取并且收錄可以增加網站的曝光,甚至對于很多缺乏冷啟動的小網站來說,被搜索引擎爬出來,就是它們唯一能得到流量的渠道了。
搜索引擎的爬蟲技術其實沒什么好講的,不管技術好壞,最后都能爬出來,區別只在于爬取過程中的技術代價以及效率。
但是爬取+收錄這個行為就出現了騷操作了,有一家自己不做搜索引擎但是專門給其他公司提供搜索技術的公司,叫inktomi。這是互聯網早期非常重要的一家搜索引擎技術提供商,而它把自己作死的原因,是inktomi開始要求網站付費才能被受錄。
實際上搜索引擎的搜索結果就是它為用戶提供的商品,網站被收錄,獲得流量,搜索引擎收錄網站,獲得更多內容,本來是雙贏的一件事情。
如果要求一方給錢,性質就變了。
后來的雅虎和Google就是因為免費策略而大獲成功。
搜索引擎很賺錢,但過度追求金錢,最后必然會帶來失敗,這是搜索引擎的第一個教訓。
再比如搜索結果的排名機制,也歷經過非常有趣的演變。
二代搜索引擎的排名機制和爬取機制是一體的,用的都是一些信息檢索模型,比如布爾模型,概率模型或者向量空間模型。
這種機制下,其實不存在排名問題,因為返還給用戶的直接就是一個鏈接清單,里面會夾雜大量用戶不關心的鏈接,用戶必須一條條全部看完才能找到自己需要的內容。
到了第三代搜索引擎,就把鏈接清單給取消了,以搜索界面的形式展現搜索結果,也就是我們現在看到的大多數搜索引擎。
問題在于,在這個界面里,哪個搜索結果應該排在前面,哪個應該排在后面,這會直接影響到搜索結果的曝光度。
當時的各個搜索引擎,用過不同的邏輯去判斷這個問題。
比如有一個早期的搜索引擎叫Direct Hit,排名機制主要靠搜索結果的用戶點擊率來決定。
在一開始,這種方法的確提高了用戶看到優質搜索結果的可能性,Direct Hit也因此流行一時。
但是很快,就出現了利用機制漏洞刷點擊率提高搜索位次的作弊者,搜索質量也隨之大幅度下降。
這種情況其實和現在一些騙點擊率的標題黨,在邏輯上非常相似,只不過標題黨更多的是針對推薦機制。
這是搜索引擎收獲的第二個教訓,并不是人多就代表正確。
其實排名機制本身是可以通過技術來達到一個比較好的效果的,比如Google就是通過大規模矩陣計算來判斷網頁價值和網頁可信度的。
在這個時代的信息洪流下,Google每次檢索排名都需要動輒完成十億量級的矩陣計算,甚至一度陷入了計算力的瓶頸,最后還是用分布式計算的方法,解決了計算力的問題。
這些公司之所以用各種方法去調整搜索引擎的排名機制,固然是為了在競爭中占據優勢,但是另一方面,也是因為排名機制的重要性。
不同的排名機制,會決定用戶從搜索引擎上獲取的信息,而信息的本質是思想。
思想的力量是很難衡量的。
搜索引擎在互聯網上搜索出來的結果,以及搜索結果的排名,都可以直接影響到用戶在現實中的決策。
某種意義上,搜索引擎是一個可以左右用戶命運的產品。
03
我們常說技術沒有價值觀,這是對的,但不全對。因為很多面向人們剛需的技術,就是需要價值觀來引導。尤其是搜索引擎,龐大的流量,是一座金礦。
1998年2月21日,后來改名為Overturn的搜索引擎GoTo想出了一個“天才”的操作。
它開始出售搜索結果排名,誰付的錢多,就可以指定誰排在前面。
這個決定讓GoTo飽受非議,社會輿論的主要焦點就在于GoTo有沒有充分的資質去審核那些愿意付費的機構甚至個人。
如果沒有嚴格的準入機制,那么這不僅僅是打廣告的問題,而會把搜索引擎變成一個只需要花錢就可以驅策的作惡工具。
在輿論的壓力下,GoTo把Pay For Placement服務加上嚴格的重重限制。
道德初步贏了金錢。
當時的社會是普遍樂觀的,認為搜索引擎以后會越發重視社會基本道德。
但是事情并不如人所愿,隨著時間推移,這個付費排名后來還被發展為了更“天才”的競價排名,徹底打開了潘多拉的魔盒。
其實現在的搜索引擎面臨的問題,在搜索引擎發展的早期就已經有無數個死去了的搜索引擎產品踩過坑了。
太陽底下沒有新鮮事。
作為一個能夠大幅度影響人的產品,那么到底怎么使用,就非??简瀮r值觀,企業在制定盈利策略的時候,是把用戶當一個個活生生的人來看,還是僅僅把用戶當可以變現的“流量”來看,會直接決定企業的所作所為。
微信搜一搜搞的“問醫生”服務,去做提供責任到人的健康信息搜索,這些東西幾乎沒有經濟效益,反而還要花大量的成本投入。
但是本質上,這不是一筆經濟賬。
在排除了一切利益考量后,去主動承擔社會責任,這就是手握搜索引擎這種產品的公司,必須做出的選擇。
其實,搜索引擎最合適的定位不是單純作為一種盈利產品,而是作為優質內容矩陣的串聯者,Google是這么做的,微信也是這么做的。
直接用搜索引擎變現,就和賣原材料一樣,永遠處在產業鏈的下游。
搜索引擎需要有社會責任感,流量也需要有更聰明的用法。
更何況在這個存量時代下,哪家的流量資源都不多。
誰能做好搜索引擎這個流量入口,誰就能灌溉好自己的一畝三分地,甚至去接濟別人的水源。
04
搜索引擎的核心痛點是什么?是效率,沒有其他。搜索引擎的迭代其實就是效率迭代。
世界上第一個web搜索引擎,是World wide Web Wanderer,只能搜集網址,沒有跳轉功能,你得自己知道網址,背下來,輸進去,才行。
所以很快就被淘汰了。
往后出現的搜索引擎,一步步往便利的方向走。
先是ALIWEB增加了索引文件元信息的功能,也就是可以搜標題和標簽了,接著第一個全文搜索引擎WebCrawler出現了,只需要輸入全部文件內容中的一部分關鍵詞,就可以獲得整個文件信息,并且跳轉到所在的網頁。
對當時沒幾個人上網,網上也沒多少內容的狀況來說,這些原始的搜索引擎同樣也夠用了。
不光是Woeld wide Web Wanderer,包括早期的Yahoo!甚至都不是嚴格意義上的“搜索”引擎,而是人工編輯的網站目錄,也就是第一代的搜索引擎,黃頁模式。
當時Yahoo!成長得非???,因為人工編輯可以保證信息質量,而只要人手忙得過來,其實對用戶還是很方便的。
從搜索引擎早期的變化里,可以看出來,搜索引擎的原理本質其實是內容的分發。
后續的所有技術升級,都是因為互聯網上的數據已經太龐大了,人工分發不過來,才需要技術來代替人工。但這是因為搜索引擎自身需要,而不是用戶需要。
當用戶數量少,內容基數小的時候,其實并不需要搜索引擎,或者說只需要窮舉就好了。
早期的內容分發可以是非常粗略的,用戶可以自己去瀏覽分類信息。
而當用戶的需求和有可能滿足這些需求的內容都達到了億級,搜索引擎是不可能靠人工來分發這么龐大的信息量的,只有技術,才能把這些內容更高效地分發給需要的人。
而技術,有效率,但沒有價值觀。
如果只從信息的平均質量上來看,現在一個首頁的前幾條被競價排名的搜索結果占據,后幾條被摸清了搜索引擎算法的洗稿自媒體占領的搜索引擎,其實很可能還不如1994年的雅虎。
現在市場上主流的搜索引擎,在技術上其實都大同小異,原理上也沒有差距。
在技術之外,為什么用戶仍然會去選擇不同的搜索引擎?搜索引擎未來的差異化競爭,到底應該差異在哪里?
答案還是效率。
搜索引擎的迭代,本質上是效率的迭代,是給用戶帶來的便利程度的不斷突破。
很多人以為搜索引擎的軟肋是廣告,其實廣告并不是核心問題。
沒有廣告,但是也找不到有用信息的搜索引擎,同樣是不合格的。
搜索引擎真正的核心,在于幫助用戶高效的解決問題。
而現在要進一步提高用戶效率,幫助用戶解決問題,需要的其實已經不是技術上的提升了,現在的技術已經夠用了。
爬蟲技術,數據儲存技術,這些技術在當代都已經點到了溢出。
用戶并不需要億級別的信息全部呈現給他,而且事實上世面上任何一個搜索引擎,對互聯網內容的抓取都不會超過30%,但是任何一個搜索引擎的主要問題都不會是搜到的信息不夠多。
我們去搜索那些關鍵詞的時候,我們真的需要幾億個結果嗎?
我們真的會把搜索頁面翻到幾千頁以后嗎?
當然不會。
所以搜索引擎的下一個突破點也并不是技術。
不同搜索引擎的抓取內容本來也就不一樣,兩個主流搜索引擎之間至少有70%的抓取內容是不同的。在達到一定數量級后,信息的多少就已經并不重要。
因為在搜索引擎上,同一個寬泛的用戶需求,永遠有無數同位替代品。
大家需要的是,高效的,精準的,有用的東西。
只有和用戶自身強相關的搜索,需要的結果才是確鑿無疑、獨一無二的。
這就是微信搜一搜的核心機會。
這個年代,比的反而是誰底子厚。
05
搜一搜好用,本質上是背后的數據壁壘深不見底。我寫文章的時候經常會需要搜集資料,很多時候我要的不是一個有具體指向的結果,而是圍繞關鍵詞的一系列信息。這個時候信息質量非常重要。
不管用哪一家的搜索引擎,我都能搜到非常多的搜索結果,但是如果搜到的內容質量不高,我提煉起來就會非常痛苦。
我這里引入一個概念,“信息噪音”。搜索引擎給到你的一系列搜索結果里,絕大部分都是信息噪音,這種噪音是目前的技術很難解決的。
技術可以判斷搜索結果和你的需求是否強相關,但是很難判斷搜索結果的信息是否高質量。
一個最簡單的例子,當搜索引擎去全網抓取信息的時候,你就不得不面臨某些自媒體批量洗稿生產出來的“信息噪音”。
這些東西可能都出自同一個和你的需求強相關的內容,但是在被洗了幾百次以后,如果它們還擁擠在搜索引擎給到的結果頁上,就只能浪費用戶的時間和生命。
對于那些強相關但是質量不過關的內容,目前只有具有一定知識水平甚至審美水平的人工審查才能分辨。
早期的搜索引擎,就是通過網站的編輯,對搜索結果一條條人工復審來降噪。
但是在這個時代,沒有任何一個搜索引擎能夠雇傭這么多人來排查所有抓取的數據。
所以我寫文章的時候,都是用微信自帶的搜一搜來查資料。這個時候搜一搜的內容來源,就成為了一個非常核心的優勢。
它的資源主要來源于公眾號。
每一個微信公眾號的創作者,都相當于早期搜索引擎的人工編輯,在用他們的整合能力甚至創作能力,為搜一搜這個搜索引擎源源不斷地提供高質量的、而且在實時更新的可抓取資源。
為什么說搜一搜是搜索引擎plus,除了之前講到的在用戶中心層面上的突破,就在于搜一搜的搜索結果都是已經經過了人為篩選過的。
并且篩選者的水平不差。無論是公眾號還是知乎,都是中文領域最高質量的內容聚合。微信公眾號體系特有的原創標識,更是甩開批量洗稿幾百米,我搜出來的每一個結果背后,都可能是一群文字專家的心血。
在這種模式下,搜一搜獲取高質量信息的頻率和概率,都遠超純粹技術驅動的搜索引擎。
因為在這個搜索引擎的入口背后,是微信建立起來的龐大的內容生態。
尤其是搜一搜的內容來源,其實是半開放式的。搜一搜一直在引入新的靠譜的平臺,現在不但可以搜微信公眾號文章,還接入了像知乎這樣的外部信息源。在不同的專業領域,也都在尋找該領域最專業的內容供應平臺進行合作。
比如在健康領域,就接入了騰訊醫典和企鵝醫生,比起那些一搜關鍵詞就把用戶鏈接到幾百個不同的小醫療信息平臺的搜索引擎,搜一搜明顯是一個內容來源“出圈”,并且內容更優化、質量更可信的信息搜索來源。
搜一搜背后的3000萬公眾號資源,以及整個知乎沉淀下來的深度內容,這些資源已經足夠豐富了。
或許它們沒有去全網抓取信息的搜索引擎那么豐富,但是用戶搜索的目的本身也不是要豐富,他們要的應該是精準,深度,有效地解決問題。
比起廣撒網,在互聯網這片信息之海中,搜索引擎更需要修煉的,是點對點捕魚的能力,這個能力背后,是數據儲備。
這才是搜索引擎在第四個時代里,真正的核心競爭力。
或者說得再直白一點,搜一搜好用,本質上在于微信,在于這個有十一億用戶,已經聚合了N種生活服務,并且還可以通過搭載小程序來完成幾乎任何服務的,一個龐大而不斷自完善的生態。
搜索引擎單獨拿出來不是大殺器,搜索引擎帶來的存量資源激活才是。
06
所以發現了么?為什么微信要在這個時候開始發力搜一搜?隨著存量市場的競爭進一步激烈化,搜索引擎的重要性也會進一步凸顯。存量市場下,誰能激活自己的存量資源,誰就能贏。
還在用增量市場思維模式燒錢的企業,要死。
把搜索引擎做好的目的,不是用搜索引擎賺錢,而是為整個商業模式和存量資源做好服務。
這是真正屬于大公司的戰場,考驗的絕不僅是搜索引擎本身。
而是搜索引擎背后的東西。
各家近期都在發力搜索引擎的背后,也是基于這樣的邏輯。
阿里的夸克,頭條的搜索,再加上微信的搜一搜。
新格局,要開始了。
作者:半佛仙人;作者公眾號:半佛仙人(ID:banfoSB)
來源:https://mp.weixin.qq.com/s/xgb3DWw6GQ3B5Dm1DvjTqA
本文由 @半佛仙人 授權發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
專欄作家
廖爾摩斯,微信公眾號:設計大偵探,人人都是產品經理專欄作家。連續創業者,目標是成為全世界拆解產品設計最多的設計師。
本文原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
厲害了我的哥,分析的很透徹,我也有這個想法,就是表達不出來,看了你的文章,驚為天人啊
搜一搜將是搜索引擎中的一出好戲,除了百度,我司已經布局。早起的鳥兒有蟲吃。
百度一生黑
頭像是GIF,太可愛了叭! ??