為什么大多數(shù)公司做不好搜索引擎?
編輯導(dǎo)讀:搜索引擎,在信息龐大數(shù)據(jù)冗雜的網(wǎng)絡(luò)中,起到了篩選器的作用。人們通過(guò)使用搜索功能,可以獲得自己想要的內(nèi)容,屏蔽掉無(wú)用的信息。但互聯(lián)網(wǎng)發(fā)展這么多年,能做好搜索引擎的也沒幾家公司,這是為什么呢?本文作者對(duì)這背后的原因展開了分析探究,與大家分享。
01
在這個(gè)信息大爆炸的世界,一個(gè)人對(duì)熱點(diǎn)信息的響應(yīng)程度,一定程度上決定了他的受歡迎程度。
畢竟,人人都想有一個(gè)江湖百曉生那樣的朋友,更想自己也成為這樣受歡迎的人。
信息搜集和整理的能力,一定程度上取決于用了什么搜索工具。
過(guò)去我們的搜索,靠的是搜索引擎?,F(xiàn)在的搜索,是萬(wàn)物皆可引擎。
我們用微博搜明星,用淘寶搜商品,用豆瓣搜書、搜八卦,搜索引擎已然成為了我們生活中的一部分,成為我們搶占熱點(diǎn)信息、不脫節(jié)的社交工具,更是成為了我們網(wǎng)絡(luò)生活的全部。
我們需要用搜索對(duì)抗不知道外面在發(fā)生什么的焦慮,需要它來(lái)證實(shí)我們的猜測(cè),好尋找心理認(rèn)同,證明我們沒有社交冷場(chǎng)。
舉個(gè)不恰當(dāng)?shù)睦?,哪怕發(fā)生了地震,我們的第一反應(yīng)可能都不是逃生,而是打開手機(jī),搜索“地震”,看看它有沒有上熱搜。
那么問(wèn)題來(lái)了,我們的這種搜索真的能找到“真相”嗎?
很多人并沒有可靠途徑來(lái)確保自己所查閱的信息是否真實(shí)和權(quán)威,所以這種搜索有可能引發(fā)群體性的“信息從眾”,人云亦云。
從海量資訊中甄別信息真?zhèn)危敲總€(gè)網(wǎng)民的困境,也是所有搜索引擎正在面臨的挑戰(zhàn)。
我們的問(wèn)題不是信息不夠多,而是太多。
02
判斷一個(gè)搜索引擎好不好用,主要看三方面。
第一,高效。
第二,精準(zhǔn)。
第三,穩(wěn)定。
說(shuō)白了就是看它能不能讓用戶高效地獲取正確信息的問(wèn)題,這是市面上所有搜索引擎的痛點(diǎn)。
此外,搜索引擎還存在一些問(wèn)題。
我們常說(shuō)獲取信息,有兩種方式:一種主動(dòng)獲取,一種是被動(dòng)接受。
如今,想要主動(dòng)去獲取信息,已然是一種越來(lái)越稀缺的獨(dú)立思考能力。
很多人雖然接受了信息檢索的訓(xùn)練,但架不住現(xiàn)在網(wǎng)絡(luò)平臺(tái)的智能算法和推送能力大法好,導(dǎo)致了信息繭房的存在,大家需要花更多的時(shí)間精力去濾篩選信息。
這就增加了主動(dòng)搜索的不確定的風(fēng)險(xiǎn),搜不搜得到,以及可能會(huì)搜到什么內(nèi)容非常不可控。
很多青少年甚至中老年人,前者缺乏一定的生活經(jīng)驗(yàn),后者欠缺必要的信息篩選訓(xùn)練。這兩類人非常容易成為互聯(lián)網(wǎng)詐騙的重災(zāi)區(qū)。
發(fā)現(xiàn)沒,信息匱乏是個(gè)大問(wèn)題,但信息大爆炸又帶來(lái)了虛假信息難以辨別的問(wèn)題。
相比之下,被動(dòng)接受就要輕松得多,這種經(jīng)由大數(shù)據(jù)處理之后的自動(dòng)分發(fā)模式,讓用戶甚至不需要做什么,想看的東西自己就會(huì)冒出來(lái)。
不過(guò)這種被動(dòng)接受并不意味著用戶就可以選擇躺平不動(dòng)。事實(shí)上,絕大多數(shù)這種自動(dòng)出現(xiàn)的信息都是無(wú)效無(wú)聊的,想要從中挑出一點(diǎn)有效信息,時(shí)間成本過(guò)高,回報(bào)過(guò)少。
甚至屢屢被爆出的數(shù)據(jù)泄露事件與謠言危機(jī),在這種被動(dòng)接受機(jī)制下很難得到有效地凈化。
想成為合格的網(wǎng)上沖浪選手,用戶必須要培養(yǎng)自己辨別篩選信息的能力,養(yǎng)成主動(dòng)獲取信息的習(xí)慣。
反過(guò)來(lái)從搜索引擎自身來(lái)說(shuō),這二十多年來(lái),它能提供的服務(wù)已經(jīng)越來(lái)越無(wú)法滿足人們?cè)谒槠臅r(shí)間中快速尋求答案的需求。
以及“搜索引擎”商業(yè)化進(jìn)程中不可避免誕生的競(jìng)價(jià)推廣,關(guān)鍵詞優(yōu)化模式,用戶根本分不清,自己搜到的是不是廣告。
就說(shuō)牛老師吧,他前幾天感冒,感覺腮下淋巴結(jié)有點(diǎn)腫,他是隨手搜了一下,卻差點(diǎn)給我嚇尿了,結(jié)果竟然顯示說(shuō)他這可能是艾滋的癥狀。
這個(gè)搜索引擎太不準(zhǔn)了。
按照牛老師的生活習(xí)慣,應(yīng)該把“可能”去掉,這個(gè)引擎還需要進(jìn)步。
這恰好也說(shuō)明了,搜索的精準(zhǔn)率是一種剛需。
并且,搜索引擎所提供的這個(gè)答案,不應(yīng)該只有正確答案的告知。搜索引擎應(yīng)該意識(shí)到,用戶的每分每秒都是黃金時(shí)間,經(jīng)不起一點(diǎn)浪費(fèi)。
它需要做的遠(yuǎn)比現(xiàn)在可以實(shí)現(xiàn)的更多,比如說(shuō)幫助用戶一步到位地解決問(wèn)題,告知他們用什么手段解決以及在哪里解決。
但顯然,這條路并不好走。
03
是當(dāng)前存在難以攻克的技術(shù)難題嗎?
是,但也不是。
搜索引擎本質(zhì)上是一種信息獲取方式。
理想情況下,對(duì)一套搜索引擎來(lái)說(shuō),它本身存儲(chǔ)的信息當(dāng)然是越全越好。
這就意味著,首先它需要靠爬蟲技術(shù)爬取全網(wǎng)內(nèi)容,并且有一套自己的清洗機(jī)制數(shù)據(jù)的能力,在對(duì)這些原始信息進(jìn)行必要的處理后,建立自己的資料庫(kù)或者說(shuō)自己的大數(shù)據(jù)中心。
其次是構(gòu)建索引環(huán)節(jié),這相當(dāng)于給每一個(gè)內(nèi)容添加目錄,便于搜索引擎根據(jù)用戶的查詢?cè)~來(lái)進(jìn)行數(shù)據(jù)庫(kù)檢索。這就涉及到一個(gè)排列機(jī)制的問(wèn)題,需要用到用戶查詢內(nèi)容與網(wǎng)頁(yè)內(nèi)容的相關(guān)性分析、網(wǎng)頁(yè)質(zhì)量評(píng)價(jià)等技術(shù)。
盡管市面上所有的搜索引擎具體實(shí)現(xiàn)方式有差異,但所有的搜索服務(wù)的核心都是資料庫(kù)+排列機(jī)制。
技術(shù)有差異,但是原理上基本沒差別。
如果說(shuō)資料庫(kù)決定了搜索引擎的上限,那排列機(jī)制則決定有多接近上限。
答案很簡(jiǎn)單,排列機(jī)制直接跟效率掛鉤。
不同的排列機(jī)制,直接決定用戶第一眼看到什么信息,繼而影響到他們的現(xiàn)實(shí)決策。
可見,效率才是搜索引擎的生死棋,也是影響用戶執(zhí)行的大殺器。
所以說(shuō)下一個(gè)階段,搜索引擎賽道上需要比拼的,已經(jīng)不是數(shù)據(jù)的抓取技術(shù)、更不是數(shù)據(jù)存儲(chǔ)。
在這個(gè)9塊9就能學(xué)Python爬蟲的大環(huán)境里,大家更看重的并不是真正的大千世界,而是那個(gè)跟自己有關(guān)系的世界。
現(xiàn)在搜索引擎需要做的,就是去理解用戶真正想要的是什么。
并且在最短最快的時(shí)間里,給到他們最直接有效,獨(dú)一無(wú)二的正確答案。
就像關(guān)于學(xué)Python,我會(huì)告訴你,善用搜索,不要錢。
04
引擎和信息的痛點(diǎn),恰好給了“微信搜一搜”一個(gè)證明自己的機(jī)會(huì)。
生活中,很多人會(huì)忽略“微信搜一搜”是個(gè)搜索引擎,因?yàn)榇蠹腋?xí)慣性地把它當(dāng)成微信的一個(gè)小技能。
蟄伏許久,現(xiàn)在終于輪到它發(fā)力,成為某種意義上的“答案引擎”了。
別的不提,光從便捷性上說(shuō),當(dāng)你想在微信范圍內(nèi)搜索任何東西的時(shí)候,你是不需要滑出微信的界面的。
無(wú)論是搜文字還是圖片,你只需要選中,然后點(diǎn)搜一搜就行了。甚至你可以通過(guò)“掃一掃”功能,進(jìn)行識(shí)物,拍照進(jìn)行翻譯。
搜一搜這么好用,自然繞不開它背后的微信。
我們都知道微信的資源分布很廣,光是公眾號(hào)一塊的資源,背后信息沉淀就已經(jīng)足夠龐大。
而且,不同于市場(chǎng)上其他搜索引擎單純的數(shù)據(jù)抓、人為操縱的算法編輯,公眾號(hào)最突出的特點(diǎn)是,每一個(gè)號(hào)背后的創(chuàng)作者都是一個(gè)個(gè)活生生的人。
他們?cè)丛床粩嗟膭?chuàng)作力,對(duì)信息的消化分解與再次整合能力,不斷地信息知識(shí)迭代能力,都為搜一搜的整個(gè)搜索引擎系統(tǒng)及時(shí)地補(bǔ)充時(shí)效快,質(zhì)量?jī)?yōu)的資源。
除此之外,搜一搜的搜索結(jié)果充分顯示了人工篩選邏輯的力量。
第一,量化搜索結(jié)果。
每當(dāng)用戶在搜一搜上搜索一個(gè)東西的時(shí)候,結(jié)果展示中精選留言的數(shù)量、閱讀數(shù)據(jù)、以及是否關(guān)注,都是會(huì)被量化展示的。
大家都喜歡用腳投票,一眼就能看出哪個(gè)答案呼聲更旺,更得人心,從而避免了在大量的無(wú)效信息中摸索,減少篩選成本,提高搜索效率。
第二,規(guī)范化決策流程。
無(wú)論用戶在搜一搜上搜索什么,搜索結(jié)果永遠(yuǎn)存在一個(gè)執(zhí)行優(yōu)先級(jí)的排列。
比如,搜索買票、就醫(yī)這種,它給到的第一條信息,已經(jīng)考慮到了用戶有可能要做的決策,甚至足夠承接他接下來(lái)的執(zhí)行行為。
然后才是更大范圍地搜索結(jié)果展現(xiàn),以及細(xì)致的聯(lián)想搜索拓展,從而幫助用戶從更多的角度去思考決策。
05
在這種模式之下,追逐技術(shù)抓取并不是搜一搜做搜索引擎的核心,而是找到一套更為有效的方式去解決獲取高質(zhì)量信息的頻率和概率的問(wèn)題。
想要練就這種數(shù)據(jù)力量,僅靠一家公司去做數(shù)據(jù)抓取根本做不到,需要整個(gè)互聯(lián)網(wǎng)的集體共創(chuàng)才能實(shí)現(xiàn)。
這意味著,我們看到的搜一搜還只是一個(gè)入口,在它背后真正站著的是微信建立起來(lái)的內(nèi)容生態(tài)圈。
其實(shí)從搜一搜的內(nèi)容來(lái)源就能看出來(lái),除了微信公眾號(hào)文章,它還接駁了海量的創(chuàng)作平臺(tái)和外部信息源,用戶完全可以把搜一搜當(dāng)成跳板,從這里直接找到內(nèi)容更加專業(yè),更加優(yōu)質(zhì)的外部信息。
對(duì)搜一搜來(lái)說(shuō),這個(gè)口子既是對(duì)外也是對(duì)內(nèi)。
對(duì)外,它需要保持更開放地心態(tài),去合作更多靠譜的信息平臺(tái)伙伴。
對(duì)內(nèi),微信,這個(gè)有十一億用戶,并且一直在持續(xù)壯大中的生態(tài),每天都在產(chǎn)生和沉淀海量的信息內(nèi)容。
搜一搜需要做的,并不是一味地追逐這種無(wú)窮無(wú)盡地信息瀚海,而是想方設(shè)法地讓這些信息資源在流動(dòng)中不斷被激活。
最后回應(yīng)給用戶的搜索結(jié)果,不是量大,而是精準(zhǔn)。
現(xiàn)在,搜一搜還需要做的,是更大力地撕開這個(gè)生態(tài)的口子,讓更多的個(gè)人帶著他們的搜索習(xí)慣和模式,參與到信息流動(dòng)中。
這是一種借力打力,四兩撥千斤的做法。
06
隨著存量市場(chǎng)的競(jìng)爭(zhēng)越來(lái)越進(jìn)入到白熱化的狀態(tài),做好一款搜索引擎的意義絕對(duì)不是收割更多的用戶,靠他們賺錢,這套商業(yè)模式已經(jīng)過(guò)時(shí)了。
直白地說(shuō),我們所描述的搜一搜背后的十一億微信用戶甚至幾十億相關(guān)用戶深不見底的數(shù)據(jù)本身,是人們的生活,是大家在衣食住行的需求,在情緒上的求安慰,求鼓勵(lì),甚至是在迷惘中的求指引、求寬慰。
搜一搜存在的意義,無(wú)非是以這樣的形式,架設(shè)起一個(gè)橋梁,讓生活對(duì)接更廣泛的生活。
從這個(gè)角度說(shuō),搜一搜只是一個(gè)工具,是生活中的人用它進(jìn)行搜索,看到了更大的生活,這是一個(gè)眾生見眾生的過(guò)程。
懂事的公司都明白,工具的宿命就是為人服務(wù)。
同理,沒有一家公司可以底氣十足地說(shuō)它創(chuàng)造發(fā)明出了一款偉大的工具。
所有的偉大都是背后的不起眼的,被欲望支配的,但也在不斷進(jìn)行著自我克制的蕓蕓眾生。
這也是搜索引擎背后真正站的東西,尊重。
無(wú)非是尊重用戶的選擇,用戶的想法,用戶的好奇。
這就跟盲猜哪把鑰匙能開鎖一樣,往往是最不起眼的那一把鑰匙,打開了鎖。
作者:半佛仙人;公眾號(hào):半佛仙人(ID:banfoSB)
來(lái)源:https://mp.weixin.qq.com/s/2Du9dktJpX9ntll-jnkpVQ
本文由 @半佛仙人 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!