Google是如何做移動搜索的(上)
長久以來Google的旗艦產品已成為我們生活的一部分。但Google并不認為搜索理所當然就應該是那樣的。此文編譯自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有關Google搜索變革研究的第一部分。 天為什么是藍的? 小孩經常問這個問題,但是很少有家長在不需要幫助的情況下能回答得上。不久以前,找到正確的答案至少需要鉆研百科全書,甚至還需要跑一趟圖書館。不 過最近,爸爸媽媽只需要打開電腦,Google 一下,點擊鏈接,問題的回答就呈現在面前,然后父母閱讀一下解釋,再用小孩可以理解的方式闡述一遍即可。 但到了 2015,甚至這種看似快捷的過程也算不上快了。首先,在移動設備上問題的提出更有可能是通過口述而不是在搜索框敲字。其次,盡管從一堆鏈接排序中選擇最 相關者仍然是特定查詢的有效辦法,那些有著明確定義問題(如天空為什么是藍的)的人更希望馬上知道答案。如果 Google 不能馬上提供答案,這些人就會失望、甚至憤怒。 那么……“好吧,Google……為什么天是藍的?” 對于 Google 最近幾年對搜索進行的變革,Google 搜索團隊負責人 Amit Singhal 以飛機空中更換引擎來打比方,其改動包括排名算法,添加新的企業信息,以及在用戶完成問題輸入前開始搜索等。除了引擎切換以外,在移動搜索即將超越桌面搜 索的大背景下,Google 也在考慮對“座艙”—使用界面進行徹底的重新設計,甚至考慮整個使命的重新定位。 搜索一直是公司的旗艦產品,搜索廣告仍是公司的主要收入來源,Google 對搜索的重視跟外界對 Google 的關注點是不一樣的。現在開始有人質疑 Google 搜索在走下坡路(參見Google統治終結了嗎)。理由包括:1)垃圾結果太多 2)過分強調信息的更新度而非相關性等。Singhal 強烈抨擊這種言論,認為說法與事實完全相反,Google 的搜索做得比 2 年前好得多,那些批評者陷入的是一股對過去的懷舊情緒。 盡管如此,Facebook 的社交網絡屏蔽 Google 的爬蟲抓取信息令 Singhal 感到憂心忡忡,擔心封閉的網絡會威脅到 Google 的地位。但事實證明他過過慮了。Facebook 的 Graph Search 仍非常稚嫩,對 Google 幾乎沒什么影響。微軟的 Bing 在搜索質量上有得一比,但市場份額不到 1/5。在基礎設施、人才厚度、經驗、雄心等方面沒有競爭對手可以與 Google 匹敵。G+ 盡管遠未能成為引起轟動的社交網絡,但的確吸引了許多搜索用戶的加入。 要說到威脅,Google 搜索最大的威脅并不是來自于競爭對手,而是搜索對象的變化—從 web 遷移到了星羅密布的 app 孤島。不過 Google 認為這種情況自己是可以克服的—畢竟開發者跟網站站長一樣希望自己的信息被發現。從 2013 年秋,Google 開始設立 App Indexing 將移動 app 內的數據納入整個索引內。現在已經有 15% 的 Android 登錄用戶可獲得含 app 內信息的搜索結果。但是 iOS app 是一個很大的坑。 目前抓取 app 信息的挑戰尚未影響 Google 的搜索統治地位。Google 每天接受的搜索查詢超過 30 億次,每年執行的搜索超1萬億次。美國 2/3 的搜索用的是 Google,在全球其他地區(中國除外)情況類似。最近 Google 搜索份額的變化只是因為Yahoo跟Firefox的默認搜索引擎交易導致的。而且 Google 還拿到了 80% 的移動搜索份額。2013 年 Google 出現了 5 分鐘的中斷的結果是全球流量下挫了 40%! 盡管搜索不是外界關注 Google 的熱點,但它本身卻正在進行穩步而密集的再造。實際上 17 年的時間里 Google 從未停止對搜索的改進,但最近幾年 Google 搜索變革的速度明顯加快,為的是保持領先優勢。 其中的一些變化用戶已經有所體會。搜索更快了、內容更新了、更加社會化了、結果呈現更加豐富了。這些變化不是一夜之間完成的,而是 Google 持續不斷的升級改進的結果。Google 每周都要開搜索質量協調會,對算法進行微調。每 2、3 年都要對排名系統進行重大升級,最近一次的代號為 Hummingbird。據稱過去 3 年排名系統進行的改動要比此前 13 年的加起來還要多。 Google 搜索的變革主要體現在三個方面:知識圖、語音搜索和 Google Now。知識圖把全球的信息組織為一個浩瀚的數據庫;語音搜索把口語吸收進了搜索;而 Google Now 則提供了未問先答的能力。這三大變化都與 Google 聚焦于移動有關。 知識圖譜的推出源自對 MetaWeb 的收購。MetaWeb 2005 年由知名計算機科學家與創業者 Danny Hillis 創辦,2007 年推出。做的是語義網。MetaWeb 做的事情也是通過掃描互聯網去回答問題,它擁有 1200 條人、地點與事物的實體記錄,一度被認為是 Google 的競爭對手。不過最終 Hillis 意識到只有在 Google 的大樹下自己搭建全球信息數據庫的宏偉目標才能實現。而彼時盡管 Google 也提供了一些問題的直接答案,但是卻無法回答“西海岸學費低于 3 萬美元的大學”、“至少獲得過一次奧斯卡獎的年齡超過 40 的演員”這樣的問題。雙方一拍即合。 Google 意識到,事物是搜索的重要部分,而讓大眾關心的事物的事實與信息迅速呈現是一種很好的方式。于是在 MetaWeb 的基礎上,2012 年 5 月,Google 推出了提供搜索主體關鍵事實的知識圖作 為搜索的輔助呈現在搜索結果頁面的右側。現在它的條目已經超過了 5 億。那么那些搜索結果會出現知識圖呢?Google 會將查詢詞條擴展為其他形式和同義詞等等,然后進行算法測試看看是否與知識圖(Knowledge Graph)結果相關,確定相關后再從中擇取相關結果呈現(比方說敲“達芬奇”試試)。根據估計,目前約有 25% 的搜索可喚出知識圖。 在 Google 搜索與知識圖整合的這 2 年多的時間里,知識圖也在不斷演變。原先它是靜態的,但現在正慢慢吸納 Google 搜索本身在分析用戶行為方面的學習能力。比方說“誰在《太空炮彈》中飾演 Barf?”這樣的問題問多了以后,知識圖就知道要把演員、電影和情節等東西列進去。 此外在知識的新鮮度方面知識圖也有了大幅改進。以往知識的更新最長可能需要 2 個星期。但現在系統已經能處理新聞,所以更新調整只需要幾分鐘。 當然,Google 的改進計劃還有很多。包括增加知識域(最近添加了汽車、視頻游戲、雨果文學獎得主),提供除簡單事實以外更加復雜的、更主觀性、模糊化的搜索結果。用戶的 興趣點就是改進的出發點。而 Google 最終想要實現的效果是,讓你不僅覺得跟你對話的不是冰冷的機器,而是既無所不知又懂附庸風雅的圣人。 但這個目標目前還有點遙遠。令產品經理 Emily Moxley 惱火的是,盡管現在知識圖已經知道一些電視節目,但卻既缺乏新劇集的信息,也不知道什么時候上映,在哪里能夠看到。在知識圖成為圣人之前,Google 需要要先實現這一“中期目標”。 或者這個要求還有點高。因為 4 年時間過去了,Google 至今仍未給出上述那兩個類似問題(“西海岸學費低于 3 萬美元的大學”、“至少獲得過一次奧斯卡獎的年齡超過 40 的演員”)的一站式的答案。知識圖,任重而道遠啊。 未完待續…… 原文來自:36KR 原文編譯自:medium.com知識圖(Knowledge Graph)
- 目前還沒評論,等你發揮!