技術貼:如何通過搜索引擎學習成長,查找各種資源
前幾天,一篇題為《搜索引擎就是我的大學》一文在我的朋友圈流轉,小婉姑娘講述了自己初中肄業從一個月薪三百的鄉郊飯店服務員,通過搜索引擎自我學習,一步一步步入城市,拿下人力資源管理,項目經理,營銷策劃,文案策劃等多個有挑戰職位的逆襲事跡。
這無意給了很多“有電腦的人”一種天下我有的莫名沖動。雖然搜索引擎可以搜索到幾乎任何你想學的知識,但終究扔停留在可能性階段。真正高效地駕馭搜索引擎還是需要做些功課。
作為一名野路子網絡營銷鉆研狗,打算開個帖子給大家做個科普,同時奉上一系列壓箱底的“秘技”,希望于各位看客老爺有所裨益。
本帖分科普篇;實用技巧篇;資源篇三部分,略長但越往后越精彩。
科普篇
一、搜索引擎是個什么東西?
搜索引擎(Search Engine)是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等。
這里的用戶指的是有信息獲取需求的普通用戶,其實信息生產提交方(站長等)嚴格意義來講也是“用戶”,普通用戶只需要掌握搜索引擎使用技巧,而站長們更多的是琢磨SEO(搜索引擎優化)。這個帖子這雙邊都會有所涉及。
二、搜索引擎工作原理
爬行抓?。核阉饕嬷┲敫欐溄?,抓取頁面html代碼存入數據庫,低權重復制內容過濾;
預處理:文字和相關標簽抓取,中文分詞,去掉無意義內容提煉頁面主要關鍵詞(對于蜘蛛沒有意義:如:的、啊、從而等,廣告、申明等),去重(同一內容不同網站或同一網站不同網址);倒排索引:關鍵詞到內容,鏈接投票,文件處理(目前只能根據標簽和相關描述文字識別),質量判斷:搜索引擎算法;
排名:中文分詞(排除無實際意義的詞后對搜索詞的拆分重組,百度快照可查詢分詞結果),相關性計算:越常用的詞對搜索詞的意義貢獻越小,詞頻,關鍵詞位置形式距離(標題、H1、黑體等),鏈接分析(錨文本、周邊文字、原站本身主題),排名過濾調整(百度第11位)。
搜索引擎的工作原理使命就是確保用戶發出搜索指令后展現在他們面前的是其所需要的優質內容。
三、目前主流的搜索引擎
搜索引擎簡史:1994年Yahoo!誕生,1998年Google誕生,2000年百度誕生,2012年360搜索(好搜)推出。
百度
不管是PC端還是移動端百度市場份額都是絕對的國內第一,跟國內目前其他搜索引擎相比,不說矮子里面挑高個的難聽話,也不提競價廣告的亂象叢生,但從信息獲取效率以及用戶體驗來比,百度也是當之無愧的。
作為學習工具,百度搜索有這兩個地方不錯,一是百度網盤,二是百度文庫。
搜狗
搜狗在近年來發展迅速,最具特色的點是可以搜索微信內容和知乎內容。這都仰賴于騰訊的買買買內容戰略。
360
對于360,實話實說,廣告不比百度少,搜索結果質量也不敢恭維。來個對比。更多例子各位自行搗鼓。
必須掌握Google!
Google上面才是互聯網,其他國內的搜索引擎的觸角都受限,只能叫局域網。除了信息全面,用戶體驗也是誰用誰知道。
四、世界范圍內各搜索引擎市場份額
以2015年第三季度為例
谷歌以67.49%的份額雄居第一,Yahoo第二,Bing憑借10.67%占據第三,百度第四,份額8.13%。
搜索引擎以及相關實用技巧
一、高級搜索指令(了解多用幾遍即可)
這么理解:一般人不知道的,能夠提高搜索效率以及精度的一些特殊指令。
普通用戶常用的包括:
雙引號(搜索:“關鍵詞”)
把搜索詞匯放在雙引號中,代表完全匹配搜索,也就是說搜索出來的結果頁面都是保護雙引號中所出現的所有詞匯,連順序也是完全匹配的。百度和Google都是支持這個指令的。
使用雙引號搜索可以更準確的找到特定關鍵詞,更容易找到自己想要的資源。
減號(搜索:關鍵詞 ?-不需要的關鍵詞)
減號代表搜索引擎顯示不包括減號后面詞匯的頁面。使用這個指令時減號前面必須是空格,減號后面沒有空格,要緊跟著需要排除的詞。Google和百度都支持這個指令。
使用減號高級指令可以更加準確的找到需要的文件,尤其是某些詞語有多重意義的時候。
星號 (搜索:搜索*擎)
星號是常用的通配符,也可以使用在搜索引擎中。百度不支持*號指令。
比如在Google中搜索“ 搜索*擎”,其中*代表任何文字、出現的結果就不僅僅是包含“搜索引擎”的頁面了。
inurl:(搜索:inurl:任意字符串)
inurl:指令用于搜索查詢詞出現在URL中的頁面,可以按英文字面意思理解。百度和Google都是支持inurl:指令的。inurl:指令不僅支持英文,還支持中文。
高級搜索指令inurl的語法格式為:inurl:xxx(xxx可以為任意字符串)。此命令是查找url中包含xxx的網頁。
如果你是做SEO的,那么inurl:指令對你會很有用,因為你可以快速的找到競爭對手(因為關鍵詞出現在URL中對排名有一定的影響)。
intitle:返回的是頁面title中包含關鍵詞的頁面
百度和谷歌都支持intitle。?title是目前頁面優化最重要的因素。無論是什么網站,基本都會把關鍵詞放入title中。
詳細用法:http://jingyan.baidu.com/article/3f16e003c21c162591c103a6.html
filetype:搜索特定文件格式的時候使用。
例如:filetype:pdf 視頻教程,顯示的是包含“視頻教程”的所有PDF文件。filetype指令可以用來搜索特定的資源,比如PDF電子書、Word文件等。Google和百度都是支持filetype:指令的。
詳細用法:http://jingyan.baidu.com/article/73c3ce28f23d8de50343d9ac.html
site:這個高級搜索指令用來搜索某個域名下面的所有文件。
比如搜索“site:www.zhihu.com”,出現的就是www.zhihu.com這個域名下面的所有頁面,可以說這個高級指令是查詢網站收入頁面數量最直接的方法。site:指令也可以用于子域名。但site:并不準確,特別是在Google中,出現的收入頁面經常有大幅度波動,只能用于參考,但不能完全相信。
之前有人用“site:yun.baidu.com??”資源關鍵詞這個搜網盤里面的資源,現在貌似不大頂用了,等下給出替代方案。
高級搜索指令大全諸位可自行百度,補充一點是,這些指令很多都可以互相搭配使用影響最后的結果??梢杂泻軓碗s的組合結果,好消息是有人幫我們封裝好做寫成了特殊的搜索引擎供我們使用。
二、特殊搜索引擎
這有個知乎特殊搜索引擎匯總貼:https://www.zhihu.com/question/20251786
大而全的東西意味著雜亂,外行很容易陷入選擇困難癥一臉茫然。我給大家重點勾勒幾個點。
先順邏輯:從學習的角度,我們搜索一個東西最淺顯的需求就是了解知道,要想深入消化吸收往往意味著有必要觸發資料收集下載這一動作。
嗯,我就是要教大家怎么下載。一般的付費教程以及電子書資源,百度網盤的資源豐富度遠遠超過你想象,不過百度官方并不提供資源檢索功能。借助工具就好了,用網盤搜索引擎即可。我公眾號的菜單欄內置了一個,大家可以體驗一下。
理論上,只要掛在網上,就算是付費的視頻,文檔也能摳下來。某寶上面固然有售,稍稍懂點搜索引擎的功能其實都能省去不少精力,雖然大伙兒都不差錢,哈哈。
百度文庫,豆丁等下載:冰點下載器
YouTube視頻下載:en.savefrom.net
國內視頻網站內容下載:碩鼠
虎牙直播,斗魚直播等在線直播視頻下載:屏幕錄制軟件(CamtasiaStudio),我手上是自己寫的軟件。
視頻資源:用各種種子搜索引擎就好了。如:電驢,海盜,死去的btspread,以及不能說的其他站點。等下各位在評論區補充。
瀏覽國外資訊什么的,起碼要會翻墻吧,建議用付費的vpn,速度有保障,最重要的是下東西飛快。俺用的一款之前叫greenvpn,現在叫綠豆加速器。紅杏已掛。
省略一萬種資源獲取方式……
最后放個大招:自行百度吾愛破解,精易論壇,對絕大多數人來講,那將是另外一片天堂。
各色工具資源站點我收藏夾都躺了幾百個,一次抖不完。嘮叨一個省事的終極思路——互聯網的基礎設施是IT們搭建起來的,其中有五顏六色的暗門,摸熟搜索引擎,就是擁有了打開這些暗門的鑰匙。
至于暗網什么的高級黑,下次八卦,寫寫我掌握的一些細節。
三、關鍵詞使用
使用搜索引擎的搜索功能最重要的是知道輸入哪個關鍵詞。
搜索引擎就像一個搬運工,你想讓他給你搬運啥東西,你起碼得知道自己想要什么。例如你想學英語,你可能就會搜怎么學英語,英語培訓教程。這種起碼的素養,一般人初次接觸搜索引擎就具備。這一階段一般使用的往往是泛關鍵詞。
學習是個循序漸進的過程,意味著你有深入挖掘細分領域的需求。這就引申出另外一個概念叫精準關鍵詞(或長尾關鍵詞),不過多展開,需要強調的是,大家在使用搜索引擎的時候要有意識地去提煉自己的關鍵詞,從不同的維度去獲取你想要的信息。
舉個粗暴栗子,黃片又叫愛情動作片,此外番號,番號封面,女優這些關鍵詞也指向你想要獲取的資源,是不是很有趣。
互聯網再繁雜,只要多記對象名詞,熟悉事物關鍵節點,借助搜索引擎就能提綱挈領,手到擒來。到這個當口,才有天下為我所用的掌握感。
四、搭建網站門類的記憶宮殿
浸淫互聯網許久,俺在說個有意思的點。導航網站相信大家都很熟悉,像hao123,金山毒霸導航,360導航。
我想給大伙說的是,這些導航網站的布局一般都別有用心(用來做淘寶客導購,軟件注冊推廣,廣告等),而且聚合的站點也很平庸,滿足普羅大眾日常的消遣尚可,但是想讓搜索引擎成為你的大學,就遠遠不夠了。
你需要搭建屬于自己的“網站導航”,在日常接觸到的優秀網站,記得在瀏覽器點一下收藏,分門別類。經年累月的積累,這將是你電腦上最重要的一筆財富。我換電腦或裝系統幾乎東西不擔心丟失,同步下收藏夾就好了。
分門別類的收藏夾是你搭建腦海記憶宮殿的基礎,最終要達到有搜索需求的時,資源獲取手到擒來。
至于怎么管理你的收藏夾,適合你自己的姿勢才是最好的,一些管理原則,放個帖子:https://www.zhihu.com/question/21537488
五、網感
多泡網,見識各色各樣的網站樣式,在建立起自己的站點記憶宮殿之后,培養自己的網感,懂得各色資源的搭配調取應用。網感是個很大的命題,看似有些務虛,實則用處極大。此處提出這一概念,鑒于篇幅下次闡述。
資源篇
從學習獲取資源的角度,看上面的東西就夠用了。你要對搜索引擎真感興趣,俺接著給大家推薦幾本類似行業圣經的讀物。
SEO藝術
國外譯著,享有盛譽
《這就是搜索引擎:核心技術詳解》
關于一些技術細節
《搜》
搜索引擎的由來,了解歷史,偏文化經濟層次
《SEO深度解析》和《SEO實戰密碼:60天網站流量提高20倍(第3版)》都是站長SEO操作指南。
作者:徐戈,微信公眾號:daai1024,老徐有話說。微博:@徐戈xuge
本文由 @徐戈 原創發布于人人都是產品經理?,未經許可,禁止轉載。
很好很強大~!
慢慢都是干貨,非常感激
謝謝樓主干貨,但還是希望大家對于在國內可以合法觀看的影視劇電影支持正版~
不錯,收藏夾功能,我無意中自己使用了,挺方便的
我在2010年的時候入行SEO 買了好幾本書看 自己感覺吧 還是要摸索著來
??
太牛逼了,對咱自學黨來說就是神器啊
棒棒噠!太有用了,b ??
seo藝術一般看不懂,seo實戰密碼我買了,不咋地,沒啥用處
?? mark了!