新聞里那些“死掉”的超鏈接,是如何被灰產(chǎn)給占用的?
編輯導(dǎo)語:盡管互聯(lián)網(wǎng)不是法外之地,但是試圖鉆技術(shù)和規(guī)則漏洞的投機(jī)者依然大有人在。許多新聞中的超鏈接在點(diǎn)擊時(shí)會(huì)顯示已經(jīng)失效然后跳轉(zhuǎn)至其他網(wǎng)站,超鏈接怎么了?誰在利用那些已經(jīng)“死去”的超鏈接?
在網(wǎng)頁新聞中,超鏈接時(shí)常作為一種補(bǔ)充資料出現(xiàn),用戶能夠點(diǎn)擊超鏈接閱讀媒體所引用的資料原文。
但隨著信息數(shù)據(jù)的不斷堆積,網(wǎng)絡(luò)上的許多超鏈接其實(shí)已經(jīng)失效了,比如有時(shí)候點(diǎn)擊一個(gè)十幾年前的文章鏈接,會(huì)反饋一個(gè)類似于“頁面已消失”的提示。
大部分用戶并不會(huì)特別關(guān)注一個(gè)超鏈接是否還有效,但在網(wǎng)絡(luò)上,有一些人卻像盜墓者一般搜尋著這些沉睡已久的超鏈接并用其牟利。
超鏈接怎么了?誰在利用那些已經(jīng)“死去”的超鏈接?本期全媒派將聚焦于那些已經(jīng)無效的超鏈接,匯編并分析國外媒體所經(jīng)歷的無效超鏈接被篡改的困擾,試圖揭示當(dāng)下新聞歸檔存在的問題以及無效超鏈接背后巨大的灰色利益。
一、超鏈接之“死”
根據(jù)哈佛大學(xué)法學(xué)院一個(gè)團(tuán)隊(duì)對(duì)于《紐約時(shí)報(bào)》的調(diào)查,他們發(fā)現(xiàn)在該報(bào)553,693篇文章中的一百七十多萬個(gè)深度鏈接(Deeplink)已經(jīng)有25%完全無法使用。當(dāng)用戶點(diǎn)擊這些深度鏈接,曾經(jīng)的頁面已經(jīng)變成一片空白。[1]
這樣的情形被稱為鏈接無效(linkrot),頁面會(huì)出現(xiàn)“404”的提示。
深度鏈接是指能夠?qū)蛲獠烤W(wǎng)站頁面的渠道,使用者能夠通過該鏈接進(jìn)入某個(gè)特定的外部頁面。如果沒有采用深度鏈接技術(shù),則使用者需要自行搜尋相關(guān)的內(nèi)容。深度鏈接大大縮短了用戶的使用路徑,在圖文內(nèi)容消費(fèi)場景里,基本上可以將深度鏈接理解為我們更為熟悉的超鏈接。
而超鏈接變無效鏈接,主要原因則是原有內(nèi)容消失、變更或者位置改變,這使得服務(wù)器無法返回有效的頁面。
如《好萊塢報(bào)道》曾為前華特·迪士尼CEO羅伊·迪士尼的妻子發(fā)表一篇訃告,并附上了一個(gè)紀(jì)念網(wǎng)站的鏈接,讀者可以在該網(wǎng)站中向慈善機(jī)構(gòu)捐款以紀(jì)念逝者。之后,其家人關(guān)閉了該網(wǎng)站。盡管網(wǎng)站不復(fù)存在,但《好萊塢報(bào)道》所引用的超鏈接依然能夠跳轉(zhuǎn),這樣的超鏈接就成了無效鏈接。
微信公眾號(hào)中的超鏈接呈現(xiàn)形式無效的情況會(huì)隨著超鏈接年份的累積變得更為普遍,因?yàn)殡S著時(shí)間的流逝,當(dāng)初所引用的大量網(wǎng)站都可能已經(jīng)不再被使用。
在對(duì)《紐約時(shí)報(bào)》的這項(xiàng)調(diào)查結(jié)果顯示,發(fā)表于2018年的文章有6%的超鏈接已經(jīng)無效;而2008年的文章則有43%的無效超鏈接;到了1998年,這一指標(biāo)竟達(dá)到72%之高。在整體上,53%的文章中至少存在一個(gè)無效的超鏈接,也就是兩篇文章中至少有一篇文章有一個(gè)無效的鏈接。
超鏈接的失效也與文章類型有關(guān),不同板塊的文章在無效鏈接的比例上也存在差異。例如,健康板塊的無效比例最低,比平均的超鏈接無效比例低17個(gè)百分點(diǎn);而旅游板塊的無效比例則是最高的,比平均比例還要高出17個(gè)百分點(diǎn)。
其實(shí)話說回來,這種超鏈接失效的情形在網(wǎng)絡(luò)生活中并不少見。全媒派往期文章探討過“數(shù)字倉鼠”的現(xiàn)象,即很多網(wǎng)友喜歡把各種資料囤著,這其中也包括各種鏈接。你一定也有過這樣的經(jīng)歷,當(dāng)你打開自己所收藏的文章時(shí),其中總有一些已經(jīng)被作者或者平臺(tái)刪除。
在微博中,這一現(xiàn)象更為常見,筆者驚奇地發(fā)現(xiàn)自己曾經(jīng)點(diǎn)贊或轉(zhuǎn)發(fā)的內(nèi)容幾乎一半以上都已經(jīng)成為無效的鏈接,只顯示“此微博已被刪除”。
“抱歉,此微博已被作者刪除。”
另一種與鏈接無效相似的情形是內(nèi)容轉(zhuǎn)移(Content Drift)。
當(dāng)一個(gè)超鏈接的內(nèi)容被轉(zhuǎn)移則意味著,當(dāng)用戶點(diǎn)擊該超鏈接,服務(wù)器所返回的頁面并非原本所連接的內(nèi)容。
同樣,內(nèi)容轉(zhuǎn)移的情況也會(huì)隨著文章時(shí)間愈漸久遠(yuǎn)而變得更為頻繁。調(diào)查中提到,在2019年所發(fā)表的文章中,僅有4%的超鏈接內(nèi)容發(fā)生了變化;而2009年的文章中則有四分之一的超鏈接內(nèi)容發(fā)生了變化。
這樣的情況是否僅為個(gè)例?盡管該團(tuán)隊(duì)僅對(duì)《紐約時(shí)報(bào)》這一家機(jī)構(gòu)長達(dá)13年的文章進(jìn)行調(diào)查,但素以存檔專業(yè)而著稱的《紐約時(shí)報(bào)》,其所屬文章超鏈接失效或內(nèi)容轉(zhuǎn)移的情況都如此普遍,其他規(guī)模更小的新聞機(jī)構(gòu)中的情況恐怕更不樂觀。
保存新聞并不只是保留原有的新聞文本或者音視頻資料,因?yàn)檫@些內(nèi)容往往都保存于新聞機(jī)構(gòu)自己的服務(wù)器中,相比之下,更為棘手的是保留文章中所引用的外部信息,也就是超鏈接。
超鏈接所導(dǎo)向的外部網(wǎng)站并不受相關(guān)新聞機(jī)構(gòu)的管理,這些網(wǎng)站的內(nèi)容能夠被第三方所修改或者刪除。其帶來的后果不只是新聞失去參考的信息來源或者新聞情境喪失,更嚴(yán)重的影響是,這些超鏈接可能會(huì)被用來導(dǎo)向無關(guān)的內(nèi)容,或被用于一些不正當(dāng)?shù)哪怖袨椤?/p>
凱瑟琳·漢森和諾拉·保羅在他們《給未來的新聞:保留歷史的第一稿》中表現(xiàn)出對(duì)于當(dāng)前新聞存檔現(xiàn)狀深深的擔(dān)憂。
在他們看來,新聞所發(fā)揮的作用遠(yuǎn)不僅僅只是傳遞當(dāng)下的信息,更為重要的是完整表現(xiàn)出時(shí)代的特征和人們的生活。[2]但隨著新聞行業(yè)數(shù)字化進(jìn)程不斷深入,新聞業(yè)大力推進(jìn)革新向前進(jìn)的同時(shí)卻忽視了往后面看一看。
二、占用“死去”的超鏈接成灰色產(chǎn)業(yè)
超鏈接之“死”暴露出兩個(gè)問題:一是新聞的儲(chǔ)存無法得到百分百妥善處理,另一方面則是超鏈接背后隱藏著巨大的地下市場。
因?yàn)榘鏅?quán)問題,新聞網(wǎng)站需要用超鏈接標(biāo)注所引用的資料來源,但這使得新聞網(wǎng)站對(duì)于超鏈接所指向的內(nèi)容缺乏控制,這就為投機(jī)者利用無效超鏈接埋下了隱患。基于內(nèi)容轉(zhuǎn)移等原理,非法供應(yīng)商可以將原本失效的超鏈接進(jìn)行偷換,重新連接到新的網(wǎng)站中,以此來吸引流量、謀取利益。
1. 儲(chǔ)存新聞的困境
相較于報(bào)紙、錄像帶等傳統(tǒng)的信息儲(chǔ)存形式,電子新聞的儲(chǔ)存無疑更加具有便利性。那為什么新聞儲(chǔ)存在電子時(shí)代反而會(huì)成為一個(gè)問題?
要回答這個(gè)問題,我們必須首先了解在傳統(tǒng)媒體時(shí)代新聞是如何進(jìn)行儲(chǔ)存的。
在數(shù)字化流行之前,新聞的主要形式是報(bào)紙、廣播以及電視。廣播和電視節(jié)目主要由新聞機(jī)構(gòu)自行進(jìn)行儲(chǔ)存,一般媒體都會(huì)設(shè)有專職人員對(duì)這些新聞原件進(jìn)行歸檔,其作用類似于圖書管理員。
報(bào)紙的保存則涉及到更為復(fù)雜的過程。由于各種機(jī)構(gòu)和個(gè)人都會(huì)訂閱報(bào)紙,人們?cè)谫徺I報(bào)紙的過程中也同時(shí)保留了新聞原件。雖然個(gè)人可能出于興趣保存有一定量的報(bào)紙,但這樣的行為往往也并不具有系統(tǒng)性。
主要的第三方保存機(jī)構(gòu)是大大小小的圖書館。圖書館具有更為寬敞的空間以及專業(yè)的圖書管理員,因此可以相對(duì)更為完整地保存報(bào)紙??梢哉f,報(bào)紙的儲(chǔ)存更為彌散化,除了新聞機(jī)構(gòu)本身,第三方機(jī)構(gòu)也會(huì)有所參與。
但隨著新聞業(yè)數(shù)字化程度不斷提高,互聯(lián)網(wǎng)成為新聞傳播的重要途徑。電子化的新聞似乎不再需要?dú)w檔,因?yàn)樗揪捅话卜旁诜?wù)器的不同文件夾中。
但實(shí)體的文檔和數(shù)字文檔畢竟存在差異,一份報(bào)紙一旦發(fā)行就難以再做改動(dòng),而數(shù)字文檔則始終保持著可變動(dòng)性。尤其是諸如超鏈接等導(dǎo)向外部網(wǎng)站的渠道,其是否進(jìn)行修改或刪除取決于第三方機(jī)構(gòu),媒體無法對(duì)其進(jìn)行直接管理。
另一方面,對(duì)于新聞歸檔的忽視也顯示出新聞業(yè)整體的發(fā)展趨勢——追求速度。正如周睿鳴老師在論文中指出那樣,新聞業(yè)陷入與自我賽跑的泥淖,新聞生產(chǎn)成為不斷提速的過程。[3]在這樣不斷往前看的過程中,重視過去的新聞似乎有些不合時(shí)宜。
盡管人們開始意識(shí)到問題所在,但對(duì)于新聞機(jī)構(gòu)而言,完整、獨(dú)立地保存新聞依然存在諸多問題,版權(quán)問題無疑位于核心。如何既能夠尊重第三方資料來源的版權(quán),同時(shí)又能夠防止其不被居心叵測者所利用,這成為解決問題的關(guān)鍵。
一種可能的處理方式是備份第三方機(jī)構(gòu)的超鏈接頁面,如果無法一比一復(fù)制,還可以考慮截圖的形式。但這可能賦予新聞媒體過大的權(quán)力,使其能夠直接復(fù)制其他內(nèi)容來源;再者,這也促成了獨(dú)立、封閉的網(wǎng)絡(luò)生態(tài)體系的形成,使得流量始終在新聞網(wǎng)站內(nèi)部循環(huán)。
第三方機(jī)構(gòu)一般不會(huì)允許媒體借用它們所生產(chǎn)的內(nèi)容來增強(qiáng)媒體的用戶黏性。而一旦超鏈接導(dǎo)向外部網(wǎng)站,媒體就無法對(duì)其內(nèi)容進(jìn)行控制。因此,這一切處理起來并不容易。
2. 超鏈接背后的灰色市場
如果媒體發(fā)布文章中的超鏈接導(dǎo)向的是一個(gè)完全無法控制的網(wǎng)站,那對(duì)于媒體公信力而言是存在風(fēng)險(xiǎn)的,美國的媒體正飽受這種無效超鏈接被篡改之苦,而這背后就有一片巨大的灰色市場。
通常這些超鏈接的地址會(huì)被導(dǎo)向某些具有盈利性質(zhì)的網(wǎng)站,大多類似于廣告引流。
其運(yùn)作邏輯大致如下:正如前文提到的,新聞網(wǎng)站中大量的超鏈接內(nèi)容已然失效,但這些鏈接依然存在且可點(diǎn)擊;某些供應(yīng)商則將此作為契機(jī),尋找到新聞網(wǎng)站中的無效鏈接,將其替換成為客戶所需要的網(wǎng)站內(nèi)容。
這些被篡改的外部網(wǎng)站大多具有廣告性質(zhì),諸如推銷廉價(jià)酒店、在線咨詢、在線支付甚至包括網(wǎng)絡(luò)賭博等。
雖然人們對(duì)于過去新聞的興趣會(huì)逐漸下降,但互聯(lián)網(wǎng)中的新聞并不會(huì)因此完全被遺忘。通過搜索引擎,用戶能夠隨時(shí)調(diào)用過去的新聞報(bào)道。當(dāng)過去的“記憶”被喚醒時(shí),伴隨著這些舊新聞一起重建天日的還有那些已經(jīng)被偷偷掉包的超鏈接。
當(dāng)用戶第一次發(fā)現(xiàn)超鏈接被篡改為毫無相關(guān)的廣告時(shí),他也許只會(huì)感慨互聯(lián)網(wǎng)中的廣告真是無孔不入。但第二次、第三次呢?他可能就會(huì)對(duì)新聞網(wǎng)站的專業(yè)性產(chǎn)生質(zhì)疑了。更何況無效超鏈接的比例如此之高,誰也不知道下一個(gè)被點(diǎn)開的鏈接是否是其原本的內(nèi)容。
BuzzFeed新聞對(duì)于美國各大主要新聞網(wǎng)站以及BBC的調(diào)查發(fā)現(xiàn),這些新聞網(wǎng)站都深受超鏈接內(nèi)容篡改之苦,其中福布斯新聞所受影響尤其明顯。[4]
福布斯發(fā)言人在一次公開聲明中表示,網(wǎng)站已經(jīng)刪除這些被修改內(nèi)容的超鏈接,并且積極尋找能夠規(guī)避超鏈接被篡改的措施。BBC則在其網(wǎng)站上發(fā)布免責(zé)聲明,稱其對(duì)外部網(wǎng)站的內(nèi)容不承擔(dān)任何責(zé)任。
提供這些篡改服務(wù)的供應(yīng)商大多避開了來自美國或歐洲國家的直接監(jiān)管,其服務(wù)費(fèi)往往十分高昂,替換一條超鏈接內(nèi)容的服務(wù)費(fèi)從200到500美金不定。
替換超鏈接的行為是諸多黑帽SEO技術(shù)中的一種。SEO(Search Engine Optimization)指的是搜索引擎最優(yōu)化技術(shù),它主要用于分析搜索引擎如何進(jìn)行排名的規(guī)律,通過了解搜索引擎如何抓取互聯(lián)網(wǎng)頁面、怎樣確定特定關(guān)鍵詞等技術(shù)來提高網(wǎng)頁在搜索引擎中的排名已增加瀏覽量。[5]而黑帽SEO則是通過作弊的方式來提高網(wǎng)站的瀏覽量,以圖謀取短期、快速的經(jīng)濟(jì)效益。
為了以假亂真,供應(yīng)商有時(shí)甚至?xí)7略芯W(wǎng)站發(fā)布者的身份以圖迷惑用戶。例如,位于德里的一家SEO機(jī)構(gòu)曾替換了福布斯網(wǎng)站中梅根·梅森(Megan Mason)于2015年所發(fā)表文章中的某些無效鏈接。替換者用梅根·馬特(Megan Matt)的名義重新發(fā)布了一篇文章,并將其連接到圣地亞哥一家地毯清潔公司的網(wǎng)站。
新聞網(wǎng)站并非這些非法牟利者的唯一受害者,各大搜索引擎網(wǎng)站也飽受其苦,畢竟黑帽SEO會(huì)使得搜索結(jié)果無法滿足用戶的需求。當(dāng)用戶在搜索引擎中搜索某個(gè)關(guān)鍵詞所返回的都是無關(guān)的廣告甚至垃圾信息,用戶勢必會(huì)對(duì)搜索引擎所能提供的服務(wù)產(chǎn)生質(zhì)疑。
三、規(guī)避風(fēng)險(xiǎn)亦不可因噎廢食
從大大小小的灰色產(chǎn)業(yè)服務(wù)商到他們?yōu)榇鄹某溄觾?nèi)容所提出的高額報(bào)酬,看似不起眼的無效超鏈接背后潛藏著巨大的利益空間。那為何不索性取消超鏈接?這樣就能從根本上遏制投機(jī)者用非法的渠道進(jìn)行牟利。
首先依然是版權(quán)問題。
超鏈接存在之初便是為了媒體能夠合法地使用外部網(wǎng)站中的內(nèi)容,使用超鏈接不但能夠標(biāo)注資料的出處,還能夠用最便捷的方式尋找到原初的資料。盡管通過增加尾注或者其他方式也能夠注明版權(quán),但超鏈接無疑是更合適的方式。
被篡改的超鏈接也折射出媒體對(duì)于版權(quán)的重視。即使深受黑帽SEO之?dāng)_,多數(shù)媒體也并沒有想要取消超鏈接,而是試圖用技術(shù)彌補(bǔ)當(dāng)前存在的不足。
其次也折射出媒體對(duì)于網(wǎng)絡(luò)生態(tài)的態(tài)度。
正如筆者在前文中指出,沒有超鏈接的文章形成了封閉的網(wǎng)絡(luò)生態(tài),用戶只能在網(wǎng)站中瀏覽該媒體內(nèi)部的信息,不同網(wǎng)站之間也沒有任何聯(lián)系。
而超鏈接恰恰提供了連接的可能,只需要輕輕一點(diǎn),用戶即可瀏覽其他渠道的頁面。不同新聞之間,甚至不同新聞網(wǎng)站之間都能通過超鏈接進(jìn)行關(guān)聯(lián)。
這樣帶來的一個(gè)好處是,不同媒體之間依靠內(nèi)容質(zhì)量來吸引受眾,技術(shù)本身并不成為壁壘,甚至雙方都樂見對(duì)方生產(chǎn)更加優(yōu)質(zhì)的內(nèi)容。
總而言之一句話,盡管失效超鏈接背后潛藏著巨大的灰色市場,盡管第三方投機(jī)者的行為給新聞網(wǎng)站帶來了棘手的問題,但行業(yè)也并沒因噎廢食,媒體機(jī)構(gòu)依舊試圖通過提升技術(shù)手段來降低潛在風(fēng)險(xiǎn)。
被篡改的超鏈接也提醒我們,盡管互聯(lián)網(wǎng)不是法外之地,但是試圖鉆技術(shù)和規(guī)則漏洞的投機(jī)者依然大有人在。如《紐約時(shí)報(bào)》這些在內(nèi)容存儲(chǔ)上相對(duì)專業(yè)的新聞媒體所引用的超鏈接都有可能被第三方所盜用,其他網(wǎng)站中可能存在的“陷阱”無疑會(huì)更多。而這些,都有待平臺(tái)、媒體和相關(guān)監(jiān)管機(jī)構(gòu)合力形成更嚴(yán)密的預(yù)防和處理機(jī)制。
參考鏈接:
- https://www.cjr.org/analysis/linkrot-content-drift-new-york-times.php
- https://www.cjr.org/tow_center_reports/the-dire-state-of-news-archiving-in-the-digital-age.php
- 周睿鳴.錨定常規(guī):“轉(zhuǎn)型”與新聞創(chuàng)新的時(shí)間性[J].新聞?dòng)浾?2020(02):21-31.
- https://www.buzzfeednews.com/article/deansterlingjones/links-for-sale-on-major-news-wesbites
- 馬曉玲,吳永和.對(duì)于搜索引擎優(yōu)化(SEO)的研究[J].情報(bào)雜志,2005(12):119-121.
作者:法夏;公眾號(hào):全媒派(ID:quanmeipai)
本文由 @全媒派 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
黑鏈也是黒帽SEO的一種常用手段吧
只有內(nèi)部人才能有權(quán)限換url
是個(gè)明白人
好選題哇!