大數(shù)據(jù)時代下看Amazon是如何處理隱私問題的
在訪問Amazon電商網(wǎng)站時總會看到這樣的提示,對于互聯(lián)網(wǎng)用戶來說,應(yīng)該已經(jīng)非常熟悉這樣的推薦了吧。Amazon是通過所謂協(xié)同過濾(collaborative filtering)的技術(shù),來實現(xiàn)這一商品推薦功能的。
協(xié)同過濾是根據(jù)商品的購買記錄加上網(wǎng)站訪問記錄等行為數(shù)據(jù),對用戶間愛好的相似度進行自動計算,從而實現(xiàn)商品推薦的。在這個過程中,商品本身的內(nèi)容是無關(guān)的,而只是基于購買記錄和行為記錄,從某個用戶與其他用戶間愛好的相似度來計算出要推薦的商品,這正是這一機制的關(guān)鍵所在。因此,系統(tǒng)可能會推薦出乍看之下和用戶的愛好無關(guān)的出乎意料的商品,但反過來說,這也可能會為用戶帶來意想不到的發(fā)現(xiàn)(serendipity)。
所謂serendipity,是指能夠意外帶來好運的能力,這個詞是由英國小說家霍勒斯·沃波爾(Horace Walpole,1717-1797)于1754年造出來的,其辭源來自童話故事《錫蘭國三王子》(The Three Princes ofSerendip,Elizabeth Jamison Hodges著)。在Web領(lǐng)域中,指的是用戶通過搜索引擎和推薦系統(tǒng)發(fā)現(xiàn)了出乎意料的商品。
從結(jié)果上來說,用戶將自己的購買記錄和行為記錄等信息交給Amazon,同時得以享受到像Serendipity這樣的好處。
Amazon于2011年9月28日發(fā)布的平板電腦KindleFire中,提供了一項非常有意思的服務(wù)。 該平板電腦采用Android操作系統(tǒng),售價只有199美元,比iPad要便宜,它上面繼承了Amazon自行開發(fā)的新瀏覽器Amazon Silk。之所以要自行開發(fā)一款瀏覽器,是為了在硬件性能低于PC的移動設(shè)備上實現(xiàn)更快速的網(wǎng)頁瀏覽。
為了彌補硬件性能的不足,Amazon采取了下列對策。
(1) 在瀏覽器的后臺利用Amazon自己的云計算服務(wù)EC2,事先對視頻、圖片等數(shù)據(jù)量較大的內(nèi)容進行壓縮等處理,將優(yōu)化后的數(shù)據(jù)傳送給終端。這種方式被Amazon稱為Split Browser,通過將負(fù)荷較高的處理轉(zhuǎn)移到云端執(zhí)行,可以比由終端直接執(zhí)行實現(xiàn)更加快速的內(nèi)容處理,還可以延長電池的續(xù)航時間。
(2) 基于內(nèi)容瀏覽記錄,通過機器學(xué)習(xí)找出用戶的Web瀏覽模式,從而判斷出用戶接下來可能要訪問的頁面,并事先在云端進行緩存。通過這一機制,頁面加載的時間得以大幅縮短。
Amazon開發(fā)的新瀏覽器所采用的上述機制,充分利用了該公司在云計算方面的優(yōu)勢,實現(xiàn)了Web瀏覽的高速化,這一點非常有意思。然而,從另一個角度來說,也有一些人認(rèn)為這樣做有侵犯用戶隱私之嫌。
也就是說,用戶使用Kindle Fire瀏覽網(wǎng)站時,在真正連接用戶所指定的網(wǎng)頁之前,首先要連接到Amazon的云計算服務(wù)。用戶在瀏覽網(wǎng)站期間,與Amazon云服務(wù)之間的連接會被一直保持,Amazon會對用戶在Web上的行為,如訪問的網(wǎng)站URL、IP地址、MAC地址等信息進行記錄,并保存最長30天。
根據(jù)Amazon的解釋,對于這些數(shù)據(jù)的記錄,是“為了解決和診斷瀏覽器的技術(shù)問題”,用戶數(shù)據(jù)在保存和使用時不會與用戶個人身份產(chǎn)生關(guān)聯(lián)。
此外,用戶還可以在使用云計算平臺的Cloud模式和不連接到云端直接訪問網(wǎng)頁的Off-cloud 模式之間進行選擇。不過,如果選擇了Off-cloud模式,用戶便無法享受到Silk所提供的對網(wǎng)頁內(nèi)容傳輸?shù)膬?yōu)化、加速等好處。
對于由Silk瀏覽器所引發(fā)的隱私問題,美國國會也立即做出了反應(yīng)。在Kindle Fire發(fā)布的約兩周后,眾議院議員、國會兩黨隱私權(quán)預(yù)備會議聯(lián)合主席、民主黨人Edward Markey,向Amazon的CEO 杰夫·貝佐斯提出了公開質(zhì)詢,要求對Silk的隱私問題做出解釋。
Markey議員提出了下列4個問題,要求Amazon在3周之內(nèi)做出回答。
(1) Amazon對Kindle Fire的用戶收集了哪些信息?
(2) Amazon準(zhǔn)備如何利用這些信息?Amazon是否計劃將這些客戶信息以出售、租賃或其他形式交給其他企業(yè)來進行利用?如果有,那么Amazon計劃對哪些企業(yè)提供這些信息?
(3) Amazon準(zhǔn)備采用何種方法向KindleFire以及Silk用戶告知公司的隱私權(quán)政策?如果存在相應(yīng)的政策,請?zhí)峁┻m用于Kindle Fire的隱私權(quán)政策條款。
(4) 假設(shè)Amazon準(zhǔn)備對用戶的互聯(lián)網(wǎng)瀏覽習(xí)慣相關(guān)信息進行收集,那么用戶是否可以通過主動許可(Opt-in)的方式同意并加入這一數(shù)據(jù)共享計劃?
對于Markey議員所提出的大部分問題,Amazon在其公開的“Amazon Silk使用協(xié)議”1(圖表6-1)和FAQ(圖表6-2)中都已經(jīng)涉及到了,因此并未造成很大的混亂。不過,這一質(zhì)詢的確引發(fā)了人們對于為用戶提供便利所必需的數(shù)據(jù)收集與隱私權(quán)兩者之間關(guān)系的關(guān)注。
Amazon隱私權(quán)問題
1.隱私權(quán)信息 通過Amazon Silk收集的可識別個人身份的信息,適用Amazon.com隱私權(quán)公告,該公告內(nèi)容為本協(xié)議的一部分。 Amazon Silk通過利用Amazon云計算服務(wù)來優(yōu)化和加速網(wǎng)頁內(nèi)容的傳輸。因此,正如為您提供Web訪問服務(wù)的大多數(shù)互聯(lián)網(wǎng)服務(wù)提供商(ISP)或類似服務(wù)一樣,您使用Amazon Silk所訪問的網(wǎng)頁內(nèi)容會經(jīng)過我們的服務(wù)器,并可能被緩存下來以提高后續(xù)頁面的加載速度。
對于安全連接(SSL)網(wǎng)頁的請求,Amazon Silk會讓您的計算機直接連接到原始服務(wù)器,而并不會經(jīng)過Amazon的服務(wù)器。
Amazon Silk會暫時性地記錄其所提供的頁面的網(wǎng)址(URL)。我們不會將這些URL與您的身份關(guān)聯(lián)起來,通常也不會將這些信息保存超過30天。 您也可以選擇讓Amazon Silk工作在基本模式或Off-cloud模式下。Off-cloud模式可以讓您的計算機直接訪問目標(biāo)網(wǎng)頁,而不經(jīng)過我們的服務(wù)器。在Off-cloud模式下,Amazon Silk依然能夠提供快速的瀏覽體驗,但它不會利用Amazon云計算服務(wù)來加速網(wǎng)頁內(nèi)容的傳輸。
如果您在Kindle設(shè)備上使用Amazon Silk,您的設(shè)備可能會將崩潰報告發(fā)送給Amazon。這些報告可能會包含可識別身份的信息,如IP地址或MAC地址。我們會使用這些崩潰報告對瀏覽器進行故障診斷以改進其性能。
您在Amazon Silk的地址欄中所輸入的文字會被發(fā)送給默認(rèn)的搜索引擎。初始的默認(rèn)搜索引擎是由Amazon Silk設(shè)置的,將來我們可能會在不事先通知您的情況下修改默認(rèn)搜索引擎設(shè)置。如果您愿意的話,也可以將其他搜索引擎用作默認(rèn)搜索引擎。發(fā)送給所選默認(rèn)搜索引擎的信息,應(yīng)適用該搜索引擎的隱私權(quán)政策。
來源:節(jié)選自http://www.amazon.com/gp/help/customer/display.html?nodeId=200775270中“1.Privacy Information”一節(jié),中文翻譯出自譯者。
Amazon Silk的FAQ(常見問題)
關(guān)于隱私權(quán)
Q. Amazon是否會跟蹤我的互聯(lián)網(wǎng)瀏覽記錄?
A. Amazon Silk會臨時性地記錄您所訪問的URL。記錄的URL信息是作為一個整體來歸總的,這些URL不會和您個人身份產(chǎn)生關(guān)聯(lián)。URL的保存期限最長為30天。這些歸總的信息,可以幫助Amazon Silk提高網(wǎng)頁加載速度。
Kindle Fire可能會向Amazon發(fā)送崩潰報告。這些報告中可能會包含可識別身份的信息,如IP地址和MAC地址,但這些信息僅用于技術(shù)上的問題診斷,不會與您的瀏覽記錄產(chǎn)生關(guān)聯(lián)。詳細信息請參見“Amazon Silk使用協(xié)議”。
Q. Amazon會收集哪些數(shù)據(jù)?能否簡要介紹一下,通過收集這些數(shù)據(jù),如何能夠?qū)崿F(xiàn)快速的網(wǎng)頁瀏覽?
A. 舉個例子,我們有一個叫做智能推送(Smart Push)的功能,它會對所有用戶的網(wǎng)頁加載過程(從統(tǒng)計學(xué)上)進行監(jiān)控。例如,通過收集用戶發(fā)送的數(shù)據(jù),我們發(fā)現(xiàn)某個網(wǎng)頁中名為logo.png的文件最近被加載了10萬次。在這種情況下,Silk的后臺服務(wù)器會在遇到對該網(wǎng)頁的其他請求時,在網(wǎng)站的HTML文件返回之前,事先將這個logo圖片推送給客戶端。
為了實現(xiàn)快速的網(wǎng)頁瀏覽,我們還有一種稱為預(yù)測渲染(Predictive Rendering)的優(yōu)化手段。例如,假設(shè)在某個非常流行的新聞網(wǎng)站上,大多數(shù)訪問者接下來都會點擊“商業(yè)”這個鏈接。在這種情況下,可以在主頁加載完畢之后,事先將一些靜態(tài)網(wǎng)頁元素(JavaScript、CSS、圖片等)推送給客戶端。如果訪問該新聞網(wǎng)站的用戶,接下來真的點擊了“商業(yè)”鏈接,我們自然會收到來自客戶端的HTML頁面請求,但其實大多數(shù)靜態(tài)的可緩存元素,在這個時候已經(jīng)存在于用戶的Kindle Fire上,并可以立即顯示出來。
Q. 這是不是意味著Amazon會在云端服務(wù)器上緩存我所瀏覽的內(nèi)容?
A. 正如提供Web訪問服務(wù)的ISP或其他類似服務(wù)一樣,在Cloud模式下,使用Amazon Silk所瀏覽的網(wǎng)頁內(nèi)容,會經(jīng)過我們的服務(wù)器。這些信息中的一部分會被緩存下來,目的是為了改善后續(xù)網(wǎng)頁的加載性能,幫助Silk提升網(wǎng)頁瀏覽速度。網(wǎng)站擁有者可使用緩存報頭來指定哪些內(nèi)容可以被緩存。Silk通過追蹤這些報頭,僅對網(wǎng)站擁有者認(rèn)為合適的信息進行緩存。
Q. Amazon會將歸總的瀏覽數(shù)據(jù)出售給第三方嗎?
A. 不會??蛻粜畔⑹俏覀儤I(yè)務(wù)非常重要的一部分,也是對客戶體驗與未來創(chuàng)新的重要推動力。我們不會向他人出售這些信息,將來也沒有計劃要出售這些信息。
Q. 如果我不希望我的互聯(lián)網(wǎng)請求經(jīng)過Amazon的云服務(wù)器,應(yīng)該如何做?如何才能關(guān)閉利用云服務(wù)的瀏覽加速功能?
A. 我們提供了用于關(guān)閉云加速功能的選項,在Amazon Silk的設(shè)置菜單中,取消“加速頁面載入”選項即可。在Off-cloud模式下,網(wǎng)頁不會經(jīng)過Amazon的云服務(wù)器,而是直接傳送到用戶的終端上,用戶可以無負(fù)擔(dān)地進行瀏覽。在設(shè)置畫面重新啟用這個選項,就可以隨時重新開啟云加速瀏覽功能。
Q. 對于安全https連接是如何處理的?
A. 在AmazonSilk中,SSL請求不會經(jīng)過Amazon云服務(wù)器,而是由Kindle Fire直接向原始服務(wù)器發(fā)送網(wǎng)頁請求。
Q. Silk中有其他擴展安全功能嗎?
A. 在使用Cloud模式時,可以選擇對Kindle Fire與Silk的加速服務(wù)器之間的所有Web通訊進行SSL加密。 要使用這個功能,可以觸摸設(shè)置菜單中的“加密選項”復(fù)選框。請注意,使用SSL可能會降低頁面的加載速度。
還需要注意的是,只有經(jīng)過Silk加速服務(wù)器的Web通訊才能享受這一功能所帶來的加密保護,而其他的情況下,例如關(guān)閉云加速功能時,Silk便無法提供加密功能。此外,即便開啟了云加速功能,某些情況下如果不經(jīng)過Silk服務(wù)器的加載效率更高,Silk會自動更改路由,直接向網(wǎng)站發(fā)送請求。在這樣的情況下,加密功能也不起作用。
本文截選自《大數(shù)據(jù)的沖擊》
- 目前還沒評論,等你發(fā)揮!