拿什么來拯救下一次“微軟藍屏”?

0 評論 594 瀏覽 1 收藏 16 分鐘

上周微軟的藍屏事件波及全球,其影響力堪比一場網絡版的“普法戰爭”。這不僅是一個警示,更是對未來AI技術潛在風險的一次深刻反思。讓我們一起探究這場“微軟藍屏”事件的背后原因,以及它給現代社會帶來的啟示。

過去幾百年,7月19日都是沒什么歷史大事發生的一天,唯一記錄在冊的,是1870年這天,法國向普魯士宣戰,普法戰爭爆發,就此給44年后第一次世界大戰的劇變埋下引線。

那時的電報還需要架電纜使用,6年之后貝爾才發明電話,26年之后,人類才實現史上首次無線電通信,100年以后,手機才誕生。世界緩慢進入第二次工業革命的電氣時代,主要的信息傳遞還要依靠紙質的信件和公開發表的報刊文章。那時的人類對于通訊這件事還非常耐心,一切消息都經得起漫長的等待。

154年后的7月19日,世界多地的Windows系統,因為一個名叫Falcon的安全平臺的更新故障而出現了大規模的藍屏。這句話很拗口,154年前的電報員恐怕永遠無法理解,這場賽博時代的“千里之堤,潰于蟻穴?!?/p>

01 一塊藍屏停住半個地球

這天的藍屏被稱作史上最大的IT故障,甚至有人認為,這場事故是在預演潛藏在AI技術和IT行業里的崩潰風險。

2024年的北京時間7月19日,世界各處有超過850萬臺電腦卡在了同一個藍色界面。

圖源自網絡

中國的許多外企員工在這天實現提前下班,卻又在咖啡店遭遇點單故障;

加拿大的Mago因此被取消了出差飛機,久違的在家體驗了刷劇、洗衣服和做飯的放松工作日;

ris在美國加州的舊金山機場遭遇4小時的飛機延誤,又在登機2小時后被趕下飛機,在無法取回托運行李的情況下無奈回家;

日本羽田機場的地勤則在這天為上百名乘客手寫登機和行李牌。

全世界的航空、物流、醫療、金融等多個行業都在這場故障中受到影響:

數以千計的航班延誤或取消;機場滯留游客和行李出現擁堵;值機手續改為人工辦理;鐵路的列車位置信息也無法同步;

特斯拉的生產線受阻;萬豪、凱悅、希爾頓和洲際等諸多國際連鎖酒店集團的網絡操作系統停擺;

英國廣播公司無法播放早間新聞;多地的自動收銀系統受到影響;醫院的患者就診系統癱瘓;就連巴黎奧運會也因系統問題暫時了奧運證件激活服務……

圖源自網絡

在GPT引領的AI技術變革前夜,還會發生這樣一場因為一個bug席卷全球的網絡災難,引起全球各行業的集體宕機,荒誕感令人錯亂不已。

這還不是一場故意為之的網絡攻擊,而是一場草臺班子式的塌房,少數錯誤代碼“引發的血案”。

特別是它發生的時候很不湊巧,更多的人們開始焦慮,在即將到來的AI時代,一個同樣不起眼的bug,在AI的放大之下是否會引起更大規模、難以預測的后果?

因此,7月19日這天的停擺更像一種現代技術警示:再專業的安全軟件,也可能在設計或更新中出現紕漏。即使是科技巨頭,也會被一場小小的失誤絆倒。

02 到底發生了什么????

藍屏的英文全稱是Blue Screen Of Death,縮寫為BSOD,一般是由硬件故障、驅動程序問題、軟件沖突、系統更新錯誤等原因引起。這是Windows系統特有的崩潰顯示方式。藍屏其實是程序員開發工作中的“家常便飯”:“今天藍屏了,明天再努力吧”也是常有的事。更廣泛的領域里, Windows系統在過去幾年也曾偶爾出現過一些規模性的藍屏狀況,但從未像這次波及這么多國家。

這次“史上最大IT事故”的藍屏現象出現在中國、新西蘭、澳大利亞、日本、印度等多國,波及行業之廣前所未有。崩潰源頭直指網絡安全公司CrowdStrike,其在調查之后宣布了造成系統崩潰的技術原因:

2024 年 7 月 19 日 04:09 UTC(國際協調時間),CrowdStrike監測到新的網絡攻擊技術,于是向自家Windows 系統的Falcon軟件發布了傳感器配置更新。這并非新操作,自Falcon創建以來,CrowdStrike就一直每日更新策略、技術和程序,傳輸給自家平臺。

但在這次,其中的一個“通道文件”291號出現了邏輯錯誤,導致軟件在運行過程中依據錯誤規則,越界觸碰到了系統中的其他本不該接觸到的部分,這就緊急觸發了Windows系統的自我保護機制BSOD,即我們看到的世界范圍級藍屏。

事故的責任方CrowdStrike公司成立于2011年,是一家位于美國硅谷的網絡安全公司,可以被視作“美國的360”。這家公司以揭露俄羅斯對美國民主黨全國委員會的網絡攻擊而知名,為全球2.9萬家客戶提供終端安全,包括監測威脅情報、防病毒等在內的產品和服務,于126億美元的終端保護軟件市場中占據18%的份額,早在2019年6月于納斯達克上市。

CrowdStrike|圖源自網絡

就在問題發生的當天下午,公司的首席執行官George Kurtz做出解釋,稱這次發生的問題并非安全事件或網絡攻擊。但它還是對公司聲譽和客戶信任帶來了重大打擊,公司的市值一夜蒸發百億美元,股價暴跌。

作為與CrowdStrike緊密合作的科技巨頭,7月22日,微軟發言人在接受媒體采訪時,對此次藍屏做出補充說明,認為是歐盟的限制性措施引發了這次的全球故障。

2009年,微軟與歐盟達成協議,要給所有安全軟件開發商與自家軟件同等的系統訪問權限,讓像CrowdStrike這樣的第三方安全軟件,能輕松通過Windows系統執行極其深入且復雜的操作。這在最初是為了確保安全軟件開發商擁有公平的市場競爭環境,但也削弱了Windows系統的安全性和可控性,在15年后間接造成了這場事故。

如果此后歐盟對微軟放松了限制措施,也許可以降低這類由第三方軟件帶來的系統崩潰,但其也將在市場中占據更大的市場份額,未來又會有什么樣的風險,還不得而知。市場規范與科技發展的力量相互作用,在一次次網絡安全事件后得到沖擊與重塑。

03 重提網絡安全險和技術冗余論

2007年,電腦殺毒軟件Norton(諾頓)在升級后,將Windows XP系統的兩個關鍵系統文件將作病毒清除,這次“誤殺”造成國內數百萬臺電腦系統崩潰,出現藍屏、重啟的現象,給國內經濟造成了難以預估的損失。只是在彼時,由于國內法律在信息安全領域的空白,企業抵抗網絡風險、挽回損失和維護權利的路徑尚不清晰。

到了2024年7月的這次事故,全球已有超過15個國家和地區發布了超過一百部的網絡和數據安全法案,立法和監管推動了用于抵御風險的網絡安全保險市場的發展。

2019年的一項全球調查報告數據顯示,有超過一半的企業選擇購買網絡安全保險,年收入超過10億美元企業的投保率更是有57%。

據《2022年全球網絡安全保險市場報告》,2022年網絡安全保險市場規模約為119億美元,預計到2027年將達到 292億美元。索賠頻率和嚴重程度也拉高了保費,2022年第一季度,僅美國網絡保險的定價就上漲了110%。

整體來看,我國企業的網絡安全意識和網絡安全保險市場都起步較晚。近20年,隨著企業數字化轉型,越來越多的網絡安全問題開始出現。

2017年,一款名為WannaCry(想哭)的蠕蟲式勒索病毒就在中國等多個國家的企業、學校、醫院等地爆發并蔓延,這種病毒會強力封鎖電腦中的文檔、圖片和程序,索取用戶以比特幣支付的贖金。多行業因此受到影響。

wannacry蠕蟲病毒|圖源自網絡

類似風險還隱藏在企業員工可能遇到的網絡釣魚鏈接中,給用戶和企業帶來諸多如信息泄露、敲詐勒索、竊取資產、干擾業務等網絡安全風險?!?022年風險晴雨表》就顯示,勒索軟件攻擊、數據泄露、遠程辦公導致的IT漏洞和云平臺數據供應鏈中斷,已經成為如今企業最擔心的4類網絡風險。

隨著需求的增長,國內網絡安全保險業務發展也在提速。

《科技日報》報道稱,截至2023年7月,我國有37家保險公司(含外資、合資保險公司)提供89款在售網絡安全保險產品(含附加險9款)。工信部、國家金融監管總局聯合印發了《關于促進網絡安全保險規范健康發展的意見》。

這次的藍屏事件,或許將成為國內網絡安全險發展歷程的又一個分水嶺。

在這次的藍屏事件中,美國安德森經濟集團的首席執行官預測,藍屏事件造成的損失可能高達10億美元。更具體的數字至今還難以估計,有預測其將達到15億甚至上百億美元。7月24日,馬來西亞方官員還公開要求微軟和CrowdStrike考慮賠償全球在藍屏期間遭受損失的公司。

而保險經紀公司Marsh McLennan稱,有超過75家客戶可能會因為CrowdStrike全球性崩潰事件而提出網絡故障索賠。接下來,隨著核心技術問題被逐漸修復,眾多損失估算和索賠將陸續被提上議程。

從這場損失巨大的事故追根溯源,可以發現問題核心直指全球企業過于依賴單一產品,缺乏“冗余備案”的盲區。

微軟在全球擁有10億多用戶,卻將網絡安全服務交給全球少數幾家公司。而作為占據了一定市場份額的一家龍頭安全服務公司,卻在臨近周末的周五,一次性向全球客戶推出了更新內容,連灰度測試也沒有。

約翰霍普金斯大學凱瑞商學院的信息系統助理教授Javad Abed(賈瓦德·阿貝德)在接受采訪時就說:

“網絡安全的基本原則之一就是冗余。CrowdStrike事件清楚地提醒我們,無論供應商的聲譽如何,依賴單一的工具都會造成危險的單點故障,與多家供應商一起實施多層級的保護至關重要……

企業所有者不應僅僅將網絡安全服務視為一項成本,而應該將其看作對公司未來的一項必要投資?!?/p>

在網絡安全層面,通俗來說,就像是給電腦裝上一套自動備胎,當原來的設備出現故障,另一個“輪胎”可以自動補上,保持系統的正常運轉。從經濟角度考量,它意味著較高的成本投入,但在危急事件發生時,它可能于無形中消除一場災難。

“我一般會用次新版本或次次新版本的操作系統,穩定壓倒一切,不想當廠商的小白鼠?!币晃怀銕熯@么說。在大部分企業面臨藍屏危機時,一些使用30年前Windows老系統的企業躲過一劫,也從最極端的角度驗證了這種說法。

在技術融合日漸緊密,人們的工作生活愈發依賴互聯技術之時,如何在追求先進性的同時確保穩定:要便捷、經濟、還要允許適當的原始Plan Z。于靈活和笨拙間維持最起碼正常的運轉,是一個先進的數字化社會應該、并且迫切需要具備的能力。

參考資料:

《賽博&眾安科技:2022網絡安全保險科技白皮書》

《安全技術與保險服務相結合的新興險種——網絡安全保險有據可依》科技日報

文 | 徐嘉 編 | 園長

本文由人人都是產品經理作者【刺猬公社】,微信公眾號:【刺猬公社】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!