7月25日消息,據媒體報道,網絡安全領域的領軍企業CrowdStrike于上周不幸觸發了一場波及全球的計算機系統大規模故障事件,其最新發布的詳盡聲明深刻剖析了此次事件的根源——一場內存讀取越界錯誤引發的連鎖反應。
時間回溯至UTC時間2024年7月19日(星期五)凌晨04:09,彼時正值全球多數地區的深夜,CrowdStrike作為常規維護流程的一部分,向全球用戶推送了針對Windows傳感器的關鍵內容配置更新。此次更新的初衷在于增強Falcon平臺的動態保護能力,旨在更精準地收集潛在新型威脅技術的遙測數據,以提前構筑安全防線。
然而,事與愿違,這批本應強化防御的快速響應內容配置更新中潛藏著未被識別的錯誤,直接導致大量運行傳感器版本7.11及以上版本的Windows主機系統崩潰。據統計,受影響的時間段集中在UTC時間04:09至05:27之間,而Mac與Linux平臺則幸運地避開了此次風波。
幸運的是,CrowdStrike迅速響應,于UTC時間05:27(北京時間13:27)成功修復了更新中的缺陷,有效遏制了故障范圍的進一步擴大。值得注意的是,此時間節點后上線的新系統或在前述時段內未接收到問題更新的系統均未受波及。
深入剖析此次事件,CrowdStrike的更新機制包括兩種:一種是隨傳感器預裝的內容更新,另一種則是靈活應對突發威脅的快速響應內容更新。本次故障正是后者中的一次失誤,特定內容在加載至傳感器內容解釋器時觸發了內存讀取越界異常,系統未能有效攔截并處理這一異常情況,最終導致了Windows系統的藍屏死機(BSOD)。
周一,CrowdStrike官方發布正式聲明,確認此次事件波及范圍廣泛,影響設備數量高達約850萬臺,這些設備往往作為關鍵組件嵌入于各大企業的復雜IT架構之中,因此實際影響范圍遠超初步估計。公司還高度警覺地提醒全球客戶,謹防不法分子借機行騙,指出已有黑客利用此次事件制造“快速解決方案”的假象,企圖傳播惡意軟件,進一步加劇事態的復雜性。