周詳 (@chouhsiang.tw) on ThreadsCloudflare 官方說明了昨天全球Cloudflare事故原因。這是在 11/18 遭遇 2019 後最大規模的全球中斷。不是攻擊,是內部系統變更惹的禍。
🚨 發生什麼事?
工程師調整資料庫(ClickHouse)的權限時,某些查詢回傳出「重複列」,造成 Bot Management 用的「特徵檔」行數突然變兩倍。
這份檔案會被推播到全世界的 Cloudflare 節點,但代理系統對特徵數量有上限,太多會直接爆炸。
結果就是:
➡️ 流量代理當掉
➡️ CDN 回應 5xx 暴增
➡️ Cloudflare Access、Workers KV、儀表板登入都掛掉