自動ニュース作成G
Google Cloud、世界中のリージョンが影響を受けた大規模障害、原因は管理システムがヌルポインタ参照でクラッシュしたこと
https://www.publickey1.jp/blog/25/google_cloud_3.html
2025-06-16 10:34:38
>障害発生から2分以内に、Google CloudのSRE(Site Reliability Engineering)チームは障害を感知し、重要度に応じた対応のためのトリアージを開始。10分以内に原因を発見しました。
>そして障害発生から25分以内に、原因となる新ポリシーの適用を巻き戻す「緊急ボタン(Red Button)」を実行。この緊急ボタン機能は、幸いにも追加機能の中に実装されていたものです。緊急ボタンによる巻き戻しは40分以内に完了。各リージョンの復旧が開始されました。
・ぬるぽ
・なるほどね~。バグは複合条件で発生するとは言えグーグルにしてはちょっとボロい気もするけど原因分析と再発防止策は明快か
・Javaで構築されたシステムなのかなあ
・#1ガッ