Googleで大規模障害発生！現実的にありえる、クラウドサービス利用不可│Gloria, Limited

2019年6月3日午前4時頃。
Googleで大規模障害が発生し、Gmailをはじめ、Googleカレンダーなど様々なサービスが使えない状況が発生しました。
(約4時間ほどで復旧した認識です。)

1 検知
2 対策
3 ざっくりとした原因(2019/06/24追記)
4 更新履歴

検知

自身のGmailに異変が。
プッシュ通知が遅い。
プッシュ通知が来ても、メールを受信していないように見える。(メール本文を受信しない。)
※自身は他キャリアからメールを転送しているものもあるため、他キャリア上では普通に受信できているけどGmailに届かない、ということで異変に気がつきました。

何か起きているのか？と状況をググって見たものの、特に見当たらず。(Googleの障害を調べるのにGoogle検索する、という間抜けさ。。)

G Suiteのステータスダッシュボードを見ると、真っ赤ですね。。

対策

正直、こういった障害を完全に無くすことは不可能だと思います。
仕方ない、とは言いませんが、100％防ぐのは絶対に無理です。
どれだけ可用性や耐障害性を高めたところで、何かは起こりえます。

現に、クラウドサービスのメジャープレイヤーでも、ここ数年で大規模な事件が起きています。(以下は一例)

AWS 2017/03/01
主にアメリカで、約4時間ほどサービスの停止
(公式報告)

Amazon Web Services, Inc.

米国東部（バージニア北部、US-EAST-1）リージョンで発生した Amazon S3 サービス障害について

…
Microsoft Azure 2019/05/03
DNS障害を起因とし、あらゆるサービスがほぼ全面停止
(まとめサイト)

また、上記のようなサービスを直接使っていなくても影響はありえます。
例えば、AppleのiCloudサービスの一部は、Google Platformを利用しているとの噂です。
AWSを使って提供されているサービスも数多ありますね。(弊社も、AWSを利用しています。)

かなり古いですが(2012年)、データが消えて復旧不可能になった事例もあります。

日本経済新聞

ファーストサーバ障害、深刻化する大規模「データ消失」　ヤフー子会社、クラウド時代の盲点を露呈（ネット事件簿） - 日本経済新聞

　クラウドに預けていたデータが、「雲」が消えるかのごとく消失してしまった。20日17時頃、レンタルサーバー会社のファース…

対策ですが、特に業務に致命的な影響が出るようなものは、ミラーリングなど、二重化するしかない対策はないと思います。
気をつけてインフラ・サービス設計しないといけないなぁと、この事件を受けて改めて感じました。

備えあれば憂いなし、しかし、備え方を間違えると元も子もない。
こちらもご参考くださいませ。

ちょっと待って！そのバックアップ方法、正しいですか？

データのバックアップ、みなさましっかりと実施されてますでしょうか。特にビジネスをされている方。データが飛んだら業務に大きなインパクトがあるのは避けられないと思います。｢そんなの当たり前だよ！しっかりやってるよ！｣とおっしゃる方も[…]

ざっくりとした原因(2019/06/24追記)

2019/06/05にはざっくりとした原因が発表されていますね。

記事によると、小規模なサーバに対して設定する内容を広範囲のサーバに適用してしまい、ネットワークの輻輳(*)が発生。
結果的につながりにくいサービスが多数発生した、ということのようです。
*輻輳(ふくそう)。ネットワークの処理が集中してしまい、いわゆる回線パンク状態になること。

Googleレベルでもこういった事故を完全に防ぐことはできないと思います。(人為的なことも絡んできますので)

少なくとも、同じ事は二度起こらないよう、対処していくしかないですよね。

更新履歴

2019/06/03 新規作成
2019/06/24 ざっくりとした原因を追記

"意見が持てる" デジタルコラム
絶賛配信中！
メルマガ詳細はこちら >>>

送信時点で「Privacy Policy」に同意したものとみなします。
広告を含むご案内のメールをお送りする場合があります。

最後までお読みいただき、ありがとうございました。
以下も、ぜひご活用ください^^

記事を書いた人

石黒直樹

株式会社グロリア代表取締役

未来創造請負人
IT顧問・情シス支援
フルスタックエンジニア

前職株式会社野村総合研究所 15年勤務のうえ退職。
現職株式会社グロリア代表取締役。

前職在職時は、高い品質が必要とされる金融系システムを担当。
大規模プロジェクト、開発、保守、運用など、情報システムに関するさまざまな経験を有する。

マネジメントや要件定義・システム設計のみならず、自身でもプログラミング可能なスキルを有する。
Python、Ruby、PHP、Swift、Kotlin、WordPress、RPA、Excelマクロ、写真・動画編集、AWS、GCP、インフラ構築など、必要で面白いと思ったものは何でもこなす。

現在、大企業・中小企業・個人事業主と規模を問わず、自身のノウハウ全てを使ってIT面を支えている。

モットーは「神は細部に宿る」。

■主たる保有資格など
・情報処理安全確保支援士(#019126)
・情報処理技術者試験(ITストラテジスト試験、プロジェクトマネージャ試験、テクニカルエンジニア(データベース)試験など他多数合格)
・ディープラーニングＧ検定 2018#2
・一般社団法人ＩＴ顧問化協会ｅＣＩＯメンバー

■活動実績など
・大企業様向け情報システム部門・業務部門支援
・中小企業様向けスクラッチシステム要件定義〜設計〜開発〜運用
・中小企業様向けデジタル環境整備・運用
・事業用Webサイト構築・運用、デジタルマーケティング支援
・ECサイト構築・運用
・IoTソリューションサービス企画・開発・実証実験
・大手企業様 PoC用アプリ開発
・ITツール製造・販売
・中小企業庁「中小企業デジタル化応援隊事業」IT専門家(2020、21年活動実績あり)
・執筆活動(書籍、雑誌、メルマガ、ブログ等)

■著書・寄稿など
・著書『情シスの定石〜失敗事例から学ぶシステム企画・開発・保守・運用のポイント』(技術評論社)
・著書『図解即戦力システム設計のセオリーと実践方法がこれ１冊でしっかりわかる教科書』(技術評論社)
・著者石黒による『情シスの定石』説明動画チラヨミ(bizplay様)
・寄稿『週刊東洋経済(2023/3/4特大号)』特集「文系管理職のための失敗しないＤＸ」の一部について執筆を担当
・インタビュー IT部門が“組織の将来を見据えた仕事”に取り組むためには？業務の負荷軽減、そのヒントを『情シスの定石』著者に聞く(アイティメディア株式会社様)
・寄稿 ITmedia PC USER『「目指せ↑ワンランク上の仕事術」デジモノ探訪記』

Googleで大規模障害発生！現実的にありえる、クラウドサービス利用不可

検知

対策

ざっくりとした原因(2019/06/24追記)

更新履歴

11-72.トラブル

【トラブル(解決済)】Apple Vision Proの充電ができない！？★後日談あり

【トラブル(解決済)】Windows11 Home → Pro へのアップグレードで、なぜかEnterpriseになりライセンス認証失敗

【トラブル(解決済)】RICOH Light Monitor 150BW にキャスト(無線)で接続できない！(Windows11)

【トラブル(体験談)】Galaxy Z Fold 3 画面フィルムが剥がれ･･･自身で復旧してみました

情報システムの"教科書"本を発売中！