【トラブル(解決済)】【AWS】EC2が起動しない恐怖。「カーネルパニックを解消せよ」(インスタンスの接続性チェックに失敗しました)│Gloria, Limited

当サイトはAWS上で稼働させていますが、今までも色々とトラブルはありました。
しかし「EC2が起動できない」という事態は初でした。

「どうするんだ、コレ・・・」状態でしたが、なんとか解決できましたのでメモを残しておきます。

「EC2が起動できない」原因は様々かと思います。
必ずしも当内容で対応できるかは分かりませんので、ご了承ください。

1 発生事象
2 発生環境
3 対応方法

発生事象

EC2の調子がおかしかったため、EC2のコンソールから「インスタンスを再起動」を実行。

すると、起動時のチェックで「インスタンスの接続性チェックに失敗しました」となり、EC2が起動できず。
SSHで接続することもできません。

発生環境

AWS EC2
CentOS8系(KUSANAGI利用)

対応方法

原因の絞り込み

AWSコンソールにて、EC2 > 該当のインスタンス > アクション > モニタリングとトラブルシューティング > システムログを取得
にて、起動時のログが確認できます。

すると、下記のようなエラーが発生していました。

[ 3.948588] No filesystem could mount root, tried: 
[ 3.954357] Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(0,0)

「Kernel panic」とあるように、どうやらカーネル(OSの核となるプログラム)が壊れているように見えました。

確かに、先日サーバーのモジュールをアップデートしましたが、何かがダメだったのでしょう。
再起動がかかることで、破損が顕在化したものだと思われます。

修復の流れ

カーネルが壊れているのであれば、カーネルを修復すればOKのはず、です。

しかし、そもそもEC2が起動できないため、自力では復旧できません。

そのため、修復手順をザックリとお伝えすると以下になります。

破損しているボリュームを、該当のEC2から切り離す(ボリュームをデタッチ)
別EC2(レスキュー用EC2)から、そのボリュームに接続(ボリュームをアタッチ)
レスキュー用EC2でカーネルを修復
レスキュー用EC2から元EC2にボリュームを戻す
元EC2を起動

詳細手順

AWS公式に対処法が掲載されておりました。
そちらに従って実施する形になります。

Amazon Web Services, Inc.

EC2 インスタンスでのカーネルパニックエラーのトラブルシューティング

initramfs またはカーネルモジュールが欠けているため、カーネルをアップグレードするか、Amazon Elasti…

本件のポイントを下記に挙げておきます。

カーネルのバージョンを戻さないとダメだった

今回、カーネルのバージョンを戻さないと起動できませんでした。(最新だとうまく起動しなかった？)

カーネルを戻す手順も、AWS公式に掲載されております。

Amazon Web Services, Inc.

EC2 インスタンスの更新後に、安定したカーネルに戻す

更新が原因で、Amazon Elastic Compute Cloud (Amazon EC2) インスタンスを再起動で…

カーネルの過去バージョンがボリュームに残っているので、昔のバージョンで起動するように設定してあげるイメージですね。

破損ボリュームのマウントでエラー

手順に従ってもエラーとなりました。
レスキュー用EC2が破損したEC2の(破損前の)コピーであったため、ボリュームのUUID(固有の識別子)が同じであったことが原因と思われます。

一時的にマウントするのみですので、重複を無視する形で接続します。

# エラーになります
mount /dev/xvdf1 /mnt

#mount: wrong fs type, bad option, bad superblock on /dev/xvdf1,
#       missing codepage or helper program, or other error
#       In some cases useful info is found in syslog - try
#       dmesg | tail or so.

# 重複を無視してマウント
mount -o nouuid /dev/xvdf1 /mnt

クラスメソッド発「やってみた」系技術メディア | DevelopersIO

Amazon EBSマウント時の「wrong fs type, bad option, bad superblock on…」というエラーを解決する方法を教えてください | DevelopersIO

Amazon EBSマウント時にUUIDの重複エラーが発生した時の解決方法を紹介します。…

EC2が起動しなかった時はどうしようかと思いましたが、1つずつ紐解くことでなんとかなりました。

最悪、1週間前くらいのバックアップはありましたが、記事など更新していたため、できるだけ過去断面に戻りたくはなかったというのが本音です。

どこまでバックアップをとりながら運用するか。
これはコストと手間のバランスですね。

※本件は、当運用レベルからすると許容範囲の内容でした。

"意見が持てる" デジタルコラム
絶賛配信中！
メルマガ詳細はこちら >>>

送信時点で「Privacy Policy」に同意したものとみなします。
広告を含むご案内のメールをお送りする場合があります。

最後までお読みいただき、ありがとうございました。
以下も、ぜひご活用ください^^

記事を書いた人

石黒直樹

株式会社グロリア代表取締役

未来創造請負人
IT顧問・情シス支援
フルスタックエンジニア

前職株式会社野村総合研究所 15年勤務のうえ退職。
現職株式会社グロリア代表取締役。

前職在職時は、高い品質が必要とされる金融系システムを担当。
大規模プロジェクト、開発、保守、運用など、情報システムに関するさまざまな経験を有する。

マネジメントや要件定義・システム設計のみならず、自身でもプログラミング可能なスキルを有する。
Python、Ruby、PHP、Swift、Kotlin、WordPress、RPA、Excelマクロ、写真・動画編集、AWS、GCP、インフラ構築など、必要で面白いと思ったものは何でもこなす。

現在、大企業・中小企業・個人事業主と規模を問わず、自身のノウハウ全てを使ってIT面を支えている。

モットーは「神は細部に宿る」。

■主たる保有資格など
・情報処理安全確保支援士(#019126)
・情報処理技術者試験(ITストラテジスト試験、プロジェクトマネージャ試験、テクニカルエンジニア(データベース)試験など他多数合格)
・ディープラーニングＧ検定 2018#2
・一般社団法人ＩＴ顧問化協会ｅＣＩＯメンバー

■活動実績など
・大企業様向け情報システム部門・業務部門支援
・中小企業様向けスクラッチシステム要件定義〜設計〜開発〜運用
・中小企業様向けデジタル環境整備・運用
・事業用Webサイト構築・運用、デジタルマーケティング支援
・ECサイト構築・運用
・IoTソリューションサービス企画・開発・実証実験
・大手企業様 PoC用アプリ開発
・ITツール製造・販売
・中小企業庁「中小企業デジタル化応援隊事業」IT専門家(2020、21年活動実績あり)
・執筆活動(書籍、雑誌、メルマガ、ブログ等)

■著書・寄稿など
・著書『情シスの定石〜失敗事例から学ぶシステム企画・開発・保守・運用のポイント』(技術評論社)
・著書『図解即戦力システム設計のセオリーと実践方法がこれ１冊でしっかりわかる教科書』(技術評論社)
・著書『図解即戦力システム企画＆開発の知識と要点がこれ１冊でしっかりわかる教科書』(技術評論社)
・著者石黒による『情シスの定石』説明動画チラヨミ(bizplay様)
・寄稿『週刊東洋経済(2023/3/4特大号)』特集「文系管理職のための失敗しないＤＸ」の一部について執筆を担当
・インタビュー IT部門が“組織の将来を見据えた仕事”に取り組むためには？業務の負荷軽減、そのヒントを『情シスの定石』著者に聞く(アイティメディア株式会社様)
・寄稿 ITmedia PC USER『「目指せ↑ワンランク上の仕事術」デジモノ探訪記』

【トラブル(解決済)】【AWS】EC2が起動しない恐怖。「カーネルパニックを解消せよ」(インスタンスの接続性チェックに失敗しました)

発生事象

発生環境

対応方法

原因の絞り込み

修復の流れ

詳細手順

カーネルのバージョンを戻さないとダメだった

破損ボリュームのマウントでエラー

11-72.トラブル

【トラブル(解決済)】ASUS Zenbook Duo(2025)が充電できない！

【トラブル】初期不良？iPhone 16 Pro Max モバイル電波が落ちる･･･

【トラブル(解決済)】Apple Vision Proの充電ができない！？★後日談あり

【トラブル(解決済)】Windows11 Home → Pro へのアップグレードで、なぜかEnterpriseになりライセンス認証失敗

情報システムの"教科書"本を発売中！