ポストモーテム実践ガイド:インシデントを再発防止する事後検証の最適手法を解説
システム運用において、システム障害などのインシデントは避けられないものです。重要なのは、今後同じ事例を繰り返さないこと。そのために、インシデント対応の後に行う「ポストモーテム(postmortem)」が重要な役割を果たします。SRE(サイト信頼性エンジニアリング)やDevOpsの世界で注目されるこの手法は、顧客満足度の向上やチームの結束力強化に貢献します。本記事では、ポストモーテムの目的や具体的な進め方、実施時の課題とその解決策について解説します。
- システム障害などのインシデントの原因を特定し、再発防止策を検討するプロセス、またはそれをまとめた文章
- ポストモーテムを行うメリットは、顧客満足度の向上やチームの連携強化が実現できること
- ポストモーテムは、インシデント管理ツールへの記入、レビュー、再発防止策の検討と実施の流れで行う
-
中村 和弘システムインテグレーション事業本部 ビジネスソリューション事業部
主任/フェロー
ポストモーテムとは
ポストモーテムとは、「事後検証」という意味で、主にSREやDevOpsといったシステム開発手法で用いられます。システム障害やデータの消失などのインシデントに対して、その影響や根本的な原因を特定し、再発防止策を検討するプロセス、またはそれをまとめた文章を指します。
(出典)IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/archive/files/000080333.pdf
ポストモーテムが重視される理由は、システム障害の発生件数が年々増えていることにあります。この背景には、現代の複雑なシステムが原因の特定を困難にしていることが要因としてあげられます。インシデントの多発は、サービスへの信用が下がり、さらに企業への信頼性の低下にもつながります。
ポストモーテムを行うメリットは、適切な対策、再発防止策を検討することで、サービスの信頼性を向上させることにあります。また副産物としてはチーム間の連携強化があげられます。営業、技術など、垣根を越えて対策、再発防止策を検討することで、各チーム間の連携が強化されることにもつながります。
ポストモーテムの実施方法・ポイント
ポストモーテムの進め方は、まず、インシデント管理ツール(「Jira」や「Redmine」など)を用意してチケットなどにインシデントの詳細を記入していきます。事前に記入項目をまとめたテンプレートやフォーマットを用意すると記入がしやすいでしょう。
ポストモーテムが書かれた時点で、 できる限り多くのチームメンバーを集めてポストモーテムをレビュー(評価)します。議論の際には、他者の意見を否定せず、互いに尊重し合うことを意識すると、議論がより活発に行われるようになるでしょう。レビューでは各インシデントのステータスを確認し、対策、再発防止策の実施が確認できた場合に、完了したインシデントのポストモーテムをクローズします。
再発防止策を考える際のポイントは、根本原因をヒューマンエラーで片づけないことです。根本原因をインシデントの関係者にではなく、体制や仕組み、システム、プロジェクト管理などに求めます。
もちろん、インシデントの発生を完全に防ぐことが理想ですが、現実的に難しい場合はリスクを最小限に抑える方法を検討します。
ポストモーテムの課題と解決策
ポストモーテムの実施時によくある課題は2点あります。
1つ目は、プロジェクトマネージャーなどキーマンとなるメンバーのリソースが不足し、原因特定や再発防止策の検討を十分に行えない点です。この場合は、別の主担当を立てて、確実に推進します。各事案をひとつひとつ検討することでメンバーのレベルアップにもつながります。
2つ目は、企画部門や運用部門、情報システム部門間で連携できておらず、部門の垣根を超えた問題に対処できない点です。部門間の調整役となる人材がいなければ、インシデントの再発を防ぐのが難しくなります。この場合には、すべての部門がおなじ会議体に出席し、コミュニケーションをとりながら検討する進め方が有効です。他にも、部門間のコミュニケーションを促進するツールや、業務プロセスの導入も効果的です。
「富士ソフトBizDevOps」で運用・保守を推進
ビジネス・開発・運用の各部門が連携し、ビジネス要件を満たしたシステム開発・運用を行っていく「富士ソフトBizDevOps」では、ビジネス価値の最大化を図りながら、効率的な開発サイクルを確保し競争力を高めるための基盤を提供します。ポストモーテムは運用保守の効率化だけでなく、お客様のサービス・システムの価値向上にも大きく貢献いたします。
また、情報システムの担当者と同じ目線を持ち、企画部門や運用部門との連携を図ることも可能です。例えば各部門が連携できていない場合、お客様の内製チームとして「富士ソフトBizDevOps」が参画して開発を推進するだけでなく、開発や運用・保守の推進をお客様の意向をもとに自走して、負担を軽減します。部門間の連携強化によって解決の難しかったインシデントに対処できます。
ポストモーテムを推進するのはシステムエンジニアだけではなく、プロジェクト関係者全員を巻き込むことが大切です。そのためにBizDevOpsのノウハウを持った当社が各部門とのファシリテートをすることで効率よくプロジェクトを進めることができ、信頼性の向上につながります。
最近インシデントの発生が多い、システム運用に課題があるというお客様は、ぜひ「富士ソフトBizDevOps」をご検討してみてください。
※ 記載されている会社名、製品名は各社の商標または登録商標です。