インシデント・調査依頼 緊急度定義
緊急度分類
緊急 (Critical)
対応開始時間: 1時間以内
対応時間: 24時間体制で対応
エスカレーション: 即座に管理職・関連チームに連絡
該当する状況:
- 本番環境でのサービス全停止
- セキュリティインシデント発生
- データ損失の可能性
- 金銭的損失に直結する障害
- ユーザー情報流出の可能性
対応チーム: SREチーム全員 + 開発チーム + インフラチーム
高 (High)
対応開始時間: 4時間以内
対応時間: 営業時間内優先対応
エスカレーション: 当日中にチームリーダーに報告
該当する状況:
- 本番環境での機能不全・性能劣化
- 多数のユーザーに影響する問題
- 重要なバッチ処理の失敗
- 決済機能の部分的な障害
- APIの高いエラー率
対応チーム: SREチーム + 関連する開発チーム
中 (Medium)
対応開始時間: 翌営業日まで
対応時間: 2営業日以内に完了
エスカレーション: 週次レポートで報告
該当する状況:
- 一部機能の不具合
- 監視アラートの発生
- パフォーマンスの軽微な劣化
- 管理画面の問題
- 非重要バッチの失敗
対応チーム: 担当SREエンジニア + 必要に応じて開発チーム
低 (Low)
対応開始時間: 3営業日以内
対応時間: 1週間以内に完了
エスカレーション: 月次レポートで報告
該当する状況:
- 将来的なリスクの調査
- システム最適化の検討
- ドキュメント整備
- 予防的なメンテナンス
- 技術的負債の解消
対応チーム: 担当SREエンジニア
緊急度判断フローチャート
サービス停止中? → YES → 緊急
↓ NO
ユーザーに大きな影響? → YES → 高
↓ NO
監視アラート発生? → YES → 中
↓ NO
改善・調査依頼? → YES → 低緊急度変更の判断基準
アップグレード(緊急度を上げる)
- 影響範囲が拡大した場合
- 復旧見込み時間が大幅に延長した場合
- 追加の問題が発見された場合
ダウングレード(緊急度を下げる)
- 影響範囲が限定的であることが判明した場合
- 暫定対応で影響を軽減できた場合
- 根本的な解決までの回避策が確立した場合
対応時間の定義
対応時間
- 平日: 10:00 - 19:00 (JST)
- 土日祝日: 対象外(緊急時は除く)
緊急時オンコール体制
- 緊急・高レベルのインシデントは24時間体制
- オンコール担当者への連絡手順: [別途定義]
関連ドキュメント
更新履歴
| 日付 | 変更内容 | 更新者 |
|---|---|---|
| 2025-08-12 | 初版作成 | SREチーム |