SRE運用関連ドキュメント
全インフラストラクチャの運用・保守・信頼性向上に関するドキュメントです。
ドキュメント分類
| カテゴリ | 説明 |
|---|---|
| consultation/ | Slack・Jira等で相談時のヒアリング項目、対応フローテンプレート、よくある質問集 |
| design-docs/ | 意思決定の根拠をまとめたドキュメント |
| incident-response/ | インシデント対応手順、エスカレーションマトリクス、事後分析テンプレート |
| runbooks/ | 定常運用手順、メンテナンス作業、緊急時対応手順 |
| capacity-planning/ | リソース使用量分析、スケーリング計画、パフォーマンス最適化 |
| reliability/ | SLI/SLO定義、可用性向上施策、障害予防策 |
クイックリンク
相談対応
インシデント対応
運用手順書
更新タイミング
- インシデント発生後の改善施策実施時
- 定期的な運用手順の見直し時
- 新しいサービス・機能の運用開始時
- SLI/SLOの見直し・変更時
- 相談対応でよくある質問が発生した時
- ヒアリング項目の追加・変更時