Skip to content

SRE運用関連ドキュメント

全インフラストラクチャの運用・保守・信頼性向上に関するドキュメントです。

ドキュメント分類

カテゴリ説明
consultation/Slack・Jira等で相談時のヒアリング項目、対応フローテンプレート、よくある質問集
design-docs/意思決定の根拠をまとめたドキュメント
incident-response/インシデント対応手順、エスカレーションマトリクス、事後分析テンプレート
runbooks/定常運用手順、メンテナンス作業、緊急時対応手順
capacity-planning/リソース使用量分析、スケーリング計画、パフォーマンス最適化
reliability/SLI/SLO定義、可用性向上施策、障害予防策

クイックリンク

相談対応

インシデント対応

運用手順書

更新タイミング

  • インシデント発生後の改善施策実施時
  • 定期的な運用手順の見直し時
  • 新しいサービス・機能の運用開始時
  • SLI/SLOの見直し・変更時
  • 相談対応でよくある質問が発生した時
  • ヒアリング項目の追加・変更時