Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
ポストモーテム読書会のすすめ
taxin
July 04, 2024
Technology
1
710
ポストモーテム読書会のすすめ
taxin
July 04, 2024
Tweet
Share
More Decks by taxin
See All by taxin
OpenTelemetry実践 はじめの一歩
taxin
0
1.8k
カスタムダッシュボードの活用方法とMackerel開発チームでの実践例
taxin
0
680
SREを「続けていく」あなたへ
taxin
1
300
Cloud runユーザーから見たk8s
taxin
0
830
ローカルk8s環境のススメ / k8s-tools-for-local
taxin
0
1.1k
EKS 101
taxin
0
830
Other Decks in Technology
See All in Technology
Matterport を使ってクラスメソッド各拠点のバーチャルオフィスツアーを作成してみた
wakatsuki
0
150
Github Actions 로 Android 팀의 효율성 극대화
hadonghyun
0
130
ペパボのオブザーバビリティ研修2024 説明資料
kesompochy
0
990
RDS for Db2 はじめの一歩・HA(高可用性)編 #1 /20240712-RDSforDb2-dojo
mayumihirano
0
150
運用改善、不都合な真実 / 20240722-ssmjp-kaizen
opelab
14
6.9k
フルリモートワークはエンジニアの夢を叶えたか? #cm_odyssey
mamohacy
2
580
頼られるのが大好きな 皆さんへ - 支援相手との期待の合わせ方、突き放し方 -/For_people_who_like_to_be_relied_on
naitosatoshi
1
200
僕はまだ見ぬ誰かを動かすために登壇をする。
ichimichi
15
4.8k
目標設定は好きですか? アジャイルとともに目標と向き合い続ける方法 / Do you like target Management?
kakehashi
6
1.1k
AWSで”最小権限の原則”を実現するための考え方 /20240722-ssmjp-aws-least-privilege
opelab
7
3.7k
開発と事業を繋ぐ!SREのオブザーバビリティ戦略 ~ Developers Summit 2024 Summer ~
leveragestech
0
370
大人の社会科見学 ~ NTT 技術史料館に行ってみよう!
hmatsu47
PRO
0
250
Featured
See All Featured
Designing the Hi-DPI Web
ddemaree
276
34k
Making the Leap to Tech Lead
cromwellryan
127
8.7k
The Power of CSS Pseudo Elements
geoffreycrofte
64
5.2k
Creatively Recalculating Your Daily Design Routine
revolveconf
214
11k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
35
6.3k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
20
7.1k
Rails Girls Zürich Keynote
gr2m
93
13k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
245
1.2M
4 Signs Your Business is Dying
shpigford
178
21k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
26
2.1k
How to train your dragon (web standard)
notwaldorf
79
5.5k
Stop Working from a Prison Cell
hatefulcrawdad
266
20k
Transcript
ポストモーテム読書会 のすすめ id:taxintt / @taxin_tt 2024/07/05 Road To SRE NEXT@京都
1
自己紹介 • 西川 拓志 ◦ id: taxintt / @taxin_tt •
Mackerel開発チーム SRE 2
3 みなさん
4 ポストモーテム書いてますか?
5 ポストモーテム 「読んで」ますか?
ポストモーテムとは? • post-mortem=事後検証 ◦ > a medical examination of a
dead person's body in order to find out the cause of death. • インシデントの再発防止策を検討するための プロセス 6 https://dictionary.cambridge.org/ja/dictionary/english/post-mortem
7 https://sre.google/sre-book/postmortem-culture/
ポストモーテムとは? • インシデントの再発防止策をまとめた社内向け のドキュメント ◦ インシデントとそのインパクト ◦ その緩和や解消のために行われたアクション ◦ インシデントの根本原因
◦ インシデントの再発を避けるためのアクション 8
9 https://sre.google/workbook/postmortem-culture/
はてなのポストモーテム文化 • ポストモーテムを書く文化がある • 他チームのポストモーテムは社内ナレッジ ベースに載り、作成時には全社通知がくる ◦ ポストモーテムの存在を知ることができる ◦ 他チームのポストモーテムも閲覧できる
10
11 読むしかないでしょ
ポストモーテム読書会 • 社内外のポストモーテムから題材を1つ選ぶ • Cosenseを使いながら読書会を実施する ◦ 読書 + コメント記入タイム (20
~ 25分) ◦ コメントをみながら議論をする (30分) ◦ 議論の中で挙がったTODO を確認する (5分) 12
13
読書会やってよかったこと • 「生きた」学びを得て、活用できる ◦ 特に、社内のポストモーテムは障害原因から障害対応の 様子、再発防止策まで具体的なことが書いてある ◦ 具体的な内容の方が、学びを得たり改善に繋げやすい 14
読書会やってよかったこと ◦ インシデントの根本原因 ▪ 「この障害、自分達のプロダクトでも発生し得るのでは? 」 ◦ 障害対応のフロー・ドキュメント ▪ いいと思った所を真似する、アレンジして取り入れる
◦ インシデントの再発防止策 ▪ 先んじて調査・実施することで障害を未然に防ぐ 15
読書会で出たTODO • 障害対応のプロセスの改善 ◦ 障害対応ドキュメントテンプレート、Runbookの改善 ◦ メンテナンス時の考慮事項のドキュメント化 • 監視ルールの点検会 ◦
コンポーネントごとに監視が充足しているか点検する • etc… 16
17
18 ポストモーテム 読んで活用していきましょう