Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
メールサービスの信頼性を支えるSREの取り組み
haruki
July 05, 2024
Technology
2
1k
メールサービスの信頼性を支えるSREの取り組み
haruki
July 05, 2024
Tweet
Share
More Decks by haruki
See All by haruki
「SRE初心者からの挑戦! 半年でやってきたことと今後の展望」
harukin721
0
1.2k
Other Decks in Technology
See All in Technology
初中級者用如何使用backlog -VALE TUDOEDITION-
in0u
0
120
CTOから見た事業開発とプロダクト開発 / My Perspective on Business and Product Development as CTO
keisuke69
4
940
20240717_イケコパ代表Copilot_in_Teams会社でこう使ってます
ponponmikankan
2
390
集中して作業する技術/how_to_work_deeply
hanhan1978
55
34k
How to Think Like a Performance Engineer
csswizardry
4
560
大規模Hive-Trino移行PJの事例紹介
lycorptech_jp
PRO
2
150
大人の社会科見学 ~ NTT 技術史料館に行ってみよう!
hmatsu47
PRO
0
250
スタートアップにおける Platform Engineering の 片鱗 / A glimpse of platform engineering in startups
bitkey
PRO
2
100
フルリモートワークはエンジニアの夢を叶えたか? #cm_odyssey
mamohacy
2
580
AWSサービスメニュー開発をしていてAWSを好きだ!と感じた瞬間
toru_kubota
0
110
SSVC DeepDive
futurevuls
0
3.5k
ペパボのオブザーバビリティ研修2024 説明資料
kesompochy
0
990
Featured
See All Featured
Pencils Down: Stop Designing & Start Developing
hursman
118
11k
Done Done
chrislema
179
15k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
77
15k
How to Think Like a Performance Engineer
csswizardry
4
560
Teambox: Starting and Learning
jrom
130
8.6k
Creatively Recalculating Your Daily Design Routine
revolveconf
214
11k
YesSQL, Process and Tooling at Scale
rocio
166
14k
Intergalactic Javascript Robots from Outer Space
tanoku
266
26k
RailsConf 2023
tenderlove
16
720
A better future with KSS
kneath
231
17k
StorybookのUI Testing Handbookを読んだ
zakiyama
15
4.9k
Designing Experiences People Love
moore
136
23k
Transcript
1 メールサービスの信頼性を支えるSREの取り組み 上島 春輝 / GMO Pepabo Inc. 2024.07.05 Road
to SRE NEXT@京都
2 1. 自己紹介
GMOペパボ 技術部 プラットフォームグループ 2022年9月 中途入社 3 自己紹介 上島 春輝 Uejima Haruki •
カラーミーショップのSRE • メール勉強中!!! • 初の社外登壇 • 奈良県出身 X : @harukin721
4 2. 担当サービス紹介
カラーミーショップ 5 担当サービス紹介 国内最大級のECサイト作成サービス ◦ 2005年にサービス開始 ◦ 現在のショップ数:約4万店舗 ◦ 現在の流通総額:約2,000億円
メールサービスの規模 ◦ メールアカウント数:約85,000ユーザー ◦ メールサーバー:20台 ◦ メールリレーサーバー:8台
6 3. メールサービスの信頼性とは
メールサービスの信頼性 7 メールサービスの信頼性とは • メールのなりすましや改ざんがなく、メールが遅延なく到達する • メールアカウント数やメールの送受信量の増加に柔軟に対応できる • CS部門と連携して、お問い合わせにすばやく対応できる
8 4. 発生した問題
9 ショップオーナーさん: 「メールが届いていないようです。」
なぜ、メールが届いていない? 10 発生した問題 • メールが届かない原因は多岐にわたる ◦ 特定の宛先のみメールが届いていないのか? ◦ 特定のメールサーバーからのみメールが届いていないのか? ◦
IPレピュテーションが低下して、DNSBLに登録されているのか?
11 特定のメールサーバから、 特定のサービスプロバイダ宛てのみ、 メール送信がブロックされていた
12 4. 対応と対策
13 自分たちでコントロール できることで対応を行う
どう対応したのか? 14 対応と対策 • Postfixのtransportファイルを使用し、特定のサービスプロバイダ宛 てのメール送信は別のメールサーバーを経由する • 送信元メールサーバーのIPを変更することで、ブロックを回避する • サービスプロバイダにブロックの解除申請を出す
Postfixのtransportファイル 15 対応と対策 • メールの送信経路を特定のサーバー経由に設定できる • ドメインやアドレスごとに送信経路を個別に設定できる
16 お問い合わせの前に気づくためには
お問い合わせの前に気づくためには 17 対応と対策 • 監視スクリプトを開発し、ブロックを自動的に検知 ◦ メールログから情報を取得し、問題を検知後はSlackへオンコール通知 ◦ オンコールドキュメントを作成し、アクションを起こして対応 SRE本
アラート : 「人間が即座にアクションを起こし て対応し、状況を改善しなければ ならないことが生じている、あるい は生じようとしていることを知らせ ます。」
18 メール送信量の増加を検知
メール送信量の増加を検知 19 対応と対策 • メール送信量の急激な増加はブロックを引き起こす可能性がある ◦ Gmailのガイドラインにも明記されている ◦ メール送信量の急激な増加を検知することは重要 ◦
メールアカウントが乗っ取られ、知らぬうちにスパム配信の温床になっ ていた場合など、問題発生時の初動対応が早くなる
20 5. まとめ
まとめ 21 まとめ • メールは、意図せずブロックされてしまうことがある • SREノウハウをメールサービスにも取り入れて改善 ◦ お問い合わせ前にブロックを検知 ◦
オンコールドキュメントを作成し、迅速に対応 ◦ メール送信量の急激な増加を検知
ご静聴ありがとうございました! 22