【SRE NEXT】New RelicのSREに学ぶSREのためのNew Relic活用法 感想

NewRelicについて色々調べていたら出てきた動画について、自分のメモとして感想を残しておきます。

  • NewRelicは最初はRailsのモノリシックなサービスであったのが現状は300のマイクロサービスで構成。1日に20〜70デプロイ。
  • NRDB。NewRelic独自のデータベース。毎分20億のデータ挿入、1兆件のデータに対してクエリを発行している。
  • Kafkaクラスターが使われている。90秒ブローカー、毎秒1500万メッセージ。
  • New Relic Alert Conditionを使い始めるためのベストプラクティス
  • SREやDevOpsチームでのアラート疲れの5つのよくある原因
  • 実際の障害対応では、アラート検知、重要度を設定、SREが障害対応を主導する、役割を定義。
  • NewRelicのSREは意外と会議が多い。MMFの一環でコードベースで開発エンジニアと議論する。
  • 「火について学ぶ」その最高のタイミングはまさに「火がついているとき」。
  • 実際に障害を起こすわけにはいかないのでGameDayを実施。避難訓練的な活動。
  • 攻撃側と対応側にチームを分けて、擬似的に障害が発生させる。
  • SLOレポート機能は意外と使えそう。

NewRelicは個人的に気になっているサービスなので、色々試してみよう。