ニュースイミー

SRE

AWS Integartion 導入後にメトリクスがリソースタグで装飾されない場合のトラブルシューティングガイド

newrelic.com

- AWS Integration導入後にメトリクスがリソースタグで装飾されない問題のトラブルシューティングガイドです。 - タグ/メタデータ収集の仕組みと具体的な解決手順について解説します。 - AWSのインフラ運用やSRE、プラットフォームエンジニア向けの記事です。

New Relic株式会社 岡田 耕司
SRE

対応不要なアラート発生を減らす Mackerel監視改善の実践

mackerel.io

Mackerel SREチームが実践した、誤検知を減らし運用負荷を軽減するための監視設定改善事例を紹介します。Terraformでの具体的な設定変更や、OpenTelemetryを用いたメトリック化、アラート名の工夫など、実践的なノウハウが解説されています。 * Mackerelでのアラート誤検知を減らすための具体的な監視設定改善方法 * 障害発生時の通知精度向上と運用負荷軽減のためのテクニック * TerraformやOpenTelemetryを活用した実践的な監視設定の例

SRE

Synthetic MonitoringをつかってICMPポーリング実装したけど、そのデータを可視化する方法を考えて共有してみる

qiita.com

Synthetic Monitoringを用いてICMPポーリングを実装した際の、取得データの可視化方法について解説します。 記事では、スクリプトの共有だけでなく、そのデータをどのように活用できるかについてのアイデアも提案します。 インフラやSRE、ネットワークエンジニア、QAエンジニアなど、システム監視やデータ活用に関心のある方におすすめです。

SRE

「トラフィックの再ルーティングって何?」DNSからBlue/Greenデプロイまで整理した

qiita.com

- "トラフィックの再ルーティング"について、DNSやBlue/Greenデプロイなどの技術を解説。 - デプロイ作業におけるサーバー切り替えの概念を、AWSの経験が浅い読者にも分かりやすく説明。 - 曖昧な理解を解消し、デプロイ方法の全体像を掴むための記事。

SRE

【4コマ漫画】まいにちSRE vol.14~vol.15

levtech.jp

SRE(サイト信頼性エンジニアリング)に関する4コマ漫画の第14回と第15回。 SREの日常業務や考え方について、ユーモラスに描かれています。 SRE担当者や、SREに興味のあるエンジニア向けの記事です。

レバレジーズ株式会社 レバテックLAB
SRE

Azure Backupが使えないPremium BlobをAzure Storage Moverでバックアップする

zenn.dev

Azure Backupが適用できないPremium Blob Storageのデータに対して、Azure Storage MoverとGitHub Actionsを組み合わせた定期バックアップ運用を紹介する記事です。 - Azure BackupでバックアップできないPremium Blob Storageのデータ保護方法について解説します。 - Azure Storage MoverとGitHub Actionsを活用した具体的なバックアップ運用の手順を示します。 - Azureのストレージ管理における実用的なソリューションを求めているSREやインフラエンジニア向けです。

イオン株式会社 もりはや
SRE

スパンの概算使用量がラベル付きメトリックとして投稿されるようになりました ほか

mackerel.io

Mackerelのアップデート情報。 * トレースのスパン概算使用量がラベル付きメトリックとしてリアルタイムで投稿されるようになり、サービスごとの利用状況把握が容易になりました。 * 課題発生時の通知を一時停止できる「スヌーズ」機能が追加されました。 * クエリによる監視のアラートメールで、属性名ではなく実際の値が表示されるよう改善されました。 この記事は、Mackerelを利用しているエンジニア、特にインフラ・SRE・プラットフォーム担当者、およびプロダクトマネージャーやエンジニアリングマネージャー向けです。

SRE

ソフトウェアの依存関係アップデートはRenovateにした理由

blog.kinto-technologies.com

RenovateというOSSツールが、ソフトウェアの依存関係を自動でアップデートする利便性を解説しています。 特に、GitHubのDependabotと比較し、カスタムマネージャーによるインラインスクリプトのアップデート対応、ローカルでの設定デバッグの容易さ、複数リポジトリでの設定共通化の3点を評価しています。 インフラエンジニア、SRE、QAエンジニア、プラットフォームエンジニア、バックエンドエンジニアなど、ソフトウェア開発に関わるエンジニア全般が対象です。

SRE

Dailyコスト通知によるコスト意識強化

zenn.dev

- Azureのコスト管理・削減のため、社内全体のコスト意識強化を目的とした「Dailyコスト通知」の導入について解説しています。 - 普段意識しないAzureの莫大な費用とその削減に向けたSREチームの取り組みを紹介しています。 - Azureコストの現状把握と削減効果の可視化に関心のあるエンジニア、マネージャー向けの記事です。

イオン株式会社 Masahiko Kawada
SRE

【4コマ漫画】まいにちSRE vol.12~vol.13

levtech.jp

・SREの日常業務における出来事を描いた4コマ漫画の紹介です。 ・vol.12とvol.13の内容が含まれています。 ・SREやインフラエンジニア、またはIT業界に関心のある方におすすめです。

レバレジーズ株式会社 レバテックLAB
SRE

メールサーバの新たな選択肢「Stalwart Mail Server」を試す

knowledge.sakura.ad.jp

メールサーバーソフトウェア「Stalwart Mail Server」の導入について解説します。 さくらのVPS環境で、既存のメールサーバーに代わる選択肢として試した経験を共有します。 メールサーバーの運用やインフラ管理に携わるエンジニア、または新しい技術に興味のある方におすすめです。

SRE

従来の Apache Cassandra スタックを廃止し、Spanner で未来志向の基盤を構築

cloud.google.com

Google CloudのSpannerへの移行を推進する記事です。 * Apache Cassandraからの移行により、TCO削減、スケーラビリティ向上、運用負荷低減を実現します。 * ネイティブCQLエンドポイントにより、既存アプリケーションのコード変更を最小限に抑えつつSpannerの機能を利用可能です。 * この記事は、データベース管理者、SRE、インフラエンジニア、バックエンドエンジニア、アーキテクトなど、データベースの移行や最適化に関わる技術者向けです。

グーグル・クラウド・ジャパン合同会社 <name>Nitin Sagar</name><title>Product Manager</title><department></department><company></company>
SRE

Rollback from KRaft mode to ZooKeeper mode

speakerdeck.com

KRaftモード(開発段階)からZooKeeperモードへのダウングレード手順について解説しています。 - KRaftモードからZooKeeperモードへの安全なロールバック方法 - 運用中のシステムで発生した問題への対処法 - インフラエンジニア、SRE、データベース管理者向け

SRE

When an innocent-looking ListOffsets Call Took Down Our Kafka Cluster

speakerdeck.com

LYの大規模Kafkaクラスタ運用における、一見無害なListOffsets呼び出しが原因で発生した障害のトラブルシューティング事例を紹介します。 - Kafkaクラスタの運用で発生した予期せぬ障害とその原因究明について解説。 - 大規模システムにおけるインシデント対応や、根本原因の特定に役立つ知見を提供。 - インフラエンジニア、SRE、バックエンドエンジニア向けの記事。

SRE

Fastly メトリクス基盤を GKE に移行して精度も改善した話

developers.cyberagent.co.jp

Fastlyがメトリクス基盤をGKE(Google Kubernetes Engine)へ移行した事例について解説しています。 移行により、メトリクスの精度向上や運用負荷の軽減といったメリットが得られたとのことです。 インフラエンジニアやSRE、GKEの利用を検討しているエンジニアにおすすめの記事です。

SRE

【SRE】エムスリー エンジニア採用まつり SRE編

m3-engineer.connpass.com

エムスリー株式会社が開催するSREエンジニア向けの企業説明会イベントです。 医療DXを推進するプロダクト開発、全国リモートを支えるSREの技術基盤、SREチームの文化や働き方、採用ポジションやキャリアパスについて、VPoEやリードエンジニアが解説します。 SRE、バックエンド、フロントエンド、インフラ、ML、QA、セキュリティ、PdMなど、エンジニア職希望者全般が対象です。

SRE

GitHub Copilot CLIへAbout GitHub Copilot CLIを読みながら入門する

zenn.dev

GitHub Copilot CLIのGAを機に、筆者が公式ドキュメントを読みながら入門する様子を記した記事です。 VSCodeでのCopilot利用が主だった筆者が、CLI版の機能や使い方を模索します。 想定や感想が多く含まれる、入門者向けの速報的な内容となっています。

イオン株式会社 もりはや
SRE

CAM の SRE Unitで学んだ、Cloud Nativeな基盤を「安全に運用し続ける」ための視点と設計

developers.cyberagent.co.jp

CAMのSRE Unitでの経験を通して、Cloud Nativeな基盤を安全に運用し続けるための視点と設計について解説する記事です。 - SREの観点からCloud Native基盤の安全な運用方法を学びたいエンジニア。 - 安定したシステム運用を目指すインフラエンジニアやプラットフォームエンジニア。 - Cloud Native技術の運用設計に関心のあるアーキテクトやテックリード。

株式会社サイバーエージェント 技術 / クリエイティブ広報