ニュースイミー

SRE

"SREって何やってるの?"をなくす——Claude Routineで活動レポートの自動化

zenn.dev

- "SREって何やってるの?"という疑問を解消するため、Claude Routineを活用してSREチームの活動レポートを自動化しました。 - SREチームのタスク管理をNotionでスプリント形式で行い、日報と週報を自動作成することで、チームの活動を見える化しました。 - SREチームの活動の透明性を高め、関係者への報告を効率化することを目的としています。 この記事は以下のような方におすすめです。 - SREチームの活動内容の可視化に課題を感じている方 - チームのレポート作成業務を効率化したい方 - Claude RoutineのようなAIツールを活用した業務改善に興味がある方

SRE

【日経×MIXI×カカクコム】SREで築く障害耐性〜長期運用を支える復旧力〜

nikkei.connpass.com

本イベントは、SRE(Site Reliability Engineering)をテーマに、大規模サービスにおける障害対応の最新動向と実践的なノウハウを共有するオンラインセミナーです。 障害を未然に防ぐだけでなく、発生時の影響を最小限に抑え、迅速に復旧し、再発防止に繋げるための「止める」「戻す」「学ぶ」という3つの視点から、MIXI、カカクコム、日本経済新聞社のエンジニアが具体的な事例を交えて解説します。 SRE、インフラ、プラットフォームエンジニア、大規模サービスの信頼性向上や障害対応に関心のあるエンジニア、技術戦略を担うCTOや技術リーダーにおすすめです。

SRE

Akamaiを利用したメンテナンスを時間ピッタリに開始する方法

zenn.dev

AkamaiのProperty ManagerのTime Interval機能を用いて、メンテナンス画面への切り替えを正確な指定時刻に開始する方法を解説します。 Akamaiは反映に時間がかかるため、計画メンテナンス時に正確なタイミングで切り替えるための具体的な設定手順を紹介します。 インフラエンジニアやSRE担当者で、Akamaiを利用した計画メンテナンスを正確な時間に行いたいと考えている方におすすめの記事です。

イオン株式会社 もりはや
SRE

Nagoya Tech Talk #3 〜CloudNative × Platform〜

sansan.connpass.com

名古屋で開催される「Nagoya Tech Talk #3 〜CloudNative × Platform〜」では、クラウドネイティブなプラットフォーム開発者のリアルな事例が共有されます。 本イベントは、CloudNativeやPlatform Engineeringに関心のあるエンジニアや、名古屋近辺で技術コミュニティとの繋がりを求めている方におすすめです。 成功談や挑戦中の課題について、LTや懇親会を通じて活発な議論が期待できます。

SRE

分散トレーシングとは?——仕組みから活用場面までわかりやすく解説

mackerel.io

・分散トレーシングは、マイクロサービスなどの複雑なシステムにおいて、リクエストが複数のサービスをどのように流れたかを記録・可視化する技術です。 ・「トレース」「スパン」「トレースID」「コンテキスト伝播」といった概念を通じて、リクエストのボトルネック特定や障害調査を支援します。 ・本記事は、システム開発者、特にバックエンドやインフラを担当するエンジニアが、システムのパフォーマンス改善や障害対応のために分散トレーシングを理解し、活用するための入門ガイドです。

SRE

AzureのIaC管理からログ調査まで、​随所に役立つ​SkillsとCustom-Instructions​ / Boosting IaC and Log Analysis with Skills

speakerdeck.com

- Microsoftのオンラインイベント「プロンプトで差がつくGitHub Copilot」の事例セッション資料。 - AzureのIaC管理やログ調査におけるSkillsとCustom-Instructionsの活用方法を解説。 - IaCやログ調査に関わるインフラ、SRE、プラットフォームエンジニアなどにおすすめ。

SRE

LINEヤフーエンジニアによるKubeCon + CloudNativeCon Europe 2026参加レポート

techblog.lycorp.co.jp

LINEヤフーのエンジニアがKubeCon + CloudNativeCon Europe 2026への参加経験を共有するレポート。 Kubernetesやクラウドネイティブ技術に関する最新動向や知見を、社内プライベートクラウドの開発・運用という文脈で解説。 プラットフォームエンジニア、インフラエンジニア、SRE、バックエンドエンジニアなど、クラウドネイティブ技術に関心のある技術者向け。

SRE

外形監視がIPv6に対応しました ほか10件のアップデート

mackerel.io

Mackerelの外形監視機能がIPv6に対応し、サービスメトリックグラフでの値の取得失敗が「途切れ」として視覚化されるようになりました。また、CookieやTLS・証明書のチェックが厳格化され、APMの通知対象サービス選択、メトリックエクスプローラーでの差分値表示保持、mkrコマンドの--quietオプション追加など、多数の機能改善が行われました。さらに、Slack通知の見た目変更やSAML認証のセッション期限設定機能などが予告されています。 * インフラエンジニア、SRE、プラットフォームエンジニア向け * Mackerelの機能アップデート、特に監視機能の強化に関心がある方 * サービス運用における課題解決や効率化を目指す方

SRE

ASTあされん -始業後30minリレー勉強会を10回まわして見えたこと-

zenn.dev

イオンスマートテクノロジー(AST)では、「ASTあされん」と名付けた始業後30分のリレー式勉強会を10回実施しました。 この勉強会では、AI活用や小売のドメイン知識など、幅広いテーマについて活発なディスカッションが行われました。 定例化は難しいものの、定期的に開催することでモチベーション向上や知識共有につながる有益な取り組みであると結論づけられました。 対象読者: - SREやインフラエンジニア - エンジニアリングマネージャーやテックリード - 社内外のモチベーション向上や知識共有に関心のある方

イオン株式会社 もりはや
SRE

Claude Codeの/powerupコマンドでpowerup する

zenn.dev

- Claude Codeの新しい/powerupコマンドを紹介する記事です。 - このコマンドは、Claude Codeの主要機能を体験できる公式チュートリアルです。 - 機能を「動かして理解する」ことで、基礎から体系的に把握できることを目的としています。

SRE

Envoy: エージェント型 AI ネットワーキングのための将来を見据えた基盤

cloud.google.com

エージェント型AIの普及に伴い、ネットワークに新たな責任が求められています。Envoyは、プロトコルを理解し、ポリシーを適用し、急速に進化するエージェントシステムに対応できる、将来を見据えた基盤を提供します。 この技術記事は、AIネットワーキングにおけるEnvoyの役割と、その拡張性、ポリシー適用能力、ステートフルなインタラクションのサポートに焦点を当てています。 ネットワークエンジニア、セキュリティエンジニア、インフラエンジニア、プラットフォームエンジニア、アーキテクト、SRE、機械学習エンジニア、Google Cloudユーザー、バックエンドエンジニア、コーポレートエンジニア、テックリード、エンジニアリングマネージャー、プロダクトマネージャー、リサーチャー、デザイナー、マーケター、プロジェクトマネージャー、QAエンジニア、および各種プログラミング言語やデータベースに携わるエンジニアを対象としています。

グーグル・クラウド・ジャパン合同会社 <name>Erica Hughberg</name><title>Product and Product Marketing Manager, Tetrate</title><department></department><company></company>
SRE

【重要】Mackerel WebコンソールおよびAPIエンドポイントのIPv6対応と、それに伴う「IP制限」機能の設定確認のお願い

mackerel.io

Mackerelは2026年5月21日よりWebコンソールとAPIエンドポイントのIPv6対応を開始します。IP制限機能を利用しているユーザーは、IPv6通信を利用している場合、IPv6アドレスの追加設定が必要です。設定を行わない場合、IPv6経由でのアクセスができなくなる可能性があります。 - MackerelのWebコンソールおよびAPIエンドポイントのIPv6対応について - IP制限機能利用者はIPv6アドレスの追加設定が必要 - 2026年5月21日までに設定確認・実施を推奨

SRE

PagerDuty Challenge Cup 2026 参加レポート

zenn.dev

PagerDuty Challenge Cup 2026への参加レポート。 インシデント対応力を競うコンテストの概要と当日の流れ、参加して得られた学びについて解説。 SREチームのエンジニア、インシデント対応に関心のあるエンジニア向け。

イオン株式会社 Masahiko Kawada
SRE

GitHub Copilot CLI の公式ハンズオンざっくり和訳 (第5章/7章) skills 編

qiita.com

GitHub Copilot CLIの公式チュートリアル「GitHub Copilot CLI for Beginners」の第5章「skills の作成」について、ハンズオン形式で和訳しながら解説しています。 Copilot CLIのスキル機能に焦点を当て、具体的な使い方を学びたい開発者向けです。 Copilot CLIのスキル作成方法を実践的に理解したいエンジニアにおすすめです。

SRE

AIに「やっちゃダメ」と言っても無駄だった──n8nにおけるハーネスエンジニアリング実践記

zenn.dev

- AIによるワークフロー自動生成の裏側で発生しうる、予期せぬAIの誤動作や意図しない挙動について解説しています。 - そのような問題に対処するための「ハーネスエンジニアリング」という実践的なアプローチを紹介しています。 - AIを安全かつ効果的に活用したいと考えているエンジニアや、AIによる自動化の課題に関心のある読者向けです。

Ubie株式会社 syucream
SRE

手作業で作ったBytebaseをClaude CodeでTerraform管理下に移した話

zenn.dev

・クラシルSREチームが、手作業で設定していたデータベース管理ツール「Bytebase」の設定をTerraformによるコード管理へ移行した事例。 ・AIコード支援ツール「Claude Code」を活用し、Terraformリソースの記述や設定作業を効率化したプロセスを紹介。 ・SREやインフラエンジニア、データベース管理者で、運用自動化やIaC(Infrastructure as Code)に関心のある読者向け。

SRE

GKE Inference Gateway を使用して、同じインフラストラクチャでリアルタイム推論と非同期推論を実行する

cloud.google.com

Google Kubernetes Engine (GKE) は、GKE Inference Gateway を使用して、リアルタイム推論と非同期推論の両方を同じインフラストラクチャで効率的に実行する新しい方法を導入します。これにより、リソースの断片化とコストの増加を解消し、GPU/TPU アクセラレータを単一の流動的なリソースプールとして活用できます。 このソリューションは、レイテンシに敏感なリアルタイム リクエストと、レイテンシが許容される非同期タスクをインテリジェントにスケジューリングし、リソース利用率を最大化します。・AIインフラストラクチャのコストとパフォーマンスのトレードオフに悩むエンジニア ・Google Kubernetes Engine (GKE) を利用している、または利用を検討している開発者・インフラ担当者 ・リアルタイムと非同期の推論ワークロードを統合し、リソース効率を高めたいと考えている方

グーグル・クラウド・ジャパン合同会社 <name>Abdullah Gharaibeh</name><title>Senior Staff Software Engineer</title><department></department><company></company>
SRE

Aurora MySQLの負荷は高騰していないのにエラーレートが悪化した原因がPerformance Schemaだった話

developers.cyberagent.co.jp

・Aurora MySQLで負荷が増加していないにも関わらずエラーレートが悪化した事象について、原因がPerformance Schemaにあったことを解説。 ・データベースのパフォーマンスチューニングやトラブルシューティングの経験があるエンジニア。 ・AWSやMySQLを利用しているインフラ・SRE担当者。

株式会社サイバーエージェント 技術 / クリエイティブ広報
SRE

SREを「努力」から「仕組み」へ — Platform Engineeringという選択

zenn.dev

SRE(サイト信頼性エンジニアリング)を「個人の努力」から「組織的な仕組み」へと移行させるためのPlatform Engineeringという選択肢について解説します。 ・SREチームへの移行から1年間の進捗と変化、そして変わらなかった点について。 ・「SREの民主化」という目標達成に向けた具体的な取り組みと課題。 ・Platform Engineeringの導入が、SREの効率化と組織全体の信頼性向上にどう貢献するか。

SRE

信頼性向上のためのSLI/SLO活用vol.1 - SLI/SLOフレームワークおよびサービス稼働状況確認ツール「LINE Status」開発記

techblog.lycorp.co.jp

・信頼性向上のためのSLI/SLOフレームワークと、サービス稼働状況確認ツール「LINE Status」の開発について解説しています。 ・SREチームがどのようにSLI/SLOを導入し、開発・運用を進めたかの実践的な記録です。 ・SRE、インフラエンジニア、プラットフォームエンジニア、エンジニアリングマネージャー向けの記事です。

SRE

ASTのGitHub CopilotとCopilot CLIの現在地をお話しします/How AST Operates GitHub Copilot and Copilot CLI

speakerdeck.com

・「AI運用勉強会#3」の発表資料で、GitHub CopilotとCopilot CLIの現在の運用状況について解説しています。 ・AIを活用した運用(Agentic Ops)の文脈で、これらのツールの具体的な活用事例や、今後の展望について触れられています。 ・SRE、プラットフォームエンジニア、アーキテクト、AI技術に関心のあるエンジニアやマネージャー向けです。

SRE

カオナビはDevOpsDays Tokyo 2026にシルバースポンサーとして協賛、スポンサーブースを出展、エンジニアが登壇します

note.com

株式会社カオナビが、2026年4月14日から16日に開催されるDevOpsDays Tokyo 2026にシルバースポンサーとして協賛し、スポンサーブースの出展とエンジニアの登壇を行うことを告知しています。 * DevOpsDays Tokyo 2026への協賛について * スポンサーブース出展とエンジニア登壇の実施 * カオナビの技術イベントへの関与について この情報は、DevOpsに関心のあるエンジニア、イベント参加者、およびカオナビの技術活動に興味のある人々向けです。

SRE

「気をつけます」を卒業する。GeminiのGemsで構築する「折れない」なぜなぜ分析

toranoana-lab.hatenablog.com

・AI(GeminiのGems機能)を活用し、「なぜなぜ分析」で「気をつける」に頼らない、仕組み改善に繋がる再発防止策を導き出す方法を解説。 ・AIは感情や忖度なく、論理的な破綻を指摘し、具体的なプロセスの不備特定を支援。これにより、心理的安全性を保ちつつ、真因に迫る分析が可能となる。 ・本記事は、エンジニアリングマネージャー、テックリード、QAエンジニア、SREなど、システム障害の再発防止と仕組み改善に関心のある技術者全般を対象としている。

SRE

freee Tech Night「SREからバトンタッチ!プロダクトチームによる静かな確定申告へ」

freee-tech-night.connpass.com

freee Tech Nightでは、確定申告期間におけるfreee会計のプロダクトチーム主体のキャパシティプランニングによる安定稼働の成功事例について共有されます。 インフラ施策、開発チーム主導のインフラ改善、Embedded SREの活動などが語られる予定です。 SRE、インフラエンジニア、バックエンドエンジニア、プロダクトマネージャー、プロジェクトマネージャー、データベースエンジニアなど、システムの信頼性向上や開発プロセス改善に関心のあるエンジニアや担当者向けの内容です。

SRE

Claude Codeを使ってCI待ち時間を20分から7分にした話

zenn.dev

Claude Codeを活用してCIの待ち時間を20分から7分に短縮した事例。 AIツールを用いてボトルネック分析と改善計画を立案・実行。 SREや開発チーム、AI活用に関心のあるエンジニア向け。

SRE

New Relic MCPで「NRQLどう書くんだっけ」から解放された

zenn.dev

New Relic MCPサーバーをClaude Codeに接続したことで、NRQLをコンソールで手書きする頻度が大幅に減少したという導入経緯と感想を紹介する記事です。 - New Relicを利用してインフラ運用や信頼性向上に取り組んでいるSRE担当者。 - NRQLの記述に手間を感じている、または効率化したいと考えているエンジニア。 - AIツールを活用した開発・運用効率化に関心のある方。

SRE

サーバーサイド・SRE志望学生向け クラウドネイティブハンズオン【ECS/EKS】in 関西

cyberagent.connpass.com

サーバーサイド・SRE志望の学生を対象とした、AWS上のECS/EKSを利用したクラウドネイティブ技術のハンズオンイベントが大阪・梅田で開催されます。 このイベントは、学生が抱えるクラウド利用のハードルを下げ、実践的なアーキテクチャを学べる機会を提供することを目指しています。 当日は現場エンジニアのサポートのもと、ECSとEKSへのサービスデプロイを体験し、比較することで、今後のクラウドサービス開発に役立つ実践的なスキルを習得できます。

SRE

鳴らない、止まらない、遅延する……New Relicアラートの疑問を公式ブログで解消する逆引き集

qiita.com

* New Relicのアラートに関する公式ブログ記事を、発生しうる疑問や問題、ユースケースに基づいて逆引き形式でまとめたリファレンスです。 * 鳴らない、止まらない、遅延するといった具体的なアラートの課題解決に役立つ情報を提供します。 * サイト信頼性エンジニア(SRE)、インフラエンジニア、テックリード、QAエンジニアなど、システム監視やアラート管理に関わるエンジニア向けです。

SRE

熟練者の知見を、チームの力に——Mackerelログ機能への思い

mackerel.io

Mackerelは、2026年夏〜秋頃の公開を目指して、ログ機能を開発中です。 この機能は、障害対応におけるチームの課題を解決し、熟練者の知見をチーム全体で共有・再現できることを目指しています。 具体的には、サービス単位でのログ閲覧や、過去のフィルタ条件の保存・再現機能を提供し、オブザーバビリティの向上と持続可能な運用体制の構築を支援します。

SRE

AI インフラストラクチャとしての Kubernetes: Google Cloud、llm-d、CNCF

cloud.google.com

- Google Cloud は、AI インフラストラクチャ戦略の最優先事項として、大規模基盤モデルの構築者や AI ネイティブ企業のニーズに応えるため、Kubernetes を中心としたソリューションを進化させています。 - llm-d が CNCF のサンドボックス プロジェクトとして承認されたことを発表し、Kubernetes LeaderWorkerSet (LWS) API や GKE Inference Gateway を活用して、AI 推論の効率とパフォーマンスを向上させる取り組みを共有しています。 - この記事は、AI モデルの構築者、AI ネイティブ企業、プラットフォーム エンジニア、AI 研究者を対象とし、オープンソースの AI インフラストラクチャの未来を共に築くことを呼びかけています。

グーグル・クラウド・ジャパン合同会社 <name>Abdel Sghiouar</name><title>Senior Cloud Developer Advocate</title><department></department><company></company>
SRE

SAP GUIをユーザー視点で監視する方法

qiita.com

SAPのパフォーマンスをユーザー視点で監視する方法について解説します。 インフラやアプリケーションの監視ツールだけでは、実ユーザーがSAPを問題なく利用できているかまでは保証できません。 この記事では、SAPの安定運用に向けた取り組みの一つとして、ユーザー視点での監視の重要性を説いています。

SRE

GitHub Actionsを意図せず大量実行させて社内CIを止めた話

blog.kinto-technologies.com

GitHub Actionsのワークフローを誤って大量に起動させ、社内CI/CDパイプラインを1時間停止させたインフラエンジニアによる体験談。 PRのコメント編集イベントをトリガーとしたワークフローが連鎖的に実行された原因と、その再発防止策について解説。 インフラエンジニア、CI/CD担当者、および開発チーム全体が、ワークフローのトリガー設定や仕様の理解、インシデント対応手順の重要性を学ぶのに適した記事。

SRE

New Relic Workflow Automationでアラート通知を動的に制御してみる

qiita.com

New Relicのワークフロー自動化機能により、アラート通知を動的に制御し、運用上の負担を軽減する方法を紹介します。 最新のアップデート情報や、無料プランでの試用方法についても触れています。 インフラエンジニア、SRE、バックエンドエンジニア向けの記事です。

SRE

読み取りのスケーラビリティを合理化する Cloud SQL の自動スケーリングを備えた読み取りプール

cloud.google.com

Google Cloud の Cloud SQL が、MySQL および PostgreSQL 向けに読み取りプールの自動スケーリング機能を提供開始しました。 この機能により、読み取り負荷の高いワークロードに対応するため、リードレプリカのプロビジョニングと管理が簡素化され、トラフィックの変動に合わせて自動的にスケールアップ・ダウンするため、運用負荷の軽減とコスト最適化が期待できます。 本機能は、アプリケーションの読み取りスケーラビリティを向上させたいデータベース管理者やインフラエンジニア、SRE、バックエンドエンジニア向けの記事です。

グーグル・クラウド・ジャパン合同会社 <name>Shahzeb Farrukh</name><title>Product Manager</title><department></department><company></company>