zenn.dev
MIXI SRE Topics Monthly 2026-03号では、SREエンジニア間の情報交換会で共有された内容が紹介されています。今月は特に「AIとオブザーバビリティ」というテーマで、AWS Observability Kiro Powerについて触れられています。
- SREエンジニア向けの、MIXI社内でのSRE活動に関する共有記事。
- AIとオブザーバビリティ、特にAWSのサービスに焦点を当てた内容。
- SREチーム内の情報共有やベストプラクティスに関心のあるエンジニアが対象。
mackerel.io
OpenTelemetryは、システムの内部状態を可視化する「オブザーバビリティ」を実現するための、テレメトリーデータ(メトリック、トレース、ログ)を標準的な方法で生成・収集・エクスポートするフレームワークです。
ベンダーロックインの回避、計装の一元化、シグナル間の相関分析といったメリットがあり、Cloud Native Computing Foundation(CNCF)のプロジェクトとしてオープンソースで開発されています。
バックエンドエンジニア、インフラエンジニア、プラットフォームエンジニア、アーキテクトなど、システムのオブザーバビリティ向上に関心のある開発者や技術リーダー向けの記事です。
toranoana-lab.hatenablog.com
- 通販システムの運用における「監視対象の多さと判断の難しさ」「手作業によるミス」という2つの悩みを、AIを活用して解決する事例を紹介。
- OracleDBのアラートログ監視や、Slackからの自然言語指示によるサーバー調査用Slackbotの開発について、具体的な仕組みと効果を解説。
- AIのシステム運用への組み込みは、効率化だけでなく、作業者の心理的負担軽減にも繋がり、今後は自動復旧なども視野に入れている。
この技術記事は、以下のような方々を対象としています。
* システム運用担当者
* バックエンドエンジニア
* インフラエンジニア
* アーキテクト
speakerdeck.com
遊びで始めたNew Relic MCPが、気づけばChatOpsなオブザーバビリティボットへと発展した事例を紹介しています。
AIとオブザーバビリティの活用に焦点を当てたLT資料です。
インフラ、SRE、プラットフォームエンジニア、およびAIやオブザーバビリティ活用に関心のある技術者向けの記事です。
developers.cyberagent.co.jp
LLMのモデル廃止リスクに備えるため、TypeScriptで型安全なモデルカタログを構築する方法について解説しています。
LLMプロバイダー(Azure OpenAI / Vertex AI / Anthropicなど)のモデル変更に柔軟に対応できるシステム設計のヒントを提供します。
LLMを利用する開発者、インフラエンジニア、プラットフォームエンジニア向けの記事です。
toranoana-lab.hatenablog.com
関西のエンジニアコミュニティ「第四回 唐揚げ会」のイベントレポート。
テーマは「AIとエンジニア」で、LTやスポンサーセッショントークを通じて、AIの組織導入の難しさやエンジニアキャリアの変化などが語られた。
特にAIの権限設定に関するSREの視点からの発表が注目された。
・AIとエンジニアリングに興味のあるエンジニア
・AIの組織導入や運用における課題解決に関心のある方
・関西のエンジニアコミュニティの動向を知りたい方
cloud.google.com
AlrikはGoogle Maps Platformを活用し、建設業界の輸送ロジスティクスにおける透明性と効率性を向上させるプラットフォームを提供しています。
- 建設現場特有の複雑な配送制約を解消し、リアルタイムで正確な輸送費用とルートの最適化を実現します。
- 配送状況の可視化と追跡機能により、関係者間のコミュニケーションを円滑にし、CO2排出量のデータ提供も可能にします。
- このプラットフォームは、建設業界のサプライヤー、販売業者、請負業者、およびロジスティクス関係者向けです。
グーグル・クラウド・ジャパン合同会社 <name>Axel Enblad</name><title>Founder and CPO, Alrik</title><department></department><company></company> sansan.connpass.com
「データ活用のリアル」と題したSansan Tech Talk @関西 vol.3のイベントレポート。
データ活用における表面的な華やかさだけでなく、データ収集、定義統一、品質担保といった地道で泥臭い基盤整備の重要性に焦点を当てる。
エンジニア、データ基盤構築者、データ活用推進者、関西のエンジニアコミュニティ参加者におすすめ。
blog.kinto-technologies.com
1時間半かかっていたデータ取り込み処理をISUCONで培った知識を活かして5分に短縮した事例
・オンメモリキャッシュ、UPSERT、バルク処理を段階的に適用
・SQL実行回数を250万回から500回まで削減
・インフラエンジニア、バックエンドエンジニア向け
developers.cyberagent.co.jp
WINTICKETにおけるインシデント避難訓練の実施方法と、1年間の運用で得られた知見について解説。
・GUIベースのツールの選定理由やAIによるシナリオ生成など、具体的な訓練の仕組みを紹介。
・インフラ・セキュリティ担当者、エンジニアリングマネージャー、SRE担当者向けの記事。
qiita.com
ネットワーク監視(NPM)におけるSNMPポーリングの実施状況をダッシュボード化し、その経験を共有する記事です。
ネットワークの専門知識がなくても、取得したデータを可視化することで、様々な気づきや異常の早期発見につながります。
ネットワーク運用に課題を感じているインフラエンジニアや、ネットワークの可視化に興味がある方におすすめです。
www.publickey1.jp
AWSがAmazon Aurora PostgreSQLサーバーレスに、数秒でデータベースを作成できる「エクスプレス設定」を正式機能として追加しました。
これにより、従来必要だったVPCやセキュリティ設定などの手間が大幅に削減されます。
データベースの迅速な構築を求めるインフラエンジニア、バックエンドエンジニア、およびデータベース管理者に向けた情報です。
toranoana-lab.hatenablog.com
AWSのCloudWatchログを、Slack WebhookとLambda関数を連携させてリアルタイムでSlackに転送する設定方法を解説しています。
ERRORやWARNレベルのログをフィルタリングし、Slack上で通知を受け取ることで、迅速な問題検知と対応が可能になります。
AWSでアプリケーションを運用しているインフラエンジニアやバックエンドエンジニア向けの記事です。
www.publickey1.jp
デジタル庁が、さくらのクラウドがガバメントクラウドの技術要件をすべて満たし、正式決定されたことを発表しました。
さくらのクラウドは、令和8年度(2026年度)のガバメントクラウド整備のための新規クラウドサービスとして採択されました。
この記事は、ITインフラ、バックエンド開発、政府機関のDX推進、クラウドサービスに関心のあるエンジニアや担当者向けです。
newrelic.com
New Relic Browser Consent Modeの紹介
プライバシー規制の変更に柔軟かつスマートに対応する新機能
Webサイトのパフォーマンス監視とユーザー体験の可視化に役立つ
note.com
クラウドネイティブ型電子カルテ導入における補助金制度の紹介と、今後の市場の見通しについて解説します。
医療機関のIT担当者、経営層、およびITベンダー向けの情報です。
制度活用によるDX推進の可能性を探ります。
mackerel.io
Mackerelは外形監視のIPv6対応を近日リリースします。
これにより、既存の外形監視設定はIPv4で継続されますが、アラートメッセージの変更に伴い、アラートが再度通知される可能性があります。
インフラエンジニア、ネットワークエンジニア、プラットフォームエンジニア、セキュリティエンジニア向けの情報です。
qiita.com
Webページでの動画再生において、YouTube埋め込みに代わる自前配信の必要性に言及。
mp4ファイルをHLS形式に変換し、さくらのクラウド上で配信する手法を解説。
動画配信の効率化や安定化を目指すインフラ、バックエンドエンジニア向け。
cloud.google.com
Google Cloudが次世代キャッシュ保存ソリューション「Memorystore for Valkey 9.0」の一般提供を開始しました。このアップデートでは、パフォーマンスが大幅に向上し、SIMD最適化やパイプラインメモリプリフェッチなどの新機能により、スループット向上とレイテンシ削減を実現しています。また、ハッシュフィールドごとの有効期限設定、地理空間ポリゴン検索、条件付き削除(DELIFEQ)などの新コマンドや、クライアントリストのフィルタリング機能が追加され、開発者の要求に応えています。
この記事は、以下のような読者に向けて書かれています:
* 高パフォーマンスなキャッシュソリューションを求めるバックエンドデベロッパーやアーキテクト
* 低レイテンシと高スループットが求められる金融、メディア、エンターテイメント業界の開発者
* 分散ロックやデータライフサイクル管理の効率化を図りたいエンジニア
グーグル・クラウド・ジャパン合同会社 <name>Jacob Murphy</name><title>Software Engineer</title><department></department><company></company> qiita.com
New Relic Flexを用いてLinuxサーバーのCPUコアごとの使用率を可視化する方法を解説します。
標準のInfrastructure Agentでは難しい、コアごとの詳細な負荷状況やシングルスレッドプロセスのボトルネック特定を可能にします。
インフラエンジニアやSRE担当者、サーバー運用に携わる方々におすすめの記事です。
www.publickey1.jp
1Passwordが、人間とAIエージェントのID・パスワード・パスキー・シークレット情報を一元管理できる新機能「Unified Access」を発表しました。
これにより、企業はセキュリティと管理の複雑さを軽減できます。
セキュリティ担当者、インフラエンジニア、エンジニアリングマネージャー向けの記事です。
newrelic.com
New Relicの2026年2月のアップデート情報について解説しています。
本記事は、New Relicの最新情報を把握しておきたいエンジニアや、プロダクトマネージャー、プロジェクトマネージャー向けの内容です。
アップデートの概要を掴むための「Top takeaways」と、詳細なスライド資料への案内が含まれています。
mackerel.io
Mackerelは、Webフロントエンドやモバイルアプリからのトレース投稿に特化したクライアントトークンをリリースしました。これにより、セキュアなクライアントサイドからのトレース送信が可能になります。
また、トレース課題通知のスヌーズ解除までの残り時間表示、Slack連携設定場所の変更、Azure Front Doorメトリック取得、オーガニゼーション絞り込み機能、ホスト詳細画面の管理名表示、グラフ描画フォント変更、terraform-provider-mackerel v0.9.0リリースなど、多数の機能改善が行われました。
この記事は、Webフロントエンドエンジニア、モバイルアプリ開発者、インフラエンジニア、SRE、およびMackerelを利用する開発者全般を対象としています。
cloud.google.com
Google Cloudは、複数のGoogle Kubernetes Engine(GKE)クラスタにわたるAI/ML推論ワークロードのスケーラビリティ、復元力、効率性を強化する「マルチクラスタGKE Inference Gateway」のプレビュー版を発表しました。これにより、可用性のリスク、スケーラビリティの上限、リソースのサイロ化、レイテンシといったAI推論における既存の課題に対処し、グローバルなAIワークロードの展開を容易にします。
* AI/ML推論ワークロードを複数のGKEクラスタ(異なるリージョンを含む)に分散させ、グローバルなスケーラビリティと高可用性を実現します。
* GPU/TPUリソースのプール活用、需要の急増への対応、リソース使用率の最適化を可能にします。
* モデルごとのインテリジェントなロードバランシングにより、レイテンシの影響を受けやすいタスクや緊急性の低いワークロードを効率的に管理します。
このツールは、AI/MLモデルのサービングを大規模かつ確実に行う必要のあるインフラエンジニア、SRE、バックエンドエンジニア、そしてAI/MLワークロードをグローバルに展開・管理するアーキテクトやプロダクトマネージャー向けです。
グーグル・クラウド・ジャパン合同会社 <name>Andres Guedez</name><title>Senior Staff Software Engineer</title><department></department><company></company> knowledge.sakura.ad.jp
さくらインターネットのGPUサーバーを利用したLLM(大規模言語モデル)の分散推論基盤の性能検証について解説します。
本記事は、分散推論基盤の構築や性能に興味がある、またはLLMの活用を検討しているエンジニアや研究者向けです。
qiita.com
動画配信サービスにおけるオブザーバビリティ(観測可能性)の重要性について解説したまとめ記事です。
基本的なアプリのパフォーマンスやエラーに加え、動画特有の遅延やバッファリングといった動画品質の観測が不可欠であることを説明しています。
SRE、インフラエンジニア、バックエンドエンジニア、プラットフォームエンジニア、QAエンジニア向けの記事です。
www.publickey1.jp
・マイクロソフトが「Azure Skills Plugin」を公開しました。
・これにより、GitHub Copilotなどが「このアプリをデプロイせよ」と指示するだけで、最適なインフラ構成とサービスで自動デプロイできるようになります。
・開発者、特にインフラ構成やデプロイ作業を効率化したいエンジニア向けの記事です。
speakerdeck.com
Sansanの認証基盤を支えるアーキテクチャについて、イベントでの発表内容をまとめた記事です。
バックエンドエンジニア、インフラエンジニア、プラットフォームエンジニア、アーキテクト、SRE、コーポレートエンジニア、データベースエンジニア、AWSを利用するエンジニア、セキュリティに関心のあるエンジニアを対象としています。
speakerdeck.com
製造業における定型化されないデータへの挑戦について解説します。
高度な絞り込みと意味検索をElasticsearchで実現する実践的な方法を紹介します。
インフラエンジニア、データサイエンティスト、データベースエンジニア、アーキテクト向けの内容です。
cloud.google.com
Google CloudとNVIDIAは、エージェント型AIの時代に対応するため、AIインフラストラクチャのパートナーシップを拡大し、GTC 2026で新たなソリューションを発表しました。
Google Cloud AI Hypercomputerの強化、NVIDIA RTX Pro 6000 Blackwell Server Edition GPU搭載G4 VMの提供、分割式G4 VMのプレビュー、NVIDIA Vera Rubin NVL72プラットフォームのサポート、DynamoとGKE Inference Gatewayのインテグレーションなどが含まれます。
この記事は、AIインフラストラクチャ、機械学習、クラウドコンピューティングに関心のあるインフラエンジニア、機械学習エンジニア、クラウドアーキテクト、およびプロダクトマネージャーを対象としています。
グーグル・クラウド・ジャパン合同会社 <name>Mark Lohmeyer</name><title>VP & GM, AI & Computing Infrastructure</title><department></department><company></company> qiita.com
- Synthetic MonitoringでICMPポーリングを実装し、そのデータを活用したアラート設定について考察する記事です。
- ネットワークの可視化に成功した後、具体的なアラート戦略を検討する段階に至った開発者や運用担当者向けです。
- 絶対的な正解はないとしながらも、データに基づいた実用的なアラート設定のアイデアを提供します。
www.publickey1.jp
国内のIaaS/PaaSクラウド市場は2026年度に約2兆4400億円、2029年度には約3兆7000億円へと成長すると予測されています。
これは年平均14.6%の成長率によるものです。
この記事は、クラウド市場の動向に関心のあるIT担当者やビジネスパーソン向けです。
developers.cyberagent.co.jp
Datadog MCPが利用できない状況でも、agent-skillsとpup、Github Actionsを連携させることでAIを活用したインシデント調査を可能にする方法を解説します。
- Datadog MCPの代替手段としてAIを活用したインシデント調査の実現方法
- Github Actionsとagent-skills、pupの連携による自動化
- インフラエンジニア、SRE、コーポレートエンジニア向け
newrelic.com
ピーク時のデータ分析の重要性と、New Relicを活用した実行可能な分析のヒントについて解説します。
ピークイベント時に、システムに関する質問に迅速かつ的確に答える必要性に迫られる状況を想定。
データドリブンな企業で、ピークイベント時に迅速かつ簡潔な対応が求められる担当者や、システムパフォーマンスの可視化と実行可能な分析を両立させたいエンジニア、テックリード、マネージャー向け。
qiita.com
- New Relic Pathpointの活用法を紹介し、複雑化するサービス構成における全体像の把握を支援します。
- ビジネスフローと監視データを紐付け、サービスを俯瞰的に可視化する機能について解説します。
- システムの全体像を把握したいエンジニアやマネージャー向けの記事です。
techblog.lycorp.co.jp
LINEヤフー社内で実践されている、トークン消費量を40%削減したContext Engineeringの手法について解説。
- Token消費量削減のための具体的な3つの手法を紹介。
- FKE(社内向けKubernetes as a Service)の文脈でどのようにContext Engineeringが活用されているか。
- Kubernetesやコンテナ技術に関心のあるエンジニア、インフラ担当者、SREなど。
cloud.google.com
Vertex AIでLLMアプリケーションを構築する際に発生する429エラー(リソース不足)を削減するための戦略とベストプラクティスを解説。
使用量モデルの選択、スマートな再試行、グローバルルーティング、コンテキストキャッシュ、プロンプト最適化、トラフィックシェイピングといった具体的な手法を紹介。
LLMアプリケーション開発者、インフラエンジニア、SRE、アーキテクト向けの記事。
グーグル・クラウド・ジャパン合同会社 <name>Pedro Melendez</name><title>Cloud AI Technical Evangelist</title><department></department><company></company> zenn.dev
JAWS DAYS 2026は、AWSユーザーグループが開催する年次イベントのレポートです。
2026年3月7日に池袋で開催されたこのイベントでは、200アカウント規模のAWS環境におけるネットワーク設計と実践に関するセッションが紹介されました。
この記事は、AWSのネットワーク設計やインフラ構築に関心のあるエンジニアやアーキテクト向けです。
www.publickey1.jp
- コマンドラインからブラウザ操作を自動化できるPythonライブラリ「Browser Use CLI 2.0」がリリースされた。
- Chrome DevTools Protocolへの対応やセッション保持機能により、操作速度が2倍に向上した。
- 開発者、特に自動化やテストに関わるエンジニア向け。
newrelic.com
- AWS Integration導入後にメトリクスがリソースタグで装飾されない問題のトラブルシューティングガイドです。
- タグ/メタデータ収集の仕組みと具体的な解決手順について解説します。
- AWSのインフラ運用やSRE、プラットフォームエンジニア向けの記事です。
qiita.com
WindowsのInfrastructureエージェントをNew Relic管理画面からリモートでインストール・設定できるようになりました。
設定方法の詳細について解説しています。
インフラエンジニア、SRE、テックリード、プロダクトマネージャー、プロジェクトマネージャー向けの記事です。
mackerel.io
Mackerel SREチームが実践した、誤検知を減らし運用負荷を軽減するための監視設定改善事例を紹介します。Terraformでの具体的な設定変更や、OpenTelemetryを用いたメトリック化、アラート名の工夫など、実践的なノウハウが解説されています。
* Mackerelでのアラート誤検知を減らすための具体的な監視設定改善方法
* 障害発生時の通知精度向上と運用負荷軽減のためのテクニック
* TerraformやOpenTelemetryを活用した実践的な監視設定の例
zenn.dev
WordPressのブログ環境を新しいインフラへ移行する際に、WP-CLIを使用したデータ移行作業と、それに伴って発生したパーマリンク破損のトラブルシューティングについて解説しています。
移行プロセスをエクスポート、インポート、トラブルシューティングの3段階に分け、具体的な実践内容とTipsを紹介しています。
WordPressの運用担当者、インフラエンジニア、またはデータ移行やパーマリンク設定に課題を感じている開発者向けの記事です。
zenn.dev
AI Agentの本番運用における難しさと、安定運用のための3つのガードレールについて解説しています。
AI Agent開発・運用に携わるエンジニアや、LLMを活用したサービス開発に関心のある方。
LangGraphを用いたAI Agent構築と、実データ分析コメント生成機能の開発事例に触れながら、実践的な知見を提供します。
techblog.kayac.com
音威子府村のAI副村長「ねっぷちゃん」開発プロジェクトについて、技術選定の背景、アーキテクチャ、RAG戦略、テスト方針などを解説しています。
* 音威子府村のAI副村長「ねっぷちゃん」開発における技術スタック、アーキテクチャ、開発プロセスを解説。
* Cloudflare Workersを基盤とし、TypeScript、Hono、Mastra、Geminiなどを活用したバックエンドとReactを用いたフロントエンドの構成を紹介。
* RAG戦略、データ準備、検索、テスト方針、今後の展望について、少人数開発でのスピード感と拡張性を両立させる工夫を詳述。
techblog.lycorp.co.jp
LINEヤフー株式会社が2026年4月に開催予定の技術系イベント・勉強会について案内しています。
最新情報は各リンク先で確認が必要で、申し込み状況によっては既に満席の場合もあります。
技術者全般、特にイベントや勉強会への参加に関心のある方、LINEヤフーの技術コミュニティに興味のある方向けの記事です。
zenn.dev
BigQueryのWITH RECURSIVE句は再帰計算に便利ですが、テーブル関数内では使用できません。
WITH RECURSIVE句を含むVIEWを作成すると、そのVIEWはテーブル関数から参照できなくなり、実質的に利用できなくなります。
この制約を理解し、VIEWの設計に影響を与えないように注意する必要があります。
techblog.lycorp.co.jp
社内プラットフォームで約4年間運用・開発してきたベクトル検索エンジン「Vald」について、パフォーマンス最適化とベストプラクティスを解説します。
Valdの長期運用経験に基づいた知見を共有する内容です。
バックエンドエンジニア、プラットフォームエンジニア、データベースエンジニア、機械学習エンジニア、インフラエンジニア向けの記事です。
cloud.google.com
Google Kubernetes Engine (GKE)とvClusterを組み合わせ、GPUリソースを効率的に共有し、コストを削減しながらAIワークロードをスケーリングする方法を解説します。
* GKE AutopilotとvClusterのGPUタイムシェアリング機能を利用して、複数チームが分離された環境でGPUを共有します。
* 費用対効果の高いAIワークロードの実現と、複数チームの分離環境管理の複雑さを解消するアプローチを紹介します。
* この記事は、Google Cloud上でAIインフラを効率的に運用したいエンジニアやインフラ担当者向けです。
グーグル・クラウド・ジャパン合同会社 <name>Saiyam Pathak</name><title>DevRel</title><department></department><company>vCluster</company> knowledge.sakura.ad.jp
・さくらのVPSとOpenClaw、さくらのAI Engine、Discordを連携させ、AIエージェントを構築する手順を解説。
・LLMを活用したAIエージェントの最新トレンドと、その始め方について紹介。
・VPSでのAIエージェント開発に関心のあるエンジニアや、AI技術の活用を検討している個人開発者向け。
qiita.com
Synthetic Monitoringを用いてICMPポーリングを実装した際の、取得データの可視化方法について解説します。
記事では、スクリプトの共有だけでなく、そのデータをどのように活用できるかについてのアイデアも提案します。
インフラやSRE、ネットワークエンジニア、QAエンジニアなど、システム監視やデータ活用に関心のある方におすすめです。
www.publickey1.jp
- 中東の武力紛争において、データセンターが初めて攻撃目標となった事例について解説しています。
- イランがAWSのUAEリージョンをドローンで攻撃した事例に触れ、紛争とデータセンター攻撃の関連性を時系列で整理しています。
- セキュリティ、インフラ、クラウドサービスに関心のあるエンジニアや、地政学的なリスクを考慮する必要がある関係者向けの記事です。
newrelic.com
- 外部メールアドレスをアラート通知先として登録する際のメール認証プロセスについて説明しています。
- 意図しないメール受信を防ぐために、受信認証(Verification)プロセスが導入されていることを解説しています。
- この通知は、システムのアラート設定に携わるインフラエンジニアや、システム管理者向けの内容です。
mackerel.io
Mackerelでは、データベースのバージョンアップに伴い、2026年4月16日(木) 13:00〜15:00(JST)の間、APMとトレース機能に関わるシステムを一時停止します。この時間帯はAPMおよびトレース画面へのアクセス、課題作成・通知ができなくなりますが、その他の機能は利用可能です。メンテナンス期間中もトレースデータの投稿は可能ですが、反映はメンテナンス終了後となります。
* MackerelのAPMとトレース機能を利用するシステムが、データベースバージョンアップのため一時停止されます。
* メンテナンス期間中は、APM/トレース関連機能の利用や、概算使用量メトリックの投稿ができません。
* メンテナンス終了後に、投稿されたトレースデータは順次反映されます。
cloud.google.com
Google Cloud は、API のスプロール(散在)問題に対処するため、Apigee API Hub と API Gateway の統合、および API 仕様強化アドオンを発表しました。
これらの新機能により、分散した API メタデータが一元化され、AI エージェントが API を発見・利用しやすくなります。
本記事は、API のガバナンスと AI 活用を向上させたいプラットフォームエンジニア、インフラエンジニア、アーキテクトを対象としています。
グーグル・クラウド・ジャパン合同会社 <name>Kyle Wiese</name><title>Software Engineer</title><department></department><company></company> qiita.com
- "トラフィックの再ルーティング"について、DNSやBlue/Greenデプロイなどの技術を解説。
- デプロイ作業におけるサーバー切り替えの概念を、AWSの経験が浅い読者にも分かりやすく説明。
- 曖昧な理解を解消し、デプロイ方法の全体像を掴むための記事。
cybozu.connpass.com
サイボウズのkintone性能ダッシュボード開発について、プロダクトエンジニアとエンジニアリングマネージャーが、巨大プロダクトにおける少数チームでの価値提供のための考え方や意思決定、乗り越えたハードルについて解説します。
* 巨大SaaSプロダクトで、限られたチームで機能開発に携わるプロダクトエンジニア
* 設計・運用・技術的判断に責任を持つエンジニア
* 技術とチームの意思決定に関わるテックリードやエンジニアリングマネージャー
speakerdeck.com
NewSQLデータベースのアーキテクチャについて、ストレージ分離と分散合意のメカニズムに焦点を当てて解説します。
スケーラブルなシステム構築のための技術的アプローチを理解したいバックエンドエンジニアやインフラエンジニア、アーキテクト向けの内容です。
分散システムにおけるパフォーマンスと一貫性の両立を目指す方におすすめです。
cloud.google.com
* Google Cloud 上で RAG(Retrieval-Augmented Generation)対応生成 AI アプリケーションのプライベートネットワーク接続におけるリファレンス アーキテクチャを解説しています。
* AI ワークロードをインターネットを経由せず、安全かつ信頼性の高いプライベート IP アドレスで構築するための設計パターンと、そのトラフィックフローについて説明しています。
* インフラ、ネットワーク、機械学習、セキュリティ、アーキテクト、データサイエンティストなど、クラウドインフラ上で AI システムを構築・運用するエンジニアや担当者向けの記事です。
グーグル・クラウド・ジャパン合同会社 <name>Ammett Williams</name><title>Developer Relations Engineer</title><department></department><company></company> cloud.google.com
BMW GroupとGoogle Cloudは、自動車向けのドメイン特化型小規模言語モデル(SLM)を効率的に開発・評価する自動化ワークフローを構築しました。
このワークフローは、モデルの圧縮、ファインチューニング、評価を自動化し、限られた車載リソースでも高品質な音声認識を実現することを目指しています。
本記事は、自動車業界のAI開発者や、エッジデバイスでのAI活用に関心のあるエンジニア向けです。
グーグル・クラウド・ジャパン合同会社 <name>Dr. Jens Kohl</name><title>BMW Group</title><department></department><company></company> zenn.dev
AWS AuroraからTiDB Cloudへのデータベース移行プロジェクト完了後、ECSとTiDB Cloudの相乗り環境におけるコネクションプール枯渇問題について解説します。
- マイクロサービスアーキテクチャを採用する開発部が、MySQL AuroraからTiDB Cloudへ移行した背景。
- TiDB Cloudへの移行完了後、コネクションプール枯渇問題に直面した際の考察。
- ECSとTiDB Cloudの相乗り環境におけるコネクションプールの問題解決に向けたアプローチ。
対象読者:
- バックエンドエンジニア
- インフラエンジニア
- データベース管理者
cloud.google.com
Google Kubernetes Engine (GKE) で、カスタム指標に基づいた水平 Pod 自動スケーラー (HPA) のネイティブサポートが開始されました。これにより、従来必要だった複雑なモニタリングシステム、アダプター、IAM 設定が不要になり、カスタム指標による自動スケーリングが容易かつ高信頼性になります。
- アプリケーションのカスタム指標(キューの深さ、アクティブなリクエストなど)に基づいて、GKE 上で実行されるワークロードの自動スケーリングを、CPU やメモリと同様に簡単に行えるようになりました。
- 複雑なアダプターや IAM 設定が不要になり、運用オーバーヘッドが削減され、スケーリングのレイテンシが短縮され、信頼性が向上します。
- AI 推論、金融サービス、小売、ゲームなど、要求の厳しいワークロードを実行する組織にとって、リソースの最適化とコスト効率の向上が期待できます。
グーグル・クラウド・ジャパン合同会社 <name>Nabil Dabouz</name><title>Software Engineer</title><department></department><company></company> cloud.google.com
Google Cloudが、第5世代AMD EPYCプロセッサを搭載したHPC(ハイパフォーマンスコンピューティング)向けVM「H4D VM」の一般提供を開始しました。
このVMは、製造、ヘルスケア、天気予報、EDAなどの業界で、優れたパフォーマンスとスケーラビリティを提供し、RDMA(Remote Direct Memory Access)をサポートしています。
H4D VMは、計算集約型のワークロードを高速化し、コストパフォーマンスにも優れているため、これらの分野の研究者、エンジニア、およびHPCワークロードを扱う開発者向けの記事です。
グーグル・クラウド・ジャパン合同会社 <name>Felix Schürmann</name><title>Senior HPC Technologist</title><department></department><company></company> zenn.dev
- DevinのSchedule機能を用いて、RenovateによるPRレビュー依頼の自動化を試みた
- 手動で行っていたレビュー依頼作業を自動化することで、手間や忘れを防ぐことを目的とした
- エンジニア、特にインフラやコーポレートエンジニア、バックエンドエンジニアが対象
cloud.google.com
・Google Cloudのソリューションを活用し、エージェント型チャットボットが直面するリアルタイムチャットのコンテキスト更新高速化と長期履歴検索効率化の課題を解決する方法を解説。
・Redis、Bigtable、BigQueryを組み合わせたポリグロットアプローチにより、短期・中期・長期のメモリを最適に管理し、会話の継続性を保つアーキテクチャを提案。
・この技術は、大規模な会話エージェントを開発・運用するエンジニアやアーキテクトにとって、応答性の高いチャット体験とデータ活用の両立に役立つ情報を提供。
グーグル・クラウド・ジャパン合同会社 <name>Yun Pang</name><title>Principal Architect</title><department></department><company></company> mackerel.io
Mackerelのアップデート情報。
* トレースのスパン概算使用量がラベル付きメトリックとしてリアルタイムで投稿されるようになり、サービスごとの利用状況把握が容易になりました。
* 課題発生時の通知を一時停止できる「スヌーズ」機能が追加されました。
* クエリによる監視のアラートメールで、属性名ではなく実際の値が表示されるよう改善されました。
この記事は、Mackerelを利用しているエンジニア、特にインフラ・SRE・プラットフォーム担当者、およびプロダクトマネージャーやエンジニアリングマネージャー向けです。
blog.kinto-technologies.com
RenovateというOSSツールが、ソフトウェアの依存関係を自動でアップデートする利便性を解説しています。
特に、GitHubのDependabotと比較し、カスタムマネージャーによるインラインスクリプトのアップデート対応、ローカルでの設定デバッグの容易さ、複数リポジトリでの設定共通化の3点を評価しています。
インフラエンジニア、SRE、QAエンジニア、プラットフォームエンジニア、バックエンドエンジニアなど、ソフトウェア開発に関わるエンジニア全般が対象です。
cloud.google.com
Google Cloud は、複数のクラウドサービスにまたがるメンテナンスイベントを一元管理できる新機能「Unified Maintenance」の一般提供を開始しました。
この機能により、メンテナンス情報の確認、アラートの標準化、ユーザーが制御可能なイベントの把握が容易になります。
Google Cloud を利用するシステム管理者、インフラエンジニア、プロダクトマネージャー、および SRE 担当者向けの記事です。
グーグル・クラウド・ジャパン合同会社 <name>Erol-Valeriu Chioasca</name><title>Product Manager</title><department></department><company></company> zenn.dev
- Azureのコスト管理・削減のため、社内全体のコスト意識強化を目的とした「Dailyコスト通知」の導入について解説しています。
- 普段意識しないAzureの莫大な費用とその削減に向けたSREチームの取り組みを紹介しています。
- Azureコストの現状把握と削減効果の可視化に関心のあるエンジニア、マネージャー向けの記事です。
blog.kinto-technologies.com
AWS Configの記録頻度を最適化することで、コストを約80%削減した事例を紹介します。特にEC2 NetworkInterfaceなどの記録回数が多いリソースを日次記録に変更し、コスト効率を高めました。・AWS Configのコスト削減手法について知りたい方・AWS環境のコスト最適化に関心のある方・セキュリティ要件とコストのバランスを取りたい方
speakerdeck.com
- 製造業における定型化できないデータに対して、高度な絞り込みと意味検索を両立させるための実践的なアプローチを紹介します。
- 本資料は、2026年3月10日に開催される「Elastic{ON} Tokyo 2026」でのカンファレンス発表資料です。
- 対象読者は、製造業のデータ活用に課題を感じているエンジニアやデータサイエンティスト、プロジェクトマネージャーです。
speakerdeck.com
Sansan社が自社で認証基盤を開発・移行した事例について。
共通ID基盤の構築や運用に関心のあるエンジニアや、プラットフォームエンジニアリングに携わる方々にとって参考になる情報。
イベント参加や技術本部の採用情報にも触れている。
cloud.google.com
民放公式テレビ配信サービス「TVer」が、急成長を支える広告基盤をGoogle Cloud上に内製化した事例。
GKEやBigtable、Memorystoreなどを活用し、1日あたり億単位のリクエストを低遅延で処理する高可用性・低レイテンシ・スケーラブルな新基盤を構築。
Google Cloudを選定した理由は、既存のBigQueryとのデータ連携の容易さ、コスト効率、そして現場のGo言語との親和性の高さ。
本記事は、広告配信システムの内製化に関心のあるエンジニアやインフラ担当者、プロダクトマネージャー向けの内容となっている。
グーグル・クラウド・ジャパン合同会社 <name>Google Cloud Japan Team </name><title></title><department></department><company></company> cloud.google.com
AI戦略とデータ戦略は2026年までに統合され、Google CloudはPostgreSQL互換データベースを活用して、開発者をAIアーキテクトに育成する。
記事では、スピード、スケール、セキュリティを重視し、インフラストラクチャの負担を軽減して、コンテキストエンジンとしてのデータベースの役割に焦点を当てる。
この内容は、AIアプリケーション開発におけるアーキテクト、バックエンドエンジニア、データサイエンティスト、およびインフラ担当者を対象としている。
グーグル・クラウド・ジャパン合同会社 <name>Abirami Sukumaran</name><title>Staff Developer Advocate, Google</title><department></department><company></company> knowledge.sakura.ad.jp
JANOG57ミーティングでのさくらインターネットの発表レポートです。
HPCネットワークの運用において、マルチベンダー・マルチOS環境での課題と取り組みについて詳述しています。
ネットワークエンジニア、インフラエンジニア、およびHPCに関心のある技術者向けです。
www.publickey1.jp
マイクロソフトの「Windows 365 クラウドPC」に対応した専用クライアントデバイスが、DellとASUSから登場しました。
このデバイスは、デスクトップ仮想化技術を活用し、Windows環境をクラウドから提供します。
IT管理者や、場所を選ばずにWindows環境を利用したいビジネスユーザーに適しています。
www.publickey1.jp
AWSが、VPSサービス「Amazon Lightsail」にて、OpenClawを簡単に導入できるインスタンスイメージの提供を開始しました。
これにより、OpenClawのセットアップが簡略化され、迅速な利用が可能になります。
インフラエンジニアやAWSを利用する開発者向けの記事です。
newrelic.com
- 2026年4月に第一世代のルート証明書(DigiCert Global Root G1)が廃止されます。
- New Relicはプラットフォームの信頼性維持のため、G2証明書への切り替え対応が必要です。
- この対応は、デジタル通信インフラのグローバルな更新の一環です。
mackerel.io
「APM(アプリケーションパフォーマンスモニタリング)とは、アプリケーションのパフォーマンスを監視・管理する手法であり、システムの複雑化に伴い重要性が増しています。サーバー監視だけでは見えないボトルネックの特定、障害発生時の迅速な対応、システム全体の可視化に貢献します。導入にあたっては、チーム全体で取り組み、小さく始めて段階的に広げ、収集したデータを意思決定と行動に結びつけることが重要です。
この記事は、アプリケーションのパフォーマンス低下の原因特定や障害対応に悩むエンジニア、運用担当者、およびプロダクトマネージャーを対象としています。
APMは、アプリケーションのパフォーマンスを監視・管理する手法であり、現代の複雑なシステムにおいて、パフォーマンス問題の特定、障害対応の迅速化、システム全体の可視化に役立ちます。
cloud.google.com
Google CloudのSpannerカラム型エンジンは、Icebergレイクハウスのデータに対し、低レイテンシーと高速なパフォーマンスを提供するプレビュー版の新機能です。これにより、OLTPと分析の統合を実現し、リアルタイムの分析情報やAIモデルの提供を可能にします。
この機能は、リアルタイムのデータ分析やAI活用に関心のある、データベース管理者、インフラエンジニア、データサイエンティスト、バックエンドエンジニア、そしてシステムアーキテクトを対象としています。
Spannerカラム型エンジンは、既存のSpannerテーブルに容易に適用でき、Icebergレイクハウスのデータを高速に提供するための強力なソリューションとなります。
グーグル・クラウド・ジャパン合同会社 <name>Girish Baliga</name><title>Director of Engineering</title><department></department><company></company> knowledge.sakura.ad.jp
メールサーバーソフトウェア「Stalwart Mail Server」の導入について解説します。
さくらのVPS環境で、既存のメールサーバーに代わる選択肢として試した経験を共有します。
メールサーバーの運用やインフラ管理に携わるエンジニア、または新しい技術に興味のある方におすすめです。
cloud.google.com
Googleが開発した「Firefly」は、データセンター内でナノ秒レベルのクロック同期を実現するソフトウェア主導のソリューションです。
従来の同期技術では困難だったクロックドリフト、ジッター、パスの非対称性といった課題を、レイヤー型同期やランダムグラフ上の分散コンセンサスなどの革新的なアプローチで克服します。
これにより、金融取引から分散システム、MLワークロードまで、高精度なタイミングが求められる幅広いアプリケーションでの活用が期待されます。これは、インフラエンジニア、ネットワークエンジニア、そしてGoogle Cloudを利用する開発者にとって、データセンターのパフォーマンスと信頼性を向上させるための重要な技術となります。
グーグル・クラウド・ジャパン合同会社 <name>Yuliang Li</name><title>Software Engineer</title><department></department><company></company> cloud.google.com
Dell RecoverPoint for Virtual Machinesのゼロデイ脆弱性(CVE-2026-22769)が、中国関連の攻撃グループUNC6201によって悪用されていることが判明しました。この脆弱性は、C#で書かれた新しいバックドアマルウェア「GRIMBOLT」の展開や、VMware環境への侵入に利用されています。脆弱性のあるシステムは、速やかにDellのセキュリティアドバイザリに従って修正することが推奨されます。
この情報は、セキュリティエンジニア、インフラエンジニア、およびプラットフォームエンジニアを対象としています。
記事では、GRIMBOLTマルウェアの技術詳細、UNC6201の戦術、手法、手順(TTP)、およびVMware環境に対する新たな攻撃手法について解説しています。
グーグル・クラウド・ジャパン合同会社 <name>Google Threat Intelligence Group </name><title></title><department></department><company></company> newrelic.com
2026年のNew Relic AI Impact Reportによると、開発における見えないコストが生産性を損なう最大の要因となっています。
エンジニアは依然としてシステム障害やアラート対応に週の33%もの時間を費やしており、トラブルシューティングのサイクルの解消が課題です。
この記事は、AIOpsによるエンジニアの「火消し」対応の解消について、インフラ、SRE、テックリード、エンジニアリングマネージャー、データサイエンティスト、機械学習エンジニア向けに解説しています。
zenn.dev
AWS CDKのデプロイ時に発生するテンプレートサイズ上限超過の問題を、NestedStackを活用して解決した手法について解説しています。
- AWS CDKのデプロイフローとCloudFormationのテンプレートサイズ上限について理解しているエンジニア。
- 大規模なインフラ構成をAWS CDKで管理しており、サイズ上限に直面した経験があるインフラエンジニア。
- CDKのテンプレートサイズ上限問題の具体的な解決策と、NestedStackの適用方法を知りたいエンジニア。
speakerdeck.com
KRaftモード(開発段階)からZooKeeperモードへのダウングレード手順について解説しています。
- KRaftモードからZooKeeperモードへの安全なロールバック方法
- 運用中のシステムで発生した問題への対処法
- インフラエンジニア、SRE、データベース管理者向け
speakerdeck.com
LYの大規模Kafkaクラスタ運用における、一見無害なListOffsets呼び出しが原因で発生した障害のトラブルシューティング事例を紹介します。
- Kafkaクラスタの運用で発生した予期せぬ障害とその原因究明について解説。
- 大規模システムにおけるインシデント対応や、根本原因の特定に役立つ知見を提供。
- インフラエンジニア、SRE、バックエンドエンジニア向けの記事。
knowledge.sakura.ad.jp
・コンテナー型GPUクラウドサービス「高火力 DOK」を利用して、Ollamaを実行する方法を紹介します。
・ローカルにGPUがなくても、高速な環境でOllamaを利用したいエンジニア向けの記事です。
・GPUリソースを効率的に活用したいインフラエンジニアや機械学習エンジニアにおすすめです。
developers.cyberagent.co.jp
Kubernetesの初心者である筆者が、数万QPSという高トラフィック環境下でカナリアリリースを導入した経験について解説しています。
・高負荷環境でのKubernetesによるカナリアリリース導入の挑戦。
・初心者でも実践できる具体的な手順や注意点。
・プラットフォームエンジニア、インフラエンジニア、SRE担当者向け。
developers.cyberagent.co.jp
Fastlyがメトリクス基盤をGKE(Google Kubernetes Engine)へ移行した事例について解説しています。
移行により、メトリクスの精度向上や運用負荷の軽減といったメリットが得られたとのことです。
インフラエンジニアやSRE、GKEの利用を検討しているエンジニアにおすすめの記事です。
www.publickey1.jp
- 中東のAWSデータセンターがドローンの直接攻撃を受け、3つのアベイラビリティゾーンのうち2つが著しく損傷しました。
- この攻撃は、米国とイスラエルによるイランへの軍事攻撃に端を発する紛争に関連しています。
- 対象読者は、AWSのインフラストラクチャ、クラウドセキュリティ、および中東情勢に関心のあるITプロフェッショナルや意思決定者です。
www.publickey1.jp
NTTドコモがAWSとNECと協力し、AIエージェントを活用した5Gコアネットワークの商用運用を開始しました。
この新システムは、設計・構築の自動化により、人為ミスの削減と構築期間の80%短縮を実現し、突発的な需要にも柔軟に対応できます。
この記事は、ネットワークエンジニア、インフラエンジニア、AWSを利用する技術者、およびプロジェクトマネージャー向けです。
m3-engineer.connpass.com
エムスリー株式会社が開催するSREエンジニア向けの企業説明会イベントです。
医療DXを推進するプロダクト開発、全国リモートを支えるSREの技術基盤、SREチームの文化や働き方、採用ポジションやキャリアパスについて、VPoEやリードエンジニアが解説します。
SRE、バックエンド、フロントエンド、インフラ、ML、QA、セキュリティ、PdMなど、エンジニア職希望者全般が対象です。
toranoana-lab.hatenablog.com
Google Cloud認定資格Associate Cloud Engineerに約2ヶ月で合格した体験談。Geminiを活用した学習方法や、過去問演習の重要性、オンライン受験とテストセンター受験の比較、合否発表までの流れについて解説。
・Google Cloudの基礎知識を固めたいエンジニア
・資格取得に向けた具体的な学習方法を知りたい方
・クラウド関連の資格取得を検討している方
cloud.google.com
イオンフィナンシャルサービスは、BigQueryを基盤とした全社横断的なデータ分析基盤(DMS)を構築しました。
これにより、従来数日かかっていたデータ収集・分析が数分で完了するようになり、顧客一人ひとりに最適化された1to1マーケティング施策の精度と速度が大幅に向上しました。
この取り組みは、ITインフラのモダナイゼーションにとどまらず、組織と働き方を変革するDX推進、さらには将来的な決済サービスのグローバル展開も見据えたものです。
このニュースは、以下のような読者におすすめです。
- 大規模データ基盤の構築・運用に関心のあるインフラエンジニアやデータベースエンジニア
- クラウドを活用したデータ分析基盤の導入事例を知りたいデータサイエンティストやマーケター
- DX推進やアジャイル開発、内製化による組織力強化に関心のあるプロジェクトマネージャーやエンジニアリングマネージャー
グーグル・クラウド・ジャパン合同会社 <name>Google Cloud Japan Team </name><title></title><department></department><company></company> knowledge.sakura.ad.jp
AIとHPC(High Performance Computing)の融合が進む中、単なる演算性能だけでなく、メモリ帯域、ネットワーク、ソフトウェアスタック、電力効率、可用性など、多角的な評価が「使える計算機」には不可欠であることを解説する記事。
* AIとHPCの融合における計算機の評価軸について
* 学習・推論・数値計算を統合的に扱うための要件について
* AI・HPC分野のエンジニアや研究者向け
speakerdeck.com
YugabyteDB Japan Meetup #7での発表資料。
メタデータ同期におけるCache Stampede発生時のCycle Wait問題について解説。
データベースやインフラ、SRE、バックエンドエンジニア向けの記事。
developers.cyberagent.co.jp
CAMのSRE Unitでの経験を通して、Cloud Nativeな基盤を安全に運用し続けるための視点と設計について解説する記事です。
- SREの観点からCloud Native基盤の安全な運用方法を学びたいエンジニア。
- 安定したシステム運用を目指すインフラエンジニアやプラットフォームエンジニア。
- Cloud Native技術の運用設計に関心のあるアーキテクトやテックリード。