ニュースイミー

グーグル・クラウド・ジャパン合同会社

企業情報

グーグル・クラウド・ジャパン合同会社

ぐーぐるくらうどじゃぱん

法人代表者名: 平手 智行

法人番号: 6010003022051

証券コード: -

事業概要: -

郵便番号: 1500002

本社所在地: 東京都渋谷区渋谷3丁目21番3号渋谷ストリーム

従業員数: -

従業員数(男性): -

従業員数(女性): -

創業: 2015-06-17

最新ニュース

Google Cloude

Google Public Sector と Palantir が連携し、FedStart で Google Cloud が利用可能に

cloud.google.com

Google Public SectorとPalantirが連携し、Palantir FedStartプラットフォームを通じてGoogle Cloudを利用可能に 米国政府機関向けに、セキュリティとコンプライアンスを重視したクラウドソリューションを提供 AnthropicのClaude for EnterpriseがGoogle Cloud上で利用可能になり、AI機能が強化

グーグル・クラウド・ジャパン合同会社 <name>Leigh Palmer</name><title>VP, Technology, Delivery & Operations, Google Public Sector</title><department></department><company></company>
機械学習

Google Public Sector と Palantir が連携し、FedStart で Google Cloud が利用可能に

cloud.google.com

Google Public SectorとPalantirが連携し、Palantir FedStartプラットフォームを通じてGoogle Cloudを利用可能に 米国政府機関向けに、セキュリティとコンプライアンスを重視したクラウドソリューションを提供 AnthropicのClaude for EnterpriseがGoogle Cloud上で利用可能になり、AI機能が強化

グーグル・クラウド・ジャパン合同会社 <name>Leigh Palmer</name><title>VP, Technology, Delivery & Operations, Google Public Sector</title><department></department><company></company>
Google Cloude

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>
機械学習

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>
インフラ

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>
SRE

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>
アーキテクト

GKE Inference Gateway で Vertex AI のレイテンシを 35% 削減した方法

cloud.google.com

Vertex AI は、GKE Inference Gateway を導入することで、推論サービングにおけるレイテンシとコストの課題を解決しました。このゲートウェイは、負荷認識ルーティングとコンテンツ認識ルーティングという 2 つのインテリジェンス レイヤを追加し、モデルサーバーの Prometheus エンドポイントからリアルタイム指標をスクレイピングして最適な Pod にルーティングしたり、リクエストの接頭辞を検査して KV キャッシュに存在する Pod にルーティングしたりします。これにより、Qwen3-Coder の TTFT レイテンシが 35% 向上し、Deepseek V3.1 の P95 TTFT レイテンシが 52% 改善され、接頭辞キャッシュ ヒット率が 35% から 70% に倍増しました。 * コンテキストを多用するワークロードやバースト性の高いワークロードにおける推論サービングのレイテンシとコストの課題を解決する方法。 * GKE Inference Gateway の負荷認識ルーティングとコンテンツ認識ルーティングの仕組みとその効果。 * プラットフォームエンジニア、SRE、機械学習エンジニア、データサイエンティストなどが、カスタムインフラストラクチャを維持せずに Vertex AI の実績あるスケジューリング機能を利用する方法。

グーグル・クラウド・ジャパン合同会社 <name>Yao Yuan</name><title>Software Engineer</title><department></department><company></company>
リサーチ

「公共部門における AI の ROI」に関する初の調査から見えた主要なポイント

cloud.google.com

* **AIの公共部門におけるROI調査:** 公共部門におけるAI、特にAIエージェントの導入が進んでおり、生産性向上やセキュリティ強化で具体的な成果が出ていることが、Google Cloudが委託した調査で明らかになりました。 * **AIエージェントの重要性と将来性:** 多くの公共部門リーダーがAIエージェントを活用しており、将来のAI予算の大部分をAIエージェントに配分する予定であることから、その重要性が示唆されています。 * **導入の促進要因:** 生産性向上(70%)やセキュリティ強化(79%)といった具体的なROIが示される一方で、導入にはエグゼクティブスポンサーシップが不可欠であることが指摘されています。

グーグル・クラウド・ジャパン合同会社 <name>Katharyn White</name><title>Director of Marketing, Public Sector</title><department></department><company>Google Cloud</company>

「公共部門における AI の ROI」に関する初の調査から見えた主要なポイント

cloud.google.com

* **AIの公共部門におけるROI調査:** 公共部門におけるAI、特にAIエージェントの導入が進んでおり、生産性向上やセキュリティ強化で具体的な成果が出ていることが、Google Cloudが委託した調査で明らかになりました。 * **AIエージェントの重要性と将来性:** 多くの公共部門リーダーがAIエージェントを活用しており、将来のAI予算の大部分をAIエージェントに配分する予定であることから、その重要性が示唆されています。 * **導入の促進要因:** 生産性向上(70%)やセキュリティ強化(79%)といった具体的なROIが示される一方で、導入にはエグゼクティブスポンサーシップが不可欠であることが指摘されています。

グーグル・クラウド・ジャパン合同会社 <name>Katharyn White</name><title>Director of Marketing, Public Sector</title><department></department><company>Google Cloud</company>
機械学習

「公共部門における AI の ROI」に関する初の調査から見えた主要なポイント

cloud.google.com

* **AIの公共部門におけるROI調査:** 公共部門におけるAI、特にAIエージェントの導入が進んでおり、生産性向上やセキュリティ強化で具体的な成果が出ていることが、Google Cloudが委託した調査で明らかになりました。 * **AIエージェントの重要性と将来性:** 多くの公共部門リーダーがAIエージェントを活用しており、将来のAI予算の大部分をAIエージェントに配分する予定であることから、その重要性が示唆されています。 * **導入の促進要因:** 生産性向上(70%)やセキュリティ強化(79%)といった具体的なROIが示される一方で、導入にはエグゼクティブスポンサーシップが不可欠であることが指摘されています。

グーグル・クラウド・ジャパン合同会社 <name>Katharyn White</name><title>Director of Marketing, Public Sector</title><department></department><company>Google Cloud</company>
セキュリティ

「公共部門における AI の ROI」に関する初の調査から見えた主要なポイント

cloud.google.com

* **AIの公共部門におけるROI調査:** 公共部門におけるAI、特にAIエージェントの導入が進んでおり、生産性向上やセキュリティ強化で具体的な成果が出ていることが、Google Cloudが委託した調査で明らかになりました。 * **AIエージェントの重要性と将来性:** 多くの公共部門リーダーがAIエージェントを活用しており、将来のAI予算の大部分をAIエージェントに配分する予定であることから、その重要性が示唆されています。 * **導入の促進要因:** 生産性向上(70%)やセキュリティ強化(79%)といった具体的なROIが示される一方で、導入にはエグゼクティブスポンサーシップが不可欠であることが指摘されています。

グーグル・クラウド・ジャパン合同会社 <name>Katharyn White</name><title>Director of Marketing, Public Sector</title><department></department><company>Google Cloud</company>

プラットフォーム使用の落とし穴(パート 2): 意味のあるモニタリング指標を選択する

cloud.google.com

プラットフォームの価値を効果的に測定するための、客観的指標と主観的フィードバックを組み合わせたアプローチについて解説しています。 データに基づいた意思決定と、エンジニアの体験向上に焦点を当てた戦略の進化を示しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャー、インフラエンジニア、SRE、アーキテクト、Google Cloudを利用する開発者向けの記事です。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>

プラットフォーム使用の落とし穴(パート 2): 意味のあるモニタリング指標を選択する

cloud.google.com

プラットフォームの価値を効果的に測定するための、客観的指標と主観的フィードバックを組み合わせたアプローチについて解説しています。 データに基づいた意思決定と、エンジニアの体験向上に焦点を当てた戦略の進化を示しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャー、インフラエンジニア、SRE、アーキテクト、Google Cloudを利用する開発者向けの記事です。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>

プラットフォーム使用の落とし穴(パート 2): 意味のあるモニタリング指標を選択する

cloud.google.com

プラットフォームの価値を効果的に測定するための、客観的指標と主観的フィードバックを組み合わせたアプローチについて解説しています。 データに基づいた意思決定と、エンジニアの体験向上に焦点を当てた戦略の進化を示しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャー、インフラエンジニア、SRE、アーキテクト、Google Cloudを利用する開発者向けの記事です。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>

プラットフォーム使用の落とし穴(パート 1): アクティビティの多さが必ずしも価値の高さを示すとは限らない理由

cloud.google.com

プラットフォームの成功を測る上で、単なる利用率ではなく、リードタイム、DORA指標、技術的健全性などの多角的なアプローチの重要性を解説しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャーなど、開発チームの生産性向上やプラットフォームの価値最大化に関心のある技術職・管理職向けです。 プラットフォームの導入から価値測定、指標の進化、そしてデータに基づいた意思決定のプロセスを理解し、自社プラットフォームの改善に役立てたい読者におすすめです。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>

プラットフォーム使用の落とし穴(パート 1): アクティビティの多さが必ずしも価値の高さを示すとは限らない理由

cloud.google.com

プラットフォームの成功を測る上で、単なる利用率ではなく、リードタイム、DORA指標、技術的健全性などの多角的なアプローチの重要性を解説しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャーなど、開発チームの生産性向上やプラットフォームの価値最大化に関心のある技術職・管理職向けです。 プラットフォームの導入から価値測定、指標の進化、そしてデータに基づいた意思決定のプロセスを理解し、自社プラットフォームの改善に役立てたい読者におすすめです。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>
SRE

プラットフォーム使用の落とし穴(パート 1): アクティビティの多さが必ずしも価値の高さを示すとは限らない理由

cloud.google.com

プラットフォームの成功を測る上で、単なる利用率ではなく、リードタイム、DORA指標、技術的健全性などの多角的なアプローチの重要性を解説しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャーなど、開発チームの生産性向上やプラットフォームの価値最大化に関心のある技術職・管理職向けです。 プラットフォームの導入から価値測定、指標の進化、そしてデータに基づいた意思決定のプロセスを理解し、自社プラットフォームの改善に役立てたい読者におすすめです。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>
アーキテクト

プラットフォーム使用の落とし穴(パート 1): アクティビティの多さが必ずしも価値の高さを示すとは限らない理由

cloud.google.com

プラットフォームの成功を測る上で、単なる利用率ではなく、リードタイム、DORA指標、技術的健全性などの多角的なアプローチの重要性を解説しています。 プラットフォームエンジニア、プロダクトマネージャー、エンジニアリングマネージャーなど、開発チームの生産性向上やプラットフォームの価値最大化に関心のある技術職・管理職向けです。 プラットフォームの導入から価値測定、指標の進化、そしてデータに基づいた意思決定のプロセスを理解し、自社プラットフォームの改善に役立てたい読者におすすめです。

グーグル・クラウド・ジャパン合同会社 <name>Alex Moss</name><title>Principal Platform Engineer, John Lewis Partnership</title><department></department><company></company>
Google Cloude

プロダクション レディな AI を導入してマルチモーダルの新境地を生き抜く

cloud.google.com

Google Cloudは、プロダクションレベルのAI導入とマルチモーダルAIの最先端技術に焦点を当てた、2日間の専門ワークショップとロードショーを北米各地で開催します。1日目は、AIアプリケーションの安定性、セキュリティ、スケーラビリティに重点を置き、マルチエージェントオーケストレーション、データドリブン評価、セキュリティ強化について学びます。2日目は、リアルタイムインタラクション、ビジョン、音声処理といったマルチモーダルAIの技術を探求し、同時認識、RAGを超えたインテリジェンス、ストリーミングAPIの活用に焦点を当てます。 この記事は、エンタープライズ規模のAI課題解決や、次世代のマルチモーダルAIイノベーションを目指すアーキテクト、エンジニア、AI開発者を対象としています。 参加者は、AIの未来を構築するための実践的な知識、コード、Google Cloudクレジット、そしてネットワーキングの機会を得ることができます。

グーグル・クラウド・ジャパン合同会社 <name>Christina Lin</name><title>Developer Relations Engineering Manager</title><department></department><company></company>