Vertex AI Gen AI Evaluation Service でのエージェント評価のご紹介
Vertex AI Gen AI Evaluation Serviceの公開プレビューがリリースされました。 AIエージェントの評価を強化するための機能が紹介されています。 AI、機械学習に興味のある開発者、エンジニア、研究者向けの記事です。
Vertex AI Gen AI Evaluation Serviceの公開プレビューがリリースされました。 AIエージェントの評価を強化するための機能が紹介されています。 AI、機械学習に興味のある開発者、エンジニア、研究者向けの記事です。
ZOZOTOWNのレビューガイドライン違反検出ツール開発に関する記事です。 LLMを活用してレビューパトロール業務を効率化し、67.7%の業務時間削減を実現しました。 データサイエンティストや機械学習エンジニア、インフラエンジニア、バックエンドエンジニア向けの記事です。
この記事では、Amazon BedrockでDeepSeek-R1蒸留モデルをデプロイする方法を解説します。 - AWSのインフラでAIモデルを安全かつスケーラブルに利用したい組織向けです。 - Amazon Bedrockのカスタムモデルインポート機能を利用し、モデルのデプロイと運用管理を簡略化します。
GraphRAG Toolkit は、グラフデータベースを活用した検索拡張生成(RAG)ワークフローを構築するためのオープンソースのPythonライブラリです。 このツールキットは、非構造化データからグラフを自動的に構築し、構造的に関連する情報を取得するための質問応答戦略を提供します。 主に、RAGアプリケーションにグラフを追加することのメリットや、ツールキットのインストール方法、グラフモデルとコンテンツ取得アプローチについて解説しています。 対象読者としては、データサイエンティスト、機械学習エンジニア、インフラエンジニア、バックエンドエンジニア、SRE、アーキテクト、テックリードなどが挙げられます。
レビュー投稿画面でのAIによるチェック項目表示、コンセプトアート漫画によるUGC広告の勝率向上、生成AI活用事例11件をまとめた記事です。 品質向上に関心のあるQAエンジニアや、マーケティング戦略に関心のあるマーケター、デザインに関心のあるデザイナー、AI技術に関心のあるエンジニアなど幅広い層に向けた記事です。 AIを活用した品質向上や広告戦略の具体的な手法を知ることができます。
DeepSeek-R1をLangChain4jとJavaで使用する方法のデモを紹介。 ローカル環境またはGitHub Modelsで実行可能。 テキスト生成、推論テスト、会話メモリのデモが含まれています。 主に機械学習エンジニアやAzureを利用するバックエンドエンジニア向けの、DeepSeek-R1の利用方法を解説した記事です。
Hugging Faceの新しいAgent Framework「smolagents」とCodeAgentの活用法についての記事です。 - smolagentsはHugging Faceが提供するAgent Frameworkです。 - CodeAgentの活用方法についても解説しています。 - 機械学習エンジニアや研究者、テックリード向けの記事です。
LINEヤフーの機械学習エンジニアがNeurIPS 2024に参加したレポートです。発表されたLLMの安全性を向上させる手法について解説しています。機械学習エンジニアやデータサイエンティスト、セキュリティエンジニア向けの記事です。
Transformerによる自然言語処理を活用した、ショッピングレコメンドの改善に関する記事です。 機械学習エンジニア向けの内容で、特にNLP分野の技術に焦点を当てています。 Yahoo!ショッピングのレコメンド開発に携わる方々に役立つ情報です。
この記事では、「写経」論争から教育者と学習者の間の認識のずれについて考察しています。 より良い教育法について議論しています。 教育に関わる全ての人に向けた記事です。
promptfooというLLM検証ツールを用いたプロンプト検証について解説しています。 LLMアプリケーション開発者や、AI技術に興味のあるエンジニア向けの記事です。 ツールの基本的な使い方から、カスタムモデルへの対応方法まで紹介しています。
この記事は、近年バズったAI技術や生成AI技術を無料で学ぶ方法をまとめたものです。 特にLLM、LangChain、Dify、SAM2、Stable Diffusion、RVCなどの技術について解説しています。 AI技術をキャッチアップしたい人や、AIを実務で活用したいと考えている人におすすめです。
OpenAIのOperatorがo1 proユーザー向けにリリースされ、AIによるブラウザ操作が可能になった。 ホテル予約など、AIが人間の様に画面を見て操作する。 AIによるブラウザ操作に興味がある人向けの記事。
この記事では、大規模言語モデル(LLM)を活用して顧客フィードバックから有益な洞察を抽出する方法について解説します。 - 主に、小売業界における顧客フィードバック分析を対象としています。 - LLMを使用してテーマ抽出、感情分析、競合比較を行うためのプロンプトエンジニアリングのテクニックを紹介しています。 - この記事は、データ分析担当者や、顧客フィードバックを活用したい企業担当者向けです。
・AWSの生成AIに関する最新情報(Amazon Q Business, Connect, Developer)について解説した記事です。 ・AWSの生成AIサービスに関心のあるエンジニアや開発者向けです。 ・最新のアップデート情報をキャッチアップしたい方におすすめです。
AIエンジニア「Devin」の導入に関する記事です。 - Devinの購入から初期設定までの手順を解説。 - AIエンジニアや新しい技術に興味があるエンジニア向け。 - Devinの導入を検討している方にも役立つ情報を提供。
この記事は、ユーザベースがペアプログラミングのガイドラインを策定し、その効果と実践方法について解説しています。 ペアプログラミングの導入とガイドライン策定の背景、具体的な実践方法、そしてその効果について詳しく説明しています。 ペアプログラミングに興味のあるエンジニア、テックリード、エンジニアリングマネージャー、プロジェクトマネージャーにとって有益な情報です。
Microsoft FabricのOneLakeについての解説記事です。 OneLakeにデータを置く際のアクセス権に関する疑問に答えます。 データエンジニアやデータサイエンティスト、プラットフォームエンジニア向けの記事です。
この記事は、LangGraphでAIエージェントを構築するシリーズの第2回です。 チャットモデルを組み込む方法について解説しています。 AIエージェント開発に興味があるエンジニア向けの記事です。
2024年のDevOpsレポートからAIの導入状況、生産性への影響、デリバリーパフォーマンスへの影響、AIの信頼性、チームや組織への影響を分析した記事。 AIの導入は生産性向上に寄与する一方、デリバリーの安定性に悪影響を与える可能性や、生成されたコードの信頼性が低いという課題も指摘。 AI導入による個人のフロー、仕事の満足度、生産性の向上が見られる一方で、価値ある作業時間が減少するというトレードオフも示唆されています。 この記事は、AI技術に関わる開発者、テックリード、エンジニアリングマネージャーを対象としています。
SageMaker HyperPod recipesを使ったfine-tuningに関する記事です。 - 機械学習モデルのfine-tuningを効率的に行う方法について解説しています。 - SageMaker HyperPod recipesの具体的な利用方法について説明しています。 - 機械学習エンジニアやデータサイエンティスト向けの記事です。
Hugging Faceにあるmicrosoft/phi-4モデルをONNX形式に変換する方法についての記事です。 以前のPhi-3.5-mini-instructのONNX化記事をベースに、Phi-4版として解説しています。 機械学習エンジニアや、ONNX形式でのモデル利用に興味がある開発者向けの記事です。
kintoneの生成AI技術を活用した新機能とシステム概要を紹介しています。 kintoneのデータを活用し、チャット形式で質問に回答する「kintone AI アシスタント (仮称)」について解説しています。 主にkintoneの技術に関心のあるエンジニアや、生成AI技術に関心のある方々を対象としています。
DMM社内向けAIチャットボット「DMM.博士」のRAG(Retrieval Augmented Generation)に関する技術記事です。 - 分散型RAGサテライトシステムの構築について解説しています。 - 社内規定を対象とした最初のモデルケースから、データ形式が複雑なCMSへの応用までを説明しています。 - 開発に使用した技術やシステム構成要素についても詳細に記述しています。 対象読者:AI技術に関わるエンジニア、RAGの構築に関心のある開発者、DMM.博士の技術に関心のある方
LayerXが主催するLLM技術に関するイベントです。 - LLMを活用したプロダクト開発の現場についてLT形式で共有します。 - LLM技術に関心があるエンジニアや技術革新に興味がある方におすすめです。
エム・データが動画コンテンツのシーン内容や文脈を単語化し分類する「コンテクストメタ」の研究開発を開始。これにより、コンテンツに合った広告配信が可能になります。 CTVや動画配信サービスでの広告配信において、個人情報に頼らず、コンテンツ内容にマッチした広告を表示することが期待されます。 この技術は、広告会社やメディア企業、リサーチャーなど、広告やコンテンツに関わる幅広い分野のプロフェッショナルを対象としています。
このイベントは、AIエージェントの可能性を探るため、日経電子版の開発事例や記事検索の仕組みを技術的な視点から紹介します。生成AIを活用したプロダクト開発に課題を持つ方、自社サービスを持つ企業のエンジニア、これからAIを組み込んだ開発を始めようとしている方、プロダクト開発を推進するエンジニア、プロジェクトマネージャー、プロダクトマネージャー、自社サービスを持つ企業のCTO/CIO/CDO、エンジニアリングマネージャー、テックリード、エンジニアが対象です。 AIエージェント開発の事例、RAG検索技術、運用基盤と改善の取り組みについて、3名の発表者がそれぞれの視点から解説します。
この記事は、LLM(大規模言語モデル)のトレーニング用データセットの準備方法について解説しています。 記事は、データセット作成に関わるエンジニアや研究者向けです。 データセットの品質が、LLMの性能に大きく影響するため、その重要性を理解できます。
この記事は、Azure AI FoundryとAI Evaluation SDKを使用したLLMの評価について解説しています。 LLMアプリケーション開発における運用管理の重要性と、評価の必要性について説明しています。 データサイエンティストや機械学習エンジニア、QAエンジニアなど、LLMの評価に関わる全ての方に向けた記事です。
Gemini AdvancedのDeep Researchの日本語サポートが開始された。 - パーソナルAIリサーチアシスタントの利用が可能になった。 - 研究者や情報収集を効率化したい人向けの記事。
MicrosoftのAI、データベース、ID製品がTop Secretワークロードの認証を取得しました。 これにより、政府機関はAIを活用して生産性向上、認知能力の向上、分析の迅速化が可能になります。 特に、Azure OpenAI ServiceとAzure Machine Learningの認証は、機密性の高いデータを取り扱う政府機関やパートナーにとって大きなメリットとなります。
AWS re:Invent 2024で発表されたヘルスケア・ライフサイエンス分野のトップ10発表を紹介。 生成AIと機械学習の最新イノベーションが、医学研究、患者ケア、科学的発見をどのように変革するかを解説。 対象読者は、医療機関、ライフサイエンス企業、AI開発者、研究者。
食べログが生成AIを活用した事例発表についてまとめた記事です。 - メニュー入稿業務の効率化事例が紹介されています。 - 生成AIと人間の協働による業務品質の確保に焦点を当てています。 - AI導入や推進方法に関心のあるエンジニア、マネージャー向けの発表内容です。
Classmethod AI Talks(CATs) #12として、AWSの生成AIに関する最新情報をまとめた「AWS Generative AI Catch Up Talks vol.004」が公開されました。 内容はレイテンシ最適化、Bedrock Guardrail、Browser Use、Llama3.3などが含まれます。 この情報は、AWSの生成AIサービスに関わるエンジニアや研究者にとって有益です。
この記事では、Semantic Kernelを用いたマルチエージェントシステムの構築について解説しています。 複数のAIエージェントが連携し、複雑なタスクを効率的に処理する方法を紹介しています。 .NET開発者やAIに関心のあるエンジニア向けの記事です。
この記事では、AWS上でマルチテナント型の生成AI環境を構築する方法について解説します。 - 企業における生成AIの導入を加速させるためのアーキテクチャを紹介します。 - テナントごとの柔軟な設計、一元化されたガバナンス、コスト追跡などの要点を説明します。 - この記事は、AIシステムを構築するアーキテクトやインフラエンジニア、データサイエンティスト向けです。
Gemini AdvancedのDeep Research機能が日本語に対応したことを伝えています。 この機能は複雑なトピックを調査し、レポートにまとめることができるため、リサーチャーやデータサイエンティスト、プロダクトマネージャーなど、情報収集を必要とする人々に役立ちます。 AIを活用した効率的なリサーチを支援する機能です。
本記事は、知識強化型言語モデルLUKEに関するミートアップの開催告知です。 LUKEの開発者や研究者、興味のある方を対象に、LUKEを取り巻く最新情報やUBKE-LUKE、GLuCoSE v2に関する情報が提供されます。 エンジニアや研究者向けのイベントです。
AWSの生成AIを活用したHappy Sadアプリに関する記事です。 アプリは児童のメンタルヘルスを向上させる目的で開発されました。 教師、保護者、教育関係者、ソフトウェア開発者に役立つ情報を提供します。
Amazon Bedrockの新しい評価機能として、RAG評価とLLM-as-a-Judgeが導入されました。 これにより、AIアプリの評価を迅速化し、品質向上を容易にします。 特に、機械学習エンジニアやデータサイエンティストにとって有益な情報です。
AWS Skill Builderで、AWS上の生成AIをセキュアにするためのコースがリリースされました。 このコースでは、生成AIのセキュリティのベストプラクティスを学び、実践的な戦略を開発します。 セキュリティ専門家、アーキテクト、AI/MLエンジニア向けのコースです。
Phi-4という最先端のオープンモデルをPCで簡単に動かす方法についての記事です。 - 機械学習に興味がある人 - PCでAIモデルを動かしたい人 - 最先端の技術に触れたい人
SageMaker HyperPodクラスターの起動に必要なIAM設定についてまとめた記事です。 主にインフラエンジニアやSRE、機械学習エンジニア向けの記事です。 IAM周りの設定に困っている人にとって役立つ情報が記載されています。
この書籍は、AIエージェント開発を体系的に学ぶための入門書です。 SageMaker Studio Code EditorとBedrockを用いた検証リポジトリも提供されています。 AIエージェント開発に関わるエンジニアや研究者向けの記事です。
SageMaker HyperPodのタスクガバナンス機能に関する記事です。 この機能の試用結果について述べています。 機械学習エンジニアやインフラエンジニア向けの記事です。
・SageMaker HyperPodのログインノードにVS CodeからリモートSSH接続する手順を紹介 ・機械学習エンジニアやインフラエンジニアが、開発環境構築の効率化に役立つ ・VS CodeのリモートSSH拡張機能を利用した接続方法を解説
Amazon Connect Contact Lensのアップデートに関する記事です。 - エージェントのパフォーマンス評価に生成AIによる自動評価が追加されました。 - この機能は現在プレビュー版です。 - コールセンターの品質管理に関わる人や、Amazon Connectを利用している企業担当者向けの記事です。
この記事は、Rベースの予測モデルとAlteryxを活用して、卒業生の寄付行動を予測する手法について解説しています。 主な読者層は、データ分析に関わる方や、機械学習を用いて業務改善を考えている方です。 具体的には、RとAlteryxを組み合わせて予測モデルを構築する手順や、実際のデータを用いた事例について触れています。
AWS re:Invent 2024の参加レポートです。 参加者それぞれの視点から、セッション内容や学び、今後の展望についてまとめています。 AWSの最新技術動向や、生成AIの活用事例に関心のあるエンジニアやマネージャー向けの記事です。
・Ollamaのphi4モデルを.NET Aspireで利用する手順を紹介 ・.NET AspireのプロジェクトにOllama統合を追加し、コードを記述 ・機械学習モデルを.NETアプリケーションで試したいエンジニア向け
この記事は、DatabricksとUnity Catalogを用いて、Kaggleのデータを機械学習に使いやすくする手順を解説しています。 具体的には、データの整理やカタログ化の方法について述べています。 機械学習エンジニアやデータサイエンティストが対象読者です。
NVIDIAがローカルで動作するAIエージェント「Project R2X」を発表しました。 デスクトップ上にキャラクターが表示され、アプリの使い方やドキュメントの要約を行います。 PCユーザー向けの、AIによるアシスタント機能に関する記事です。
Amazon Novaは、最先端のインテリジェンスと業界トップクラスの価格パフォーマンスを実現する新しい基盤モデルです。 テキスト、画像、ビデオの処理が可能で、ドキュメント分析やコンテンツ生成など幅広いタスクに対応します。 主に、AIを活用したサービス開発に関わるエンジニアやマーケターに向けた記事です。
2025年に向けた最新のAI価格戦略と組織文化に関するセミナーです。 多様性時代における価格設定の重要性と、データに基づいた価格戦略、組織文化の構築について解説します。 経営者、経営企画、マーケティング部門の方々におすすめです。
Kaggleコンペ「Eedi – Mining Misconceptions in Mathematics」での学びについての記事です。 - 算数問題の誤答から、生徒の誤解パターンを特定する機械学習モデル構築の取り組みを紹介します。 - RetrieverとRerankerの2段階アプローチやSimCSEを用いた学習方法について解説しています。 - 機械学習の内部実装の理解がサービス選定やデータ設計に役立つことを述べています。
この記事は、GoogleのGeminiアプリをDatadog LLM Observabilityで監視する方法について解説しています。 GeminiのようなLLMは強力ですが、API経由での利用はAIアプリの挙動を理解し、問題をデバッグすることを困難にする可能性があります。 この記事は、AIアプリケーションのパフォーマンスを監視し、問題解決を迅速化したいと考えている開発者、SRE、データサイエンティスト向けです。
EKSオーケストレータを使ったSageMaker HyperPodクラスターでのS3マウントに関する記事です。 ・S3をマウントする具体的な手順について解説しています。 ・機械学習エンジニアやインフラエンジニア、SREの方にとって役立つ情報です。
AWS認定AIプラクティショナー試験対策として、AWS Escape Roomを試した記事です。 - AWSのAIサービスに関する知識を試したい人 - 試験対策を楽しく行いたい人 - AWSのAIサービスに興味がある人
このニュースはAWS認定機械学習スペシャリティの試験勉強法について解説しています。 - AWS認定機械学習スペシャリティの資格取得を目指す人向けです。 - 機械学習の知識とAWSに関する知識を必要とする試験の勉強法を解説しています。
・Apptainerを使用してタンパク質の立体構造予測ツールOpenFoldを実行した。 ・機械学習やバイオインフォマティクス分野の研究者やエンジニア向けの記事。 ・具体的な実行手順や注意点について解説している。
Amazon SageMaker HyperPod のクラスター設定ファイルのバリデーションスクリプトを試した記事です。 - インフラエンジニア、機械学習エンジニア向け - 設定ファイルのミスを事前に検出可能 - クラスタ構築の効率化に貢献
この記事は、SageMaker HyperPodのディープヘルスチェックについて解説しています。 - 機械学習エンジニアやプラットフォームエンジニアが対象です。 - SageMaker HyperPodの安定性と信頼性を向上させるための機能を紹介しています。
・EKS Auto Mode でGPUを利用する方法の紹介 ・AWS独自設計チップTrainiumとInferentiaの利用事例 ・GPUを必要とするコンテナアプリケーションの実行を検討している人向けの記事
アオラナウ株式会社がAWSのGenUを活用し、社内RAGシステムを構築した事例を紹介。 技術ドキュメント検索時間が1/5に短縮、未経験者からの問い合わせ削減など業務効率化に成功。 主に、AWSを活用したシステム開発に関わるエンジニアや、技術調査業務の効率化に関心のある担当者向けの記事。
・イオンが展開する新しいECサービス「グリーンビーンズ」の舞台裏についての記事です。 ・AIを活用して冷蔵庫をコンビニのようにし、50倍の成長を目指しているとのことです。 ・技術者、マーケター、事業開発担当者など、新規事業に関わる全ての人々向けの記事です。
このニュースレターは、AWSの機械学習関連サービスの2024年12月分のアップデート情報を提供します。 この情報は、機械学習エンジニアやデータサイエンティストにとって有用です。 AWSの最新情報をキャッチアップしたい方にもおすすめです。
自動車産業における生成AIの活用事例を紹介しています。 AWSとSnowflakeの機能を使い、顧客調査やオンラインレビューを分析しています。 主に、AI技術に関心のある技術者やマーケター向けの記事です。