AI
2025/08/21
後藤 亜有

【Databricks】Agent Bricksは何ができる?Amazonのデータセットで検証してみた

本記事では、Databricksが提供するノーコードのAIエージェント構築ツール「Agent Bricks」を徹底検証します。情報抽出、カスタムLLM、ナレッジアシスタント、複数エージェント連携という4つの主要機能を、Amazonベストセラー商品データセットを用いて検証し、その高いタスク振り分け能力と柔軟性を評価する一方で、入力データの形式調整やプロンプトエンジニアリングの重要性といった課題も指摘します。

Agent Bricksについて

Agent Bricksとは?


Databricksは、データ、分析、AIを統合する「データインテリジェンスプラットフォーム」を提供する企業です。そのDatabricksが、AI開発の新たな一歩としてリリースしたノーコードツールが「Agent Bricks」です。


「AIエージェントを自社データで作りたいが、何から手をつければ…?」 そんな悩みを解決すると言われるこの新機能、謳い文句通り、本当に簡単に高機能なエージェントが作れるのでしょうか?今回は、Amazonのベストセラー商品データセットを使い、Agent Bricksの主要な機能を一つずつ、そして連携させて徹底的に検証してみました。


 


Agent Bricksの4つの主要機能


Agent Bricksは、専門知識がなくともAIエージェントシステムを構築・最適化できるツールです 。主に以下の4つのコンポーネントで構成されています。





    1. Information Extraction (情報抽出):PDFやテキストなどの非構造化データから、必要な情報を抜き出して構造化データ(JSON)に変換します。

    2. Custom LLM (カスタムLLM):特定のタスク(要約、分類、コンテンツ生成など)に特化したLLMを、自社のデータやルールに基づいて作成します。

    3. Knowledge Assistant (ナレッジアシスタント):社内ドキュメントなどを知識源として、質問応答を行うAIチャットボット(RAG)を構築します。

    4. Multi-Agent Supervisor (マルチエージェントスーパーバイザー):上記の3つのエージェントを組み合わせ、より複雑なタスクをこなす司令塔役のエージェントを設計します。





    公式URL:https://docs.databricks.com/aws/ja/generative-ai/agent-bricks/


    今回の検証では、これらの機能を個別、そして統合して試していきます。


     


    検証環境とデータ


    ・使用データ: Databricks Marketplaceで入手できる、Bright Data社のAmazonのベストセラー商品、レビュー、製品情報を含むデータセットを利用します。このデータには、商品名、ブランド、価格、レビュー、商品説明などが含まれています。合法な目的であれば使用可能の無料データセットです。

    URL:https://dbc-629df5e5-8f40.cloud.databricks.com/marketplace/consumer/listings/396e924a-42c5-455c-ae98-8871e25293d2?o=746903631743211


    ・ワークスペース: 全てDatabricksのワークスペース上で作業を行いました。




    検証1: Information Extraction (情報抽出)

    タスク: 商品データから重要な情報を抽出し、JSON形式に変換する


    プロセスと工夫


    最初に直面した課題は、Agent Bricksが入力としてString型の1列しか受け付けないことでした 。そこで、to_json(struct(*)) というSQL関数を使い、テーブルの全列を一つのJSON文字列にまとめてall_column_jsonという列を作成しました。


    さらに、ただ抽出するだけでなく、より質の高い結果を得るために、プロンプトで以下のような指示を追加しました。



    Instructions: 商品分析に重要な項目のみを残してください。FEATURESは長いテキストが入っているので、簡潔に重要なポイントだけを抜き出し、セールスの謳い文句は端折ってください。



    結果


    成功。エージェントは指示通りに全データをJSON形式に変換し、新しい列に格納できました 。特筆すべきは、プロンプトで具体的に指示せずとも、エージェントが自動でデータを読み取り「重要でない」と判断した項目(初期価格や重さなど)を自律的に除外してくれた点です 。これは、単なる変換ツール以上の価値を示しています。


    検証2: Custom LLM (カスタムLLM)

    タスク: 抽出したJSONデータを日付ごとにまとめ、特定の期間でどのような商品が売れていたかを分析するマーケティングレポートを作成させる。


    プロセスと工夫


    このタスクでも、LLMへの入力形式を整える必要がありました 。


    GROUP BY TIMESTAMPを使い、日付ごとに商品情報をJSON配列としてまとめた後に別テーブルにsummary_inputという入力列を作成することで、LLMが日ごとの人気商品データをまとめて受け取れるようになりました。


    プロンプトでは、単に分析を依頼するだけでなく、「優秀なマーケティングアナリスト」という役割を与え 、アウトプットの形式(ジャンル、価格帯、レビュー、特徴の4観点)を厳密に指定しました 。


    結果


    一部成功。最初の試行では、入力するテキストが長すぎたためか、うまく処理できませんでした。入力情報をより簡潔にするようプロンプトを調整したところ、レポートを生成できるようになりました。


    しかし、いくつかの日付のデータで結果がnullになるなど、安定性には課題も残りました。長大なテキストの扱いは、今後の改善に期待したいポイントです。


    検証3: Knowledge Assistant (ナレッジアシスタント)

    タスク: Custom LLMが生成した日々の売上分析レポートを知識源として、自然言語での質問に答えさせる。


    プロセスと工夫


    ナレッジアシスタントは、


    Volume内にある特定のファイル形式(TXT, PDFなど)しか読み込めません 。そのため、Custom LLMの分析結果(テーブルに保存されている)を、Pythonスクリプトを使って日付ごとの


    .txtファイルに変換し、指定のVolumeに保存する必要がありました。


    ここでもプロンプトの工夫が重要でした。ファイル名の命名規則をしっかり含めます。



    …sales_analysis_report_2023-MM-DD.txtというファイル名でデータが入っています。



    結果


    成功。当初、レポートが存在する日付を尋ねても「データがない」と回答されてしまいましたが、プロンプトにファイル名の命名規則を明記したところ、正しくファイルを検索・参照できるようになりました


    Q. ユーザー: 9月上旬の売り上げを分析して


    A. エージェント: 9月上旬の売上分析によると、以下のような傾向が見られました: 1. ジャンルの傾向: 衣類(特に女性用)が最も多くランク入りし…


    応答の質は元のレポートの内容に依存しますが、RAGエージェントとして問題なく機能することを確認できました 。


    最終検証: Multi-Agent Supervisor (複数エージェントの連携)

    タスク: ユーザーの質問の意図を解釈し、「データベースへの直接クエリ」と「ナレッジアシスタントによるRAG」を適切に使い分ける司令塔エージェントを構築する 。


    プロセスと工夫


    このエージェントには、2つのツールを与えました。



    1. Genie Space: 自然言語を入力すれば、テーブルを直接SQLでクエリして結果を返してくれるワークスペース。元データ、検証1の抽出結果、検証2のレポートが入っている。

    2. Knowledge Assistant: 先ほど作成したRAGチャットボット。


    プロンプトで、それぞれのツールが何を担当するのかを定義しました。


     


    結果


    大成功。このスーパーバイザーエージェントは、ユーザーからの抽象的な指示を見事に解釈し、タスクを適切なツールに振り分けることができました。




    • 「出品数が多い出品者はどこ?」 という質問に対して…


      Genie Spaceを起動し、データベースを直接クエリしてランキングを提示。




    • 「10月に売れていた商品のジャンルは何?」 という質問に対して…


      Knowledge Assistantを起動し、分析レポートをRAGで検索して回答。




    列名などを指定しない曖昧な指示でも正しく動作した点は、非常に高く評価できます。



    まとめ:検証から見えたAgent Bricksの実力

    今回の検証を通して、Databricks Agent Bricksは単なるノーコードツールではなく、実践的で強力なAIエージェント開発プラットフォームであることが分かりました。



    • 良かった点:

      • ノーコードで情報抽出からRAG、エージェント連携までの一連のフローを構築できる。

      • Multi-Agent Supervisorのタスク振り分け能力が非常に高く、ユーザーの意図を汲み取ってくれる 。

      • プロンプトによる柔軟なカスタマイズが可能 。



    • 課題と学び:

      • 入力データの形式(単一String列 、ファイル形式 など)には一手間かかる。

      • 期待通りの結果を得るには、的確なプロンプトエンジニアリング(役割、出力形式、データソースの指定 )が鍵となる。

      • 長文テキストの処理にはまだ改善の余地があるかもしれない。




    利用上の注意点


    Agent Bricksを試す前に、いくつか知っておくべき点があります。



    • ベータ版の機能: この記事を執筆している2025年8月現在、Agent Bricksはベータ版として提供されています。これは、機能が将来変更されたり、予期せぬ動作をする可能性があることを意味します。本番環境での利用は慎重に検討する必要があります。

    • 利用要件: 利用するには、特定のAWSリージョン(例: us-east-1, us-west-2)である必要があったり、DatabricksのServerless computeやUnity Catalogといった機能を有効化する必要があります。


    Agent Bricksは、データエンジニアリングとAI開発の間の溝を埋め、より多くの人が自社データを活用したAIエージェントを構築・運用できる未来を感じさせてくれるツールでした。ベータ版であるものの、そのポテンシャルは非常に高く、今後のさらなる進化がますます楽しみです。


    New call-to-action