そのほか
2024/11/26
與田 龍人

Delta Sharing: データ共有の標準化

企業やチーム間でのデータ共有は、セキュリティと効率性が求められる重要な課題です。Databricksが提供するDelta Sharingは、これを解決するためのオープンプロトコルであり、プラットフォームに依存しない安全かつリアルタイムなデータ共有を可能にします。
本記事では、Delta Sharingを利用してデータを共有する手順を具体的に解説します。Databricksの直感的なUIを用いたプロセスをステップごとに示し、設定後の活用方法についても触れます。

はじめに

企業やチーム間でのデータ共有は、セキュリティと効率性が求められる重要な課題です。Databricksが提供するDelta Sharingは、これを解決するためのオープンプロトコルであり、プラットフォームに依存しない安全かつリアルタイムなデータ共有を可能にします。


本記事では、Delta Sharingを利用してデータを共有する手順を具体的に解説します。Databricksの直感的なUIを用いたプロセスをステップごとに示し、設定後の活用方法についても触れます。


 


Delta Sharingを用いたデータ共有は、以下の4つのステップで構成されています。


1. 共有を作成

1. 共有を作成


Delta Sharingの第一歩は「共有の作成」です。このステップでは、共有するデータセットの目的や説明を設定します。


Databricksのカタログエクスプローラーにアクセスします。


「共有」タブを開き、「共有を作成」ボタンをクリックします。



以下のように、共有名とコメントを入力します。




    • 共有名: 「売上データの共有」

    • コメント: 「月次の売上データに関する共有となります。」



    作成が完了すると、次のステップに進む準備が整います。


     


    2. データセットを追加

    次に、共有するデータセット(テーブルやビュー)を追加します。これにより、受信者は指定されたデータのみを閲覧できます。



    • 手順:

      1. 「データセットを追加」ボタンをクリックします。

      2. 共有したいDeltaテーブルやビューを選択します。

      3. 必要に応じて、複数のデータセットを追加します。




    データセットを選択すると、それらが共有設定に反映されます。このステップで共有するデータ範囲をしっかり絞り込むことが重要です。


    3. ノートブックを追加

    共有したデータに関する解説や使用例を含むノートブックを添付することで、受信者がデータの利用方法を容易に理解できるようにします。



    • 手順:

      1. 「ノートブックを追加」タブを選択します。

      2. 必要なノートブックをアップロードまたは既存のものを選択します。





    ノートブックを添付することで、データの意味や使用方法を文書化できます。これにより、データの受信者がスムーズに分析や活用を開始できるようになります。


    4. 受信者を追加

    最後に、データを共有する受信者を指定します。このステップでは、セキュリティを保ちながらデータアクセスを許可する対象を明確にします。


    手順:


    1.「受信者を追加」タブを開きます。


    2.Databricks内のユーザーやグループを指定します。


    3.必要に応じて、アクセス権限(読み取り専用など)を設定します。



    Delta Sharingの活用例

    設定が完了すると、受信者は指定されたデータセットに安全にアクセスできるようになります。受信者は、Databricks、Pandas、またはHTTPクライアントを使用してデータを取り出すことができます。


    Pandasでのデータ取得例


    以下は、Delta Sharingを利用してPandasでデータを取得する例です:



    import pandas as pd
    from delta_sharing import SharingClient

    # Delta Sharingサーバーへの接続
    client = SharingClient("")

    # データを取得
    df = pd.read_delta_table(client, "my_share.delta_sharing_example.data_to_share")
    print(df.head())


    このコードにより、共有リンクを用いてリアルタイムでデータを取得できます。


    まとめ

    Delta Sharingは、データ共有を効率的かつ安全に行うための強力なツールです。本記事で解説した手順に従えば、共有プロセスを簡単に設定し、受信者とデータを安全にやり取りできます。


    主なポイントを振り返ります:


    ・共有名やコメントを付けて目的を明確に


    ・必要なデータセットを限定して共有


    ・ノートブックを活用してデータの背景を提供


    ・受信者の権限を細かく設定してセキュリティを確保


    Delta Sharingを導入し、データ共有の新しい標準を体感してみてください!


    New call-to-action