AI
2023/04/06
上野 桃香

Dataiku DSSの導入に迷っている方必見!3つのインストール&セットアップ方法

この記事では、Dataiku DSSを導入する際に選択肢があることをご紹介します。具体的には、インストールとセットアップの方法としてDataiku Cloud,Dataiku Cloud Stacks,Custom Dataiku の3つがあります。それぞれの方法について、メリット・デメリットや必要な手順について解説します。Dataiku DSSの導入に迷っている方や、手軽に導入したい方には特におすすめの記事です。

はじめに

先日Dataiku DSSをGCPにセットアップした上野です。手順書が英語だったりGCPの設定が難解な部分が多くて苦労しました。


今回はDataikuをGCPにセットアップした手順について紹介するのではなく、Dataikuをどのように会社で使えるのか説明したいと思います。インストールするDataikuサーバーには3種類あります。


<インストールするDataikuサーバータイプ3種>


①Dataiku Cloud


②Dataiku Cloud Stacks


③Custom Dataiku


もし公式のリファレンスを参照したい方はこちらまでどうぞ。

Dataikuとは

そもそもDataikuとはなにかChatGPTさんに聞いてみました。


私「Dataikuって何?何がすごいの?」


ChatGPT「Dataikuは、データの前処理、モデルのトレーニングおよびモデルの監視と維持に必要なすべての機能を提供します。データサイエンスのプロジェクトを管理し、実行するためのオールインワンのプラットフォームです。Dataikuは、ビジネスユーザー、アナリスト、データサイエンティスト、エンジニア、開発者など、さまざまなバックグラウンドを持つユーザーが協力して、データドリブンなアプリケーションを作成することを可能にします。


Dataikuのすごいところは、使いやすいビジュアルでデータを分析できることと、柔軟な拡張性があることです。Dataikuは、さまざまなデータソースや分析ツール、AIプラットフォームなどとシームレスに連携することができます。また、Dataikuは、自動的にモデルをトレーニングし、チューニングする機能も提供しており、データサイエンティストがモデルを構築する時間を短縮できます。さらに、Dataikuは、高度なセキュリティ機能を備えており、機密性の高いデータを処理する企業にとって安全で信頼性の高い選択肢です。」


さすがChatGPTさんですね。大体合っています。

1.Dataiku Cloud

<ポイント>


データとコンピューティングリソースはDataikuが管理


Dataikuが提供するクラウド上で利用


公式文


Dataiku Cloud: Dataiku provides free trials and paying hosted plans on its own cloud. Data and compute are hosted by Dataiku.


引用元:Installing and setting up — Dataiku DSS 11 documentation


Dataikuが提供するクラウド上の無料トライアルや有料のホステッドプランを利用する方法です。データとコンピュートはDataikuが管理します。つまりDataikuがデータセンターを管理し、データの保存や処理、コンピューティングリソースの提供を行います。これにより、ユーザーは自分でデータセンターやサーバーを構築する必要がなく、Dataikuが提供するインフラストラクチャーを利用することができます。

2.Dataiku Cloud Stacks

<ポイント>


Dataiku側はデータにアクセスできない。


AWSやGCP,Microsoft AzureのどれかでDataiku DSSを利用し、完全に管理。


公式文


Dataiku Cloud Stacks: Deploy a fully-managed Dataiku setup on a cloud provider. The setup comes fully-featured with Elastic AI, advanced security, R support, auto-healing setup… Everything is deployed in your cloud tenant, Dataiku does not have access to your data. This is the recommended setup for deploying on a cloud provider in your tenant. Supported cloud providers are:



  • ・Amazon Web Services (AWS)

  • ・Google Cloud Platform (GCP)

  • ・Microsoft Azure


引用元:Installing and setting up — Dataiku DSS 11 documentation



    クラウドプロバイダに完全に管理されたDataikuのセットアップがこちらになります。Elastic AI、高度なセキュリティ、Rのサポートなど、すべてがフル機能で提供されます。

    3.Custom Dataiku

    <ポイント>


    Dataiku側はデータにアクセスできない。


    自分のLinuxサーバーで管理


    公式文


    Custom Dataiku: Download and install Dataiku DSS on your own Linux server. This can be deployed either on-premises or on any cloud. Use this setup if you cannot use Dataiku Online or Dataiku Cloud Stacks


    引用元:Installing and setting up — Dataiku DSS 11 documentation


    自分自身のLinuxサーバーにDataiku DSSをダウンロードしてインストールする方法です。オンプレミスまたは任意のクラウド上にデプロイすることができます。Dataiku OnlineやDataiku Cloud Stacksを利用できない場合に使用します。

    まとめ

    まとめるとこの通りになります。


    1.Dataiku Cloud


    →環境開発:Dataikuが提供するクラウド


    データの管理:Dataiku


    2.Dataiku Cloud Stacks


    →環境開発:AWS,GCP,Microsoft Azure


    データの管理:自社


    3.Custom Dataiku


    →環境開発:自身のLinuxサーバー


    データの管理:自社


    最後までお付き合いいただきありがとうございました。


    【関連記事】


    Dataikuでの時系列予測におけるPython処理の例


    Dataiku Scenario構築と使い方について


    AWSマーケットプレイスのDataIku AMIを使ってDataiku on AWSを構築する方法


    【Dataiku】パートナー向け「コアデザイナー認定資格取得講座」体験レポ


    Dataiku LLMハンズオン参加レポート パート1: 感情分析によるテキストデータの理解


    【Dataiku】SIGNATEで2値分類予測した作成手順紹介と感想


    GCP上でDataiku DSSを効率的に運用するためのコスト削減策:5分の1のコスト削減に成功!


    GCP上にDataiku DSSをセットアップする方法を解説!クラウド上でのデータ分析が更に簡単に


    【経験談】Dataikuの魅力とは?ビジネスユーザーも簡単に使えるデータ分析プラットフォームを紹介


    DataikuでBigQueryのデータを分析!簡単な連携方法と使い方を解説


    「AIを取り巻く環境と、これからのリアル」~イベント「Dataiku MEET-UP」レポート


    クラウドプラットフォームに対応した、AIおよび機械学習ツール「Dataiku」

    New call-to-action