Dataiku DSSの導入に迷っている方必見!3つのインストール&セットアップ方法
この記事では、Dataiku DSSを導入する際に選択肢があることをご紹介します。具体的には、インストールとセットアップの方法としてDataiku Cloud,Dataiku Cloud Stacks,Custom Dataiku の3つがあります。それぞれの方法について、メリット・デメリットや必要な手順について解説します。Dataiku DSSの導入に迷っている方や、手軽に導入したい方には特におすすめの記事です。
はじめに
先日Dataiku DSSをGCPにセットアップした上野です。手順書が英語だったりGCPの設定が難解な部分が多くて苦労しました。
今回はDataikuをGCPにセットアップした手順について紹介するのではなく、Dataikuをどのように会社で使えるのか説明したいと思います。インストールするDataikuサーバーには3種類あります。
<インストールするDataikuサーバータイプ3種>
①Dataiku Cloud
②Dataiku Cloud Stacks
③Custom Dataiku
もし公式のリファレンスを参照したい方はこちらまでどうぞ。
Dataikuとは
そもそもDataikuとはなにかChatGPTさんに聞いてみました。
私「Dataikuって何?何がすごいの?」
ChatGPT「Dataikuは、データの前処理、モデルのトレーニングおよびモデルの監視と維持に必要なすべての機能を提供します。データサイエンスのプロジェクトを管理し、実行するためのオールインワンのプラットフォームです。Dataikuは、ビジネスユーザー、アナリスト、データサイエンティスト、エンジニア、開発者など、さまざまなバックグラウンドを持つユーザーが協力して、データドリブンなアプリケーションを作成することを可能にします。
Dataikuのすごいところは、使いやすいビジュアルでデータを分析できることと、柔軟な拡張性があることです。Dataikuは、さまざまなデータソースや分析ツール、AIプラットフォームなどとシームレスに連携することができます。また、Dataikuは、自動的にモデルをトレーニングし、チューニングする機能も提供しており、データサイエンティストがモデルを構築する時間を短縮できます。さらに、Dataikuは、高度なセキュリティ機能を備えており、機密性の高いデータを処理する企業にとって安全で信頼性の高い選択肢です。」
さすがChatGPTさんですね。大体合っています。
1.Dataiku Cloud
<ポイント>
・データとコンピューティングリソースはDataikuが管理
・Dataikuが提供するクラウド上で利用
公式文
Dataiku Cloud: Dataiku provides free trials and paying hosted plans on its own cloud. Data and compute are hosted by Dataiku.
引用元:Installing and setting up — Dataiku DSS 11 documentation
Dataikuが提供するクラウド上の無料トライアルや有料のホステッドプランを利用する方法です。データとコンピュートはDataikuが管理します。つまりDataikuがデータセンターを管理し、データの保存や処理、コンピューティングリソースの提供を行います。これにより、ユーザーは自分でデータセンターやサーバーを構築する必要がなく、Dataikuが提供するインフラストラクチャーを利用することができます。
2.Dataiku Cloud Stacks
<ポイント>
・Dataiku側はデータにアクセスできない。
・AWSやGCP,Microsoft AzureのどれかでDataiku DSSを利用し、完全に管理。
公式文
Dataiku Cloud Stacks: Deploy a fully-managed Dataiku setup on a cloud provider. The setup comes fully-featured with Elastic AI, advanced security, R support, auto-healing setup… Everything is deployed in your cloud tenant, Dataiku does not have access to your data. This is the recommended setup for deploying on a cloud provider in your tenant. Supported cloud providers are:
- ・Amazon Web Services (AWS)
- ・Google Cloud Platform (GCP)
- ・Microsoft Azure
引用元:Installing and setting up — Dataiku DSS 11 documentation
クラウドプロバイダに完全に管理されたDataikuのセットアップがこちらになります。Elastic AI、高度なセキュリティ、Rのサポートなど、すべてがフル機能で提供されます。
3.Custom Dataiku
<ポイント>
・Dataiku側はデータにアクセスできない。
・自分のLinuxサーバーで管理
公式文
Custom Dataiku: Download and install Dataiku DSS on your own Linux server. This can be deployed either on-premises or on any cloud. Use this setup if you cannot use Dataiku Online or Dataiku Cloud Stacks
引用元:Installing and setting up — Dataiku DSS 11 documentation
自分自身のLinuxサーバーにDataiku DSSをダウンロードしてインストールする方法です。オンプレミスまたは任意のクラウド上にデプロイすることができます。Dataiku OnlineやDataiku Cloud Stacksを利用できない場合に使用します。
まとめ
まとめるとこの通りになります。
1.Dataiku Cloud
→環境開発:Dataikuが提供するクラウド
データの管理:Dataiku
2.Dataiku Cloud Stacks
→環境開発:AWS,GCP,Microsoft Azure
データの管理:自社
3.Custom Dataiku
→環境開発:自身のLinuxサーバー
データの管理:自社
最後までお付き合いいただきありがとうございました。