DatabricksとGitHubをリンク済みアカウントで簡単連携する方法
Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。
目次
はじめに
Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。
1. 必要な準備
- Databricksアカウント:ワークスペースへのアクセス権限があること。
- GitHubアカウント:リポジトリの管理権限があること。
- Databricksアプリのインストール:GitHubリポジトリにDatabricksアプリをインストールする必要があります(後述)。
2. DatabricksとGitHubアカウントのリンク
2.1 DatabricksでGitHubアカウントをリンク
1.Databricksワークスペースにログインします。
2.サイドバーのプロフィールアイコンをクリックし、「ユーザ設定(User Settings)」を選択します。
3.「Git統合(Git Integration)」タブを開きます。
4.ドロップダウンから「GitHub」を選択します。
5.「Gitアカウントをリンク(Link Git Account)」ボタンをクリックします。
6.表示されるGitHubの認証画面で「Authorize Databricks」をクリックします。
3. GitHubにDatabricksアプリをインストール
DatabricksがGitHubリポジトリと完全に統合されるには、GitHubにDatabricksアプリをインストールする必要があります。
3.1 Databricksアプリをインストールする手順
1.GitHubにログインします。
2.DatabricksアプリのGitHubページ にアクセスします。
3.「Install App(アプリをインストール)」をクリックします。
4.インストール対象のリポジトリを選択します(すべてのリポジトリ、または特定のリポジトリを選択可能)。
5.「Install(インストール)」をクリックしてインストールを完了します。
これで、DatabricksアプリがGitHubリポジトリで動作するようになります。
4. ノートブックとリポジトリの統合
GitHubアカウントとDatabricksのリンク、およびアプリのインストールが完了したら、DatabricksノートブックをGitHubリポジトリと統合します。
4.1 Gitリポジトリを設定する
1.Databricksワークスペースで、ノートブックを開きます。
2.右上の「Git」アイコンをクリックします。
3.「Gitフォルダを作成」を選択します。
4.リモートリポジトリのURL(例:https://github.com/username/repository.git
)を入力します。
5.Databricksが自動的にリポジトリをクローンし、ノートブックがGitで管理されます。
4.2 ノートブックの変更をGitHubにコミット
1.ノートブックの編集後、右上の「Git」アイコンをクリックします。
2.「変更を表示(View Changes)」を選択し、変更内容を確認します。
3.「コミット(Commit)」をクリックして変更をGitHubに反映します。
5. トラブルシューティング
Databricksアプリが動作しない場合
- アプリのインストール対象リポジトリが正しいことを確認してください。
- DatabricksワークスペースとGitHubアカウントが正しくリンクされているかを確認してください。
Gitリポジトリへのアクセスが拒否される場合
- GitHubリポジトリのアクセス権限(プッシュ可能かどうか)を確認してください。
- Databricksアプリに十分な権限があるかを確認してください。
おわり
DatabricksとGitHubの連携は、データプロジェクトのバージョン管理や共同作業をスムーズにする重要なステップです。リンク済みアカウントを使えば、トークンの管理が不要で、GitHubアプリをインストールすることでさらに簡単に統合が進みます。