そのほか
2024/11/25
與田 龍人

DatabricksとGitHubをリンク済みアカウントで簡単連携する方法

Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。

はじめに

Databricksでは、GitHubアカウントをリンクし、ノートブックのバージョン管理やリモートリポジトリとの統合を簡単に行えます。さらに、GitHubにDatabricksアプリをインストールすることで、シームレスな連携を実現できます。本記事では、DatabricksとGitHubをリンク済みアカウント機能を使って連携する手順と、必要なGitHubアプリのインストール方法について解説します。


1. 必要な準備


  • Databricksアカウント:ワークスペースへのアクセス権限があること。

  • GitHubアカウント:リポジトリの管理権限があること。

  • Databricksアプリのインストール:GitHubリポジトリにDatabricksアプリをインストールする必要があります(後述)。


2. DatabricksとGitHubアカウントのリンク

2.1 DatabricksでGitHubアカウントをリンク


1.Databricksワークスペースにログインします。


2.サイドバーのプロフィールアイコンをクリックし、「ユーザ設定(User Settings)」を選択します。


3.「Git統合(Git Integration)」タブを開きます。


4.ドロップダウンから「GitHub」を選択します。


5.「Gitアカウントをリンク(Link Git Account)」ボタンをクリックします。



6.表示されるGitHubの認証画面で「Authorize Databricks」をクリックします。



3. GitHubにDatabricksアプリをインストール

DatabricksがGitHubリポジトリと完全に統合されるには、GitHubにDatabricksアプリをインストールする必要があります。


3.1 Databricksアプリをインストールする手順


1.GitHubにログインします。


2.DatabricksアプリのGitHubページ にアクセスします。


3.「Install App(アプリをインストール)」をクリックします。



4.インストール対象のリポジトリを選択します(すべてのリポジトリ、または特定のリポジトリを選択可能)。


5.「Install(インストール)」をクリックしてインストールを完了します。



これで、DatabricksアプリがGitHubリポジトリで動作するようになります。



4. ノートブックとリポジトリの統合

GitHubアカウントとDatabricksのリンク、およびアプリのインストールが完了したら、DatabricksノートブックをGitHubリポジトリと統合します。


4.1 Gitリポジトリを設定する


1.Databricksワークスペースで、ノートブックを開きます。


2.右上の「Git」アイコンをクリックします。


3.「Gitフォルダを作成」を選択します。



4.リモートリポジトリのURL(例:https://github.com/username/repository.git)を入力します。


5.Databricksが自動的にリポジトリをクローンし、ノートブックがGitで管理されます。




4.2 ノートブックの変更をGitHubにコミット


1.ノートブックの編集後、右上の「Git」アイコンをクリックします。


2.「変更を表示(View Changes)」を選択し、変更内容を確認します。


3.「コミット(Commit)」をクリックして変更をGitHubに反映します。



5. トラブルシューティング

Databricksアプリが動作しない場合



  • アプリのインストール対象リポジトリが正しいことを確認してください。

  • DatabricksワークスペースとGitHubアカウントが正しくリンクされているかを確認してください。


Gitリポジトリへのアクセスが拒否される場合



  • GitHubリポジトリのアクセス権限(プッシュ可能かどうか)を確認してください。

  • Databricksアプリに十分な権限があるかを確認してください。


おわり

DatabricksとGitHubの連携は、データプロジェクトのバージョン管理や共同作業をスムーズにする重要なステップです。リンク済みアカウントを使えば、トークンの管理が不要で、GitHubアプリをインストールすることでさらに簡単に統合が進みます。

New call-to-action