共用方式為


DBeaver 與 Azure Databricks 整合

注意

本文涵蓋第三方開發的 DBeaver。 若要連絡提供者,請參閱 GitHub 上 dbeaver/dbeaver 存放庫的 問題 頁面。

DBeaver 是本機、多平台資料庫工具,適用於開發人員、資料庫管理員、數據分析師、數據工程師,以及其他需要使用資料庫的人員。 DBeaver 支援 Azure Databricks 和其他熱門資料庫。

本文說明如何使用本機開發計算機來安裝、設定及使用免費的開放原始碼 DBeaver Community Edition (CE) 來處理 Azure Databricks 中的資料庫。

注意

本文已使用 macOS、Databricks JDBC Driver 2.6.36 版和 DBeaver CE 23.3.0 版進行測試。

要求

安裝 DBeaver 之前,您的本機開發計算機必須符合下列需求:

  • Linux 64 位、macOS 或 Windows 64 位作業系統。 (支援 Linux 32 位,但不建議使用。
  • Databricks JDBC Driver 至您的本地開發環境,並從下載的 DatabricksJDBC42.jar 檔案中解壓縮出 DatabricksJDBC42-<version>.zip 檔案。

您也必須有 Azure Databricks 叢集SQL 倉儲,才能與 DBeaver 連線。

步驟 1:安裝 DBeaver

下載並安裝 DBeaver CE,如下所示:

  • Linux:從 DBeaver 網站上的 下載 頁面下載並執行其中一個 Linux 安裝程式。 此頁面也提供 snapflatpak 安裝選項。
  • macOS:使用 Homebrew 執行 brew install --cask dbeaver-community,或使用 MacPorts 執行 sudo port install dbeaver-community。 macOS 安裝程式也可從 DBeaver 網站上的 [下載] 頁面取得。
  • Windows:使用 Chocolatey 執行 choco install dbeaver。 Windows 安裝程式也可從 DBeaver 網站上的 [下載] 頁面取得。

步驟 2:設定 Azure Databricks JDBC Driver for DBeaver

使用您稍早下載的 Databricks JDBC 驅動程式資訊來設置 DBeaver。

  1. 啟動 DBeaver。
  2. 如果系統提示您建立新的資料庫,請點擊
  3. 如果系統提示您連線或選取資料庫,請按下 [取消]
  4. 點選 資料庫 > 驅動程式管理員
  5. 在 [驅動程式管理員] 對話框中,按一下 [新增]。
  6. 在 [建立新的驅動程式] 對話框中,按 [資源庫] 索引標籤。
  7. 點擊 [新增檔案]。
  8. 流覽至您擷取 Azure Databricks JDBC Driver 的資料夾。
  9. 流覽較低層級以尋找 .jar 檔案。
  10. 選取 .jar 檔案並按一下 [開啟]。
  11. 在 [設定] 索引標籤上,針對 [驅動程式名稱]輸入 Databricks
  12. 在 [設定] 標籤中,於 [類別名稱] 中輸入 com.databricks.client.jdbc.Driver
  13. 按下 [確定]
  14. 在 [驅動程式管理員] 對話框中,按兩下 [關閉

步驟 3:將 DBeaver 連線到 Azure Databricks 資料庫

使用 DBeaver 連線到叢集或 SQL 倉儲,以存取 Azure Databricks 工作區中的資料庫。

  1. 在 DBeaver 中,按兩下 [資料庫] > [新增資料庫連線]

  2. 在 [連接到資料庫] 對話框中,在 [所有] 索引標籤上,按一下 [Databricks],然後按一下 [下一步]。

  3. 單擊 [Main] 索引卷標,然後在 Azure Databricks 資源的 [JDBC URL] 字段中輸入值。 如需 JDBC URL 字段語法,請參閱 Databricks JDBC Driver驗證設定。

  4. 點選測試連線

    提示

    測試連線之前,您應該先啟動 Azure Databricks 資源。 否則,在資源啟動時,測試可能需要幾分鐘的時間才能完成。

  5. 如果連線成功,請在 [連線測試] 對話框中,按兩下 [確定] [確定]

  6. 在 [連接到資料庫] 對話框中,按一下 [完成]

在 [資料庫導覽器] 視窗中,會顯示 Databricks 項目。 若要變更連線的名稱,使其更容易識別:

  1. 以滑鼠右鍵按一下 Databricks,然後點擊 編輯連線
  2. 在 [聯機組態] 對話框中,按一下 [一般]。
  3. 針對 連線名稱,將 Databricks 替換為其他名稱。
  4. 按下 [確定]

針對您想要 DBeaver 存取的每個資源,重複此步驟中的指示。

步驟 4:使用 DBeaver 瀏覽數據物件

使用 DBeaver 存取 Azure Databricks 工作區中的數據物件,例如數據表和數據表屬性、檢視表、索引、數據類型和其他數據物件類型。

  1. 在 DBeaver 中,在 [資料庫導覽器] 視窗中,以滑鼠右鍵按下您想要使用的連線。

  2. 如果已啟用 Connect,請按兩下它。 (如果 Connect 已停用,表示您已連線。

    提示

    您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。

  3. 展開您剛才建立的連線。

  4. 展開並流覽可用的數據物件。 按兩下資料物件以取得其詳細資訊。

重複此步驟中的指示以存取其他數據物件。

步驟 5:使用 DBeaver 執行 SQL 語句

使用 DBeaver 從 trips 目錄的 samples 架構載入範例 nyctaxi 數據表。

  1. 在 DBeaver 中,在 [資料庫導覽器] 視窗中,以滑鼠右鍵按下您想要使用的連線。

  2. 如果已啟用 Connect,請按兩下它。 (如果 Connect 已停用,表示您已連線。

    提示

    您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。

  3. 點選 [SQL 編輯器] > [新增 SQL 腳本]

  4. 在 [(connection-name) Script-1 索引標籤上,輸入下列 SQL 語句:

    SELECT * FROM samples.nyctaxi.trips;
    
  5. 點選 [SQL 編輯器] > [執行 SQL 文稿]

後續步驟

其他資源