DBeaver 與 Azure Databricks 整合
注意
本文涵蓋第三方開發的 DBeaver。 若要連絡提供者,請參閱 GitHub 上 dbeaver/dbeaver 存放庫的 問題 頁面。
DBeaver 是本機、多平台資料庫工具,適用於開發人員、資料庫管理員、數據分析師、數據工程師,以及其他需要使用資料庫的人員。 DBeaver 支援 Azure Databricks 和其他熱門資料庫。
本文說明如何使用本機開發計算機來安裝、設定及使用免費的開放原始碼 DBeaver Community Edition (CE) 來處理 Azure Databricks 中的資料庫。
注意
本文已使用 macOS、Databricks JDBC Driver 2.6.36 版和 DBeaver CE 23.3.0 版進行測試。
要求
安裝 DBeaver 之前,您的本機開發計算機必須符合下列需求:
- Linux 64 位、macOS 或 Windows 64 位作業系統。 (支援 Linux 32 位,但不建議使用。
-
Databricks JDBC Driver 至您的本地開發環境,並從下載的
DatabricksJDBC42.jar
檔案中解壓縮出DatabricksJDBC42-<version>.zip
檔案。
您也必須有 Azure Databricks 叢集 或 SQL 倉儲,才能與 DBeaver 連線。
步驟 1:安裝 DBeaver
下載並安裝 DBeaver CE,如下所示:
-
Linux:從 DBeaver 網站上的 下載 頁面下載並執行其中一個 Linux 安裝程式。 此頁面也提供
snap
和flatpak
安裝選項。 -
macOS:使用 Homebrew 執行
brew install --cask dbeaver-community
,或使用 MacPorts 執行sudo port install dbeaver-community
。 macOS 安裝程式也可從 DBeaver 網站上的 [下載] 頁面取得。 -
Windows:使用 Chocolatey 執行
choco install dbeaver
。 Windows 安裝程式也可從 DBeaver 網站上的 [下載] 頁面取得。
步驟 2:設定 Azure Databricks JDBC Driver for DBeaver
使用您稍早下載的 Databricks JDBC 驅動程式資訊來設置 DBeaver。
- 啟動 DBeaver。
- 如果系統提示您建立新的資料庫,請點擊 否。
- 如果系統提示您連線或選取資料庫,請按下 [取消]。
- 點選 資料庫 > 驅動程式管理員。
- 在 [驅動程式管理員] 對話框中,按一下 [新增]。
- 在 [建立新的驅動程式] 對話框中,按 [資源庫] 索引標籤。
- 點擊 [新增檔案]。
- 流覽至您擷取 Azure Databricks JDBC Driver 的資料夾。
- 流覽較低層級以尋找
.jar
檔案。 - 選取
.jar
檔案並按一下 [開啟]。 - 在 [設定] 索引標籤上,針對 [驅動程式名稱]輸入
Databricks
。 - 在 [設定] 標籤中,於 [類別名稱] 中輸入
com.databricks.client.jdbc.Driver
。 - 按下 [確定]。
- 在 [驅動程式管理員] 對話框中,按兩下 [關閉。
步驟 3:將 DBeaver 連線到 Azure Databricks 資料庫
使用 DBeaver 連線到叢集或 SQL 倉儲,以存取 Azure Databricks 工作區中的資料庫。
在 DBeaver 中,按兩下 [資料庫] > [新增資料庫連線]。
在 [連接到資料庫] 對話框中,在 [所有] 索引標籤上,按一下 [Databricks],然後按一下 [下一步]。
單擊 [Main] 索引卷標,然後在 Azure Databricks 資源的 [JDBC URL] 字段中輸入值。 如需
JDBC URL 字段語法,請參閱 Databricks JDBC Driver驗證設定。 點選測試連線 。
提示
測試連線之前,您應該先啟動 Azure Databricks 資源。 否則,在資源啟動時,測試可能需要幾分鐘的時間才能完成。
如果連線成功,請在 [連線測試] 對話框中,按兩下 [確定] [確定]。
在 [連接到資料庫] 對話框中,按一下 [完成]。
在 [資料庫導覽器] 視窗中,會顯示 Databricks 項目。 若要變更連線的名稱,使其更容易識別:
- 以滑鼠右鍵按一下 Databricks,然後點擊 編輯連線。
- 在 [聯機組態] 對話框中,按一下 [一般]。
- 針對 連線名稱,將
Databricks
替換為其他名稱。 - 按下 [確定]。
針對您想要 DBeaver 存取的每個資源,重複此步驟中的指示。
步驟 4:使用 DBeaver 瀏覽數據物件
使用 DBeaver 存取 Azure Databricks 工作區中的數據物件,例如數據表和數據表屬性、檢視表、索引、數據類型和其他數據物件類型。
在 DBeaver 中,在 [資料庫導覽器] 視窗中,以滑鼠右鍵按下您想要使用的連線。
如果已啟用 Connect,請按兩下它。 (如果 Connect 已停用,表示您已連線。
提示
您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。
展開您剛才建立的連線。
展開並流覽可用的數據物件。 按兩下資料物件以取得其詳細資訊。
重複此步驟中的指示以存取其他數據物件。
步驟 5:使用 DBeaver 執行 SQL 語句
使用 DBeaver 從 trips
目錄的 samples
架構載入範例 nyctaxi
數據表。
在 DBeaver 中,在 [資料庫導覽器] 視窗中,以滑鼠右鍵按下您想要使用的連線。
如果已啟用 Connect,請按兩下它。 (如果 Connect 已停用,表示您已連線。
提示
您應該先啟動您的資源,再嘗試連線到該資源。 否則,資源啟動時,連線可能需要幾分鐘的時間才能完成。
點選 [SQL 編輯器] > [新增 SQL 腳本]。
在 [(connection-name) Script-1 索引標籤上,輸入下列 SQL 語句:
SELECT * FROM samples.nyctaxi.trips;
點選 [SQL 編輯器] > [執行 SQL 文稿]。
後續步驟
- 使用 Database 物件編輯器 來處理資料庫物件屬性、數據和實體關聯圖表。
- 使用 數據編輯器 來檢視和編輯資料庫數據表或檢視中的數據。
- 使用 SQL 編輯器 來處理 SQL 腳本。
- 使用 DBeaver 中的 實體關聯圖表 (ERDs)。
- 將數據 匯入和從 DBeaver 導出。
- 使用 DBeaver 遷移數據。
- 使用 DBeaver 排除 JDBC 驅動程式問題。