Menemukan data
Azure Databricks menyediakan serangkaian alat dan produk yang menyederhanakan penemuan aset data yang dapat diakses melalui Databricks Data Intelligence Platform. Artikel ini memberikan gambaran umum berpendapat tentang bagaimana Anda dapat menemukan dan mempratinjau data yang telah dikonfigurasi untuk akses di ruang kerja Anda.
- Untuk menyambungkan ke sumber data, lihat Menyambungkan ke sumber data.
- Untuk informasi tentang mendapatkan akses ke data di Databricks Marketplace, lihat Apa itu Databricks Marketplace?.
Topik di bagian ini berfokus pada eksplorasi objek data dan file data. Jika Anda mencari informasi tentang bekerja dengan aset seperti notebook, kueri SQL, pustaka, dan model, lihat Menavigasi ruang kerja.
Jika Anda mencari panduan tentang menghasilkan statistik ringkasan untuk himpunan data atau tugas lain yang terkait dengan analisis data eksploratif (EDA), lihat Analisis data eksploratif di Azure Databricks: Alat dan teknik.
Bagaimana Anda dapat menemukan aset data?
Alat penemuan data di Azure Databricks termasuk dalam kategori umum berikut:
- Wawasan, ringkasan, dan pencarian yang dibantu AI.
- Pencarian kata kunci.
- Eksplorasi Catalog menggunakan UI.
- Daftar terprogram dan eksplorasi metadata.
Alat penemuan data dioptimalkan untuk data yang diatur oleh Unity Catalog. Aset data yang belum terdaftar sebagai objek Unity Catalog mungkin tidak dapat ditemukan menggunakan beberapa pendekatan ini.
Menemukan data menggunakan UI
Catalog Explorer menyediakan alat untuk menjelajahi dan mengatur aset data. Anda mengakses Catalog Explorer menggunakan ikon Catalog di bilah sisi ruang kerja. Lihat Apa itu Catalog Explorer?.
Notebook dan editor kueri SQL juga menyediakan navigator catalog untuk menjelajahi objek database. Klik ikon Catalog di antarmuka ini untuk memperluas atau menciutkan navigator catalog tanpa keluar dari editor kode Anda.
Setelah menemukan himpunan data yang menarik, Anda dapat menggunakan tab Insights untuk mempelajari bagaimana data digunakan di ruang kerja Anda. Lihat Menampilkan kueri dan pengguna tableyang sering.
Menjelajahi data secara terprogram
Anda dapat menggunakan perintah SHOW
pada semua objek database untuk menemukan aset yang terdaftar di Unity Catalog. Gunakan perintah LIST
, perintah magic %fs
, atau Utilitas Databricks untuk list file.
Lihat Menjelajahi penyimpanan dan menemukan file data dan Menjelajahi objek database.
Meninjau komentar data
Anda dapat meninjau komentar untuk mempelajari tentang konten himpunan data yang tersedia di lakehouse Anda. Komentar dapat set pada objek data termasuk catalogs, skema, tables, dan columns. Anda dapat melihat komentar di Catalog Explorer atau menggunakan perintah DESCRIBE
untuk objek.
Catalog Explorer dapat memberikan komentar yang dihasilkan AI untuk tables, yang memudahkan pemilik aset data untuk memberikan gambaran umum himpunan data yang kaya. Lihat Tambahkan komentar yang dihasilkan oleh AI ke dalam objek Unity Catalog.
Pengguna juga dapat secara opsional memberikan komentar tentang tables dan objek database lainnya menggunakan markdown, yang dirender di Catalog Explorer. Lihat Menambahkan komentar ke data dan aset AI.
Cari tables di lakehouse Anda
Anda dapat menggunakan bilah pencarian di Azure Databricks untuk menemukan tables terdaftar di Unity Catalog. Anda dapat melakukan pencarian kata kunci atau menggunakan pencarian semantik untuk menemukan himpunan data atau columns yang terkait dengan kueri pencarian Anda. Pencarian hanya mengembalikan hasil untuk tables yang Anda memiliki izin untuk melihat. Cari ulasan table nama, column nama, table komentar, dan column komentar. Lihat Mencari objek ruang kerja.