Apa itu ruang AI/BI Genie
Artikel ini memperkenalkan AI/BI Genie, fitur Azure Databricks yang memungkinkan tim bisnis berinteraksi dengan data mereka menggunakan bahasa alami. Ini menggunakan AI generatif yang disesuaikan dengan terminologi dan data organisasi Anda, dengan kemampuan untuk memantau dan menyempurnakan performanya melalui umpan balik pengguna.
Gambaran Umum
Pakar domain, seperti analis data, mengonfigurasi ruang Genie dengan himpunan data, kueri sampel, dan panduan teks untuk membantu Genie menerjemahkan pertanyaan bisnis ke dalam kueri analitik. Setelah disiapkan, pengguna bisnis dapat mengajukan pertanyaan dan menghasilkan visualisasi untuk memahami data operasional. Anda dapat terus memperbarui pengetahuan semantik Genie saat data Anda berubah dan pengguna menimbulkan pertanyaan baru. Untuk informasi tambahan tentang DatabricksIQ, lihat Fitur yang didukung DatabricksIQ.
AI/BI Genie memilih nama dan deskripsi yang relevan dari tabel dan kolom yang diannotasi untuk mengonversi pertanyaan bahasa alami ke kueri SQL yang setara. Kemudian, ia merespons dengan kueri yang dihasilkan dan tabel hasil, jika memungkinkan. Jika Genie tidak dapat menghasilkan jawaban, Genie dapat mengajukan pertanyaan tindak lanjut untuk mengklarifikasi sebelum memberikan respons.
Contoh kasus penggunaan
Anda dapat membuat ruang Genie yang berbeda untuk melayani berbagai audiens non-teknis. Skenario berikut menjelaskan dua kemungkinan kasus penggunaan.
Contoh 1: Memvisualisasikan status peluang
Manajer penjualan ingin mendapatkan status peluang terbuka dan tertutup saat ini berdasarkan tahap dalam alur penjualan mereka. Mereka dapat berinteraksi dengan ruang Genie menggunakan bahasa alami dan secara otomatis menghasilkan visualisasi.
Gif berikut menunjukkan interaksi ini:
Contoh 2: Melacak logistik
Perusahaan logistik ingin menggunakan ruang Genie untuk membantu pengguna bisnis dari berbagai departemen melacak detail operasional dan keuangan. Mereka menyiapkan ruang Genie bagi manajer fasilitas pengiriman mereka untuk melacak pengiriman dan satu lagi bagi eksekutif keuangan mereka untuk memahami kesehatan keuangan mereka.
Bagaimana Genie menghasilkan respons
Genie menggunakan sistem AI majemuk
Saat pengguna mengirimkan pertanyaan, Genie mengurai permintaan, mengidentifikasi sumber data yang relevan, dan menentukan cara merespons permintaan. Instruksi yang Anda berikan, dikombinasikan dengan metadata Unity Catalog, memungkinkan Genie menyimpulkan logika bisnis dan teknis. Genie dengan cerdas memfilter contoh kueri SQL, metadata tabel dan kolom, dan riwayat obrolan untuk memilih informasi yang paling relevan untuk menjawab permintaan.
Genie menggunakan komponen berikut untuk menghasilkan respons:
- metadata tabel
: Mencakup nama tabel, deskripsi, dan hubungan kunci primer (PK) dan kunci asing (FK) yang ditentukan. Genie menggunakan data ini saat mengurai permintaan dan mengonversi permintaan bahasa alami ke SQL. - Nama dan deskripsi kolom: Genie dengan cerdas memfilter nama dan deskripsi kolom yang relevan untuk disertakan.
Contoh kueri SQL : Genie dengan cerdas memilih contoh SQL yang relevan dariInstruksi. - fungsi SQL: Semua fungsi SQL yang telah ditambahkan di dalam ruang.
- Instruksi: Catatan teks biasa yang disediakan sebagai instruksi umum disertakan sebagai konteks.
- Riwayat pemicu dan respons: Pemicu dan respons dari obrolan saat ini dijadikan konteks. Jika perlu, karena adanya batas token , bagian terlama dari rekaman obrolan dihilangkan.
Catatan
Beberapa detail tabel, seperti pemilik dan ukuran tabel, tidak disertakan secara default. Untuk mengakses informasi ini, gunakan tampilan dari skema informasi yang tersedia untuk semua katalog Katalog Unity. Tampilan default mungkin menyertakan detail yang tidak perlu, jadi membuat tampilan kustom di atasnya dapat membantu fokus pada informasi tertentu yang Anda butuhkan. Untuk informasi selengkapnya tentang apa yang tersedia dalam skema informasi, lihat skema informasi .
Jika Genie mengembalikan kueri sebagai hasilnya, kueri berjalan pada gudang SQL yang ditunjuk. Percobaan ulang ditangani secara otomatis, dan gudang SQL menangani konkurensi dan skala.
Data apa yang harus saya gunakan?
Ruang Genie didasarkan pada data yang terdaftar ke Unity Catalog, termasuk tabel terkelola, tabel eksternal, tabel asing, tampilan, dan tampilan materialisasi. AI/BI Genie menggunakan metadata yang dilampirkan ke objek Unity Catalog untuk menghasilkan respons. Himpunan data yang dianotasi dengan baik, dipasangkan dengan instruksi spesifik yang Anda berikan, adalah kunci untuk menciptakan pengalaman positif bagi pengguna akhir.
Databricks merekomendasikan hal berikut:
- Mengumpulkan data untuk konsumsi analitis: Tampilan lapisan untuk mengurangi jumlah kolom dan menambahkan informasi khusus kasus penggunaan untuk meningkatkan kualitas respons.
- Meminimalkan jumlah tabel dan kolom dalam ruang Genie: Sertakan hanya tabel dan kolom yang diperlukan untuk menjawab pertanyaan untuk domain tertentu. Tabel atau kolom yang tidak perlu dapat menyebabkan Genie memberikan jawaban yang membingungkan atau salah atau menampilkan pesan kesalahan.
- Menentukan hubungan kunci primer (PK)/kunci asing (FK): Gunakan Katalog Unity untuk menentukan hubungan PK/FK sehingga Genie memahami bagaimana data Anda terhubung.
Unggahan file
Penting
Fitur ini ada di Pratinjau Publik.
Pengguna juga dapat mengunggah file data kecil mereka sendiri ke ruang Genie. Untuk mengaktifkan unggahan file, hubungi tim akun Databricks Anda. Untuk informasi selengkapnya, lihat Mengunggah file.
Aset tepercaya
Aset tepercaya menyampaikan lapisan jaminan tambahan dalam akurasi hasil kepada pengguna ruang. Ketika teks yang tepat dari kueri contoh parameter atau fungsi SQL digunakan untuk menghasilkan respons, Genie menandai respons sebagai aset tepercaya . Lihat Menggunakan aset tepercaya di ruang AI/BI Genie.
Utasan Percakapan
Sebagian besar interaksi ruang Genie terjadi di jendela obrolan. Utas obrolan menyimpan rekaman interaksi untuk setiap pengguna. Setiap utas obrolan mempertahankan konteks tentang pertanyaan sebelumnya yang telah diajukannya. Genie menggunakan konteks dalam riwayat obrolan berulir untuk belajar saat pengguna mengajukan pertanyaan tindak lanjut untuk menjelajahi lebih lanjut atau memfokuskan kembali kumpulan hasil.
Pengguna dengan setidaknya akses CAN VIEW ke ruang dapat melihat riwayat obrolan mereka sendiri. Pengguna dengan izin DAPAT MENGEDIT setidaknya dapat meninjau semua pertanyaan dan jawaban di tab Riwayat ruang.
Meninjau respons
Sebagian besar respons mencakup penjelasan bahasa alami dan tabel yang menunjukkan tataan hasil yang relevan. Tabel sumber muncul di bawah penjelasan, dan kueri SQL yang digunakan untuk menghasilkan hasil tersedia dalam detail respons. Ketika visualisasi akan meningkatkan kejelasan, Genie menyertakan visualisasi tersebut. Struktur setiap respons tergantung pada pertanyaan.
Pengguna ruang dan penulis dapat meninjau respons atas pertanyaan mereka. Mereka dapat menilai setiap respons dengan jempol ke atas atau jempol ke bawah atau meminta agar respons ditinjau. Editor dan penulis di ruang Genie dapat meninjau umpan balik ini menggunakan tab Riwayat.
Mengevaluasi respons dengan tolok ukur
Tolok ukur memungkinkan Anda meningkatkan pengujian dan evaluasi respons individu di ruang Genie. Berbeda dari instruksi, tolok ukur dirancang untuk mengevaluasi, bukan menginformasikan, ruang Genie Anda. Genie tidak menggunakan pertanyaan tolok ukur atau contoh SQL untuk meningkatkan konteks Genie.
Dengan menggunakan tolok ukur, Anda dapat menjalankan kumpulan pertanyaan pengujian dan menggunakan respons untuk mengukur akurasi Genie. Secara opsional, Anda dapat menyertakan pernyataan SQL yang mengembalikan hasil yang diharapkan. Ketika pertanyaan tolok ukur berjalan, respons Genie dibandingkan dengan hasil yang disediakan oleh pernyataan SQL dan dinilai untuk akurasi. Pertanyaan ditandai untuk ditinjau jika tidak ada jawaban SQL yang disediakan.
Lihat Gunakan tolok ukur di ruang Genie.
Privasi dan keamanan
T: Model apa yang digunakan Genie?
Genie menggunakan model Azure OpenAI.
T: Data apa yang dikirim ke model?
Ruang Genie menghasilkan jawaban untuk pertanyaan dalam bahasa alami menggunakan metadata dan instruksi. Genie tidak memiliki akses ke data tingkat baris.
Untuk memproses respons, Genie menggunakan hal berikut:
- Perintah bahasa alami yang dikirimkan oleh pengguna
- Nama dan deskripsi tabel
- Judul dan deskripsi kolom
- Instruksi umum
- Contoh kueri SQL
- Fungsi SQL
T: Apakah Azure OpenAI mengumpulkan data saya?
Tidak. Databricks telah memilih keluar dari program pengecualian pemantauan penyalahgunaan dan tinjauan manusia, di mana Microsoft tidak menyimpan perintah dan hasil penyelesaian apa pun yang dikirim ke layanan Azure OpenAI. Untuk informasi selengkapnya, lihat dokumentasi Microsoft.