Mengumpulkan ruang Genie yang efektif
Tujuan pengumpulan ruang Genie adalah untuk menciptakan lingkungan di mana pengguna bisnis dapat menimbulkan pertanyaan bahasa alami dan menerima jawaban yang akurat dan konsisten berdasarkan data mereka. Ruang jin menggunakan model canggih yang menghasilkan kueri canggih dan memahami pengetahuan dunia umum.
Sebagian besar pertanyaan bisnis khusus domain, sehingga peran kurator ruang angkasa adalah menjenjang kesenjangan antara pengetahuan dunia umum dan bahasa khusus yang digunakan dalam domain tertentu atau oleh perusahaan tertentu. Kurator menggunakan metadata dan instruksi untuk membantu Genie menafsirkan dan menanggapi pertanyaan pengguna bisnis secara akurat. Artikel ini menguraikan praktik dan prinsip terbaik untuk memandu Anda dalam mengembangkan ruang yang sukses.
Praktik terbaik untuk menentukan ruang baru
Bagian berikut merekomendasikan praktik untuk membuat ruang yang efektif.
Mulai dari yang kecil
Mengumpulkan ruang Genie adalah proses berulang. Saat membuat ruang baru, mulailah sesecil mungkin, dengan instruksi minimal dan serangkaian pertanyaan terbatas untuk dijawab. Kemudian, Anda dapat menambahkan saat melakukan iterasi berdasarkan umpan balik dan pemantauan. Pendekatan ini membantu menyederhanakan pembuatan dan pemeliharaan ruang Anda dan memungkinkan Anda untuk mengumpulkannya secara efektif sebagai respons terhadap kebutuhan pengguna nyata.
Gunakan panduan berikut untuk membantu membuat ruang Genie kecil:
- Tetap fokus: Sertakan hanya tabel yang diperlukan untuk menjawab pertanyaan yang Ingin Anda tangani ruangnya. Bertujuan untuk lima atau lebih sedikit tabel. Semakin fokus pilihan Anda, semakin baik. Menjaga ruang Anda tetap terfokus secara sempit pada sejumlah kecil data sangat ideal, jadi batasi jumlah kolom dalam tabel yang disertakan.
- Rencanakan untuk iterasi: Mulailah dengan pengaturan minimal untuk ruang Anda, berfokus pada tabel penting dan instruksi dasar. Tambahkan panduan dan contoh yang lebih rinci saat Anda menyempurnakan ruang dari waktu ke waktu, daripada membidik kesempurnaan pada awalnya.
- Bangun pada tabel yang dianotasi dengan baik: Genie menggunakan nama kolom dan deskripsi Katalog Unity untuk menghasilkan respons. Menghapus nama dan deskripsi kolom membantu menghasilkan respons berkualitas tinggi. Deskripsi kolom harus menawarkan informasi kontekstual yang tepat. Hindari detail yang ambigu atau tidak perlu. Periksa deskripsi yang dihasilkan AI untuk akurasi dan kejelasan, dan hanya gunakan jika selaras dengan apa yang akan Anda berikan secara manual.
Memiliki pakar domain yang menentukan ruang
Pembuat ruang yang efektif perlu memahami data dan wawasan yang dapat dipancarkan darinya. Analis data yang mahir dalam SQL biasanya memiliki pengetahuan dan keterampilan untuk mengumpulkan ruang.
Tentukan tujuan ruang Anda
Mengidentifikasi audiens dan tujuan khusus ruang Anda membantu Anda memutuskan data, instruksi, dan pertanyaan pengujian mana yang akan digunakan. Ruang harus menjawab pertanyaan untuk topik dan audiens tertentu, bukan pertanyaan umum di berbagai domain.
Menguji dan menyesuaikan
Anda harus menjadi pengguna pertama ruang Anda. Setelah Anda membuat ruang baru, mulai ajukan pertanyaan. Periksa dengan cermat SQL yang dihasilkan sebagai respons atas pertanyaan Anda. Jika Genie salah menafsirkan data, pertanyaan, atau jargon bisnis, Anda dapat melakukan intervensi dengan mengedit SQL yang dihasilkan atau memberikan instruksi spesifik lainnya. Terus uji dan edit hingga Anda mendapatkan respons yang andal.
Setelah meninjau pertanyaan, Anda dapat menambahkannya sebagai pertanyaan tolok ukur yang dapat Anda gunakan untuk menguji dan menilai ruang Anda secara sistematis untuk akurasi keseluruhan. Anda dapat menggunakan variasi dan frasa pertanyaan yang berbeda untuk menguji respons Genie. Lihat Menggunakan tolok ukur di ruang Genie.
Lihat Pemecahan masalah untuk ide-ide tentang memperbaiki respons yang salah.
Melakukan pengujian pengguna
Setelah memverifikasi kualitas respons melalui pengujian, rekrut pengguna bisnis untuk mencoba ruang Genie. Gunakan panduan berikut untuk memberikan perjalanan pengguna yang lancar dan mengumpulkan umpan balik untuk peningkatan yang sedang berlangsung:
- Tetapkan harapan bahwa pekerjaan mereka adalah membantu memperbaiki ruangan.
- Minta mereka untuk memfokuskan pengujian mereka pada topik tertentu dan pertanyaan ruang dirancang untuk dijawab.
- Jika mereka menerima respons yang salah, dorong pengguna untuk menambahkan instruksi dan klarifikasi tambahan dalam obrolan untuk memperbaiki jawabannya. Ketika respons yang benar disediakan, mereka harus meningkatkan kueri akhir untuk meminimalkan kesalahan serupa dalam interaksi di masa mendatang.
- Beri tahu pengguna untuk meningkatkan atau menurunkan respons menggunakan mekanisme umpan balik bawaan.
- Undang pengguna untuk berbagi umpan balik tambahan dan pertanyaan yang belum terselesaikan langsung dengan penulis ruang. Penulis dan editor dapat menggunakan umpan balik untuk menyempurnakan instruksi, contoh, dan aset tepercaya.
Pertimbangkan untuk memberikan materi pelatihan atau dokumen tertulis dengan pedoman untuk menguji ruangan dan memberikan umpan balik. Saat pengguna bisnis menguji ruang, Anda akan melihat pertanyaan yang telah mereka ajukan di tab Riwayat . Lanjutkan menambahkan instruksi untuk membantu Genie menginterpretasikan pertanyaan dan data dengan benar untuk memberikan jawaban yang akurat. Lihat Meninjau riwayat dan umpan balik untuk mempelajari selengkapnya tentang cara memantau ruang Genie.
Catatan
Pengguna bisnis harus menjadi anggota ruang kerja asal untuk mengakses ruang Anda. Lihat Izin yang diperlukan untuk mempelajari cara memberikan izin yang sesuai untuk berinteraksi dengan ruang.
Pemecahan Masalah
Bagian berikut menguraikan cara mengatasi masalah umum.
Jargon bisnis yang disalahpahami
Sebagian besar perusahaan atau domain memiliki singkatan khusus yang mereka gunakan untuk berkomunikasi tentang peristiwa khusus bisnis. Misalnya, jika mengacu pada satu tahun, itu mungkin selalu berarti tahun fiskal, dan tahun fiskal ini mungkin dimulai pada bulan Februari atau Maret alih-alih Januari. Untuk memungkinkan Genie menjawab pertanyaan-pertanyaan ini secara alami dan akurat, sertakan instruksi yang secara eksplisit memetakan jargon bisnis Anda ke kata-kata dan konsep yang dapat dipahami Genie. Lihat Memberikan instruksi.
Penggunaan tabel atau kolom yang salah
Jika Genie mencoba menarik data dari tabel yang salah atau menjalankan analisis pada kolom yang salah, Anda mungkin menyesuaikan data dengan salah satu cara berikut:
- Berikan deskripsi yang jelas dan tepat: Periksa tabel dan metadata terkait Anda untuk memeriksa apakah terminologi yang digunakan di sana cocok dengan terminologi pengguna dalam pertanyaan yang dikirimkan. Jika tidak, pertampangkan deskripsi atau tambahkan instruksi yang memetakan terminologi yang digunakan dalam tabel ke terminologi yang digunakan dalam pertanyaan.
- Menambahkan contoh kueri: Berikan sampel kueri SQL yang dapat digunakan Genie untuk mempelajari cara menanggapi pertanyaan tertentu. Lihat Memberikan instruksi.
- Menghapus tabel atau kolom dari spasi: Beberapa tabel mungkin menyertakan kolom atau konsep yang tumpang tindih yang menyulitkan Genie untuk mengetahui data mana yang akan digunakan dalam respons. Jika memungkinkan, hapus tabel atau kolom yang tidak perlu atau tumpang tindih. Anda mungkin ingin membuat tampilan yang hanya menyertakan kolom yang diperlukan.
Kesalahan pemfilteran
Kueri yang WHERE
dihasilkan sering menyertakan klausul untuk memfilter hasil sesuai dengan nilai tertentu. Karena Genie tidak memiliki visibilitas ke dalam data aktual, Genie mungkin mengatur WHERE
klausul untuk memfilter nilai yang salah. Misalnya, mungkin mencoba mencocokkan nama "California" ketika tabel menggunakan singkatan seperti "CA."
Untuk situasi seperti ini, cobalah salah satu strategi berikut:
- Jika kumpulan nilai kolom cukup kecil, hitung string yang valid untuk setiap deskripsi kolom. Letakkan tanda kutip di sekitar nilai string, terutama jika mereka memiliki spasi atau angka. Terkadang, untuk enumerasi umum, cukup untuk mengatakan, "Gunakan kode ISO negara tiga huruf" alih-alih mencantumkan setiap nilai status.
Gabungan yang salah
Jika referensi kunci asing tidak ditentukan dalam Katalog Unity Anda, ruang Anda mungkin tidak tahu bagaimana tabel yang berbeda harus digabungkan bersama-sama.
Coba terapkan satu atau beberapa solusi berikut:
- Tentukan referensi kunci asing di Katalog Unity Anda jika memungkinkan. Lihat klausa CONSTRAINT.
- Berikan contoh kueri tempat Anda menggabungkan tabel bersama-sama dengan cara standar.
- Jika hubungan kunci asing tabel Anda tidak ditentukan dalam Katalog Unity Anda, dokumentasikan dalam instruksi.
Jika tidak ada yang menyelesaikan masalah, pra-gabungkan tabel ke dalam tampilan dan gunakan sebagai input untuk spasi sebagai gantinya. Strategi ini sangat membantu untuk skenario gabungan yang lebih kompleks seperti gabungan mandiri.
Masalah perhitungan metrik
Cara metrik dihitung dan digulung dapat secara semena-mena rumit dan mencakup banyak detail bisnis yang tidak dipahami ruang Anda. Hal ini dapat menyebabkan pelaporan yang salah.
Coba terapkan satu atau beberapa solusi berikut:
- Jika metrik Anda dikumpulkan dari tabel dasar, berikan contoh kueri SQL yang menghitung setiap nilai roll-up.
- Jika metrik Anda telah dihitung sebelumnya dan berada dalam tabel agregat, jelaskan ini dalam komentar tabel. Tentukan agregasi yang valid untuk setiap metrik jika metrik dalam tabel tersebut dapat digulung lebih lanjut.
- Jika SQL yang Anda coba hasilkan sangat rumit, coba buat tampilan yang telah mengagregasi metrik Anda untuk ruang Anda.
Perhitungan berbasis waktu yang salah
Genie mungkin tidak selalu dapat menyimpulkan zona waktu yang diwakili dalam data atau zona waktu di mana analisis Anda perlu dilakukan kecuali Anda secara eksplisit memberikan panduan tambahan.
Sertakan instruksi yang lebih eksplisit yang merinci zona waktu sumber asli, fungsi konversi, dan zona waktu target. Contoh berikut menunjukkan cara mengubah instruksi umum untuk konversi zona waktu yang lebih andal:
-
Selalu konversi waktu ke zona waktu tertentu: Dalam contoh ini, asumsikan bahwa tanda waktu sumber
UTC
dan Anda ingin menghasilkan zona waktuAmerica/Los_Angeles
. Tambahkan yang berikut ini ke instruksi mengganti<timezone-column>
dengan nama kolom yang sesuai:- Zona waktu dalam tabel berada di
UTC
. - Konversi semua zona waktu menggunakan fungsi berikut:
convert_timezone('UTC', 'America/Los_Angeles', <timezone-column>)
.
- Zona waktu dalam tabel berada di
-
Mengonversi format tanggalwaktu non-UTC ke UTC: Jika zona waktu default ruang kerja
UTC
tetapi pengguna di Los Angeles perlu merujuk pada hari ini untuk serangkaian catatan tertentu, tambahkan yang berikut ini ke pedoman umum ruang:- Untuk mereferensikan hari ini, gunakan 'date(convert_timezone('UTC', 'America/Los_Angeles', current_timestamp()))
Lihat fungsi convert_timezone untuk detail dan sintaks lebih lengkap.
Mengabaikan instruksi
Bahkan jika Anda telah menjelaskan tabel dan kolom Anda dalam komentar dan memberikan instruksi umum, ruang Anda mungkin masih tidak menggunakannya dengan benar.
Cobalah satu atau beberapa strategi berikut:
- Berikan contoh kueri yang menggunakan tabel Anda dengan benar. Contoh kueri sangat efektif untuk mengajarkan ruang Anda cara menggunakan data Anda.
- Buat tampilan dari tabel Anda yang menyediakan tampilan data Anda yang lebih disederhanakan.
- Tinjau instruksi Anda dan coba fokuskan ruang dengan menghapus tabel atau instruksi yang tidak relevan.
- Coba mulai obrolan baru. Interaksi sebelumnya mungkin memengaruhi respons Genie dalam obrolan tertentu, tetapi memulai obrolan baru memberi Anda titik awal kosong untuk menguji instruksi baru.
Masalah performa
Ketika Genie perlu menghasilkan kueri atau respons teks yang sangat panjang, diperlukan waktu lama untuk merespons atau bahkan kehabisan waktu selama fase berpikir.
Coba satu atau beberapa tindakan berikut untuk meningkatkan performa:
- Gunakan aset atau tampilan tepercaya untuk merangkum kueri kompleks. Lihat Menggunakan aset tepercaya di ruang AI/BI Genie.
- Kurangi panjang contoh kueri SQL Anda jika memungkinkan.
- Mulai obrolan baru jika Genie mulai menghasilkan respons yang lambat atau gagal.
Respons yang tidak dapat diandalkan terhadap pertanyaan misi-kritis
Gunakan aset tepercaya untuk memberikan jawaban terverifikasi atas pertanyaan tertentu yang Anda harapkan untuk diajukan pengguna. Lihat Menggunakan aset tepercaya di ruang AI/BI Genie.
Peringatan batas token
Token adalah unit dasar teks yang digunakan Genie untuk memproses dan memahami bahasa. Teks yang disertakan sebagai instruksi atau metadata dalam ruang Genie dikonversi menjadi token. Jika jumlah token di ruang Anda mendekati batas, produk akan memberi tahu Anda dengan peringatan. Genie menerapkan pemfilteran konteks pintar untuk memilih token yang mewakili metadata dan beberapa jenis instruksi yang disertakan dalam ruang Genie. Bahkan jika Anda melebihi batas, ruang harus terus menghasilkan respons terhadap pertanyaan.
Jika ruang Genie Anda mendekati batas token, Genie mungkin memprioritaskan termasuk hanya bagian skema tabel anda dan instruksi yang paling relevan dengan pertanyaan. Ini dapat mengurangi kualitas respons jika konteks penting difilter. Pertimbangkan praktik berikut untuk mengurangi jumlah token:
- Hapus kolom yang tidak perlu: Kolom yang tidak perlu dalam tabel Anda dapat secara signifikan berkontribusi pada penggunaan token. Buat tampilan untuk mengecualikan bidang yang berlebihan atau tidak penting dari tabel mentah Anda.
-
Menyederhanakan deskripsi kolom: Meskipun deskripsi kolom penting, hindari informasi duplikat yang sudah disampaikan oleh nama kolom. Misalnya, jika kolom diberi nama
account_name
, deskripsi seperti "nama akun Anda" mungkin berlebihan dan dapat dihilangkan. - Menyederhanakan instruksi: Verifikasi bahwa instruksi Anda jelas dan ringkas. Hindari kata-kata yang tidak perlu.
- Memangkas contoh pernyataan SQL: Sertakan berbagai contoh pernyataan SQL untuk mencakup berbagai jenis pertanyaan tetapi hapus contoh yang tumpang tindih atau berlebihan.
Akun Anda tidak diaktifkan untuk pemrosesan lintas Geo
Genie adalah Layanan Tertunjuk yang dikelola oleh Azure Databricks. Layanan yang Ditunjuk menggunakan Databricks Geos untuk mengelola residensi data. Untuk beberapa wilayah, data tidak dapat diproses di Geo yang sama dengan ruang kerja. Jika ruang kerja Anda berada di salah satu wilayah tersebut, pemrosesan lintas Geo harus diaktifkan oleh administrator akun Anda.
Mencapai batas kapasitas pemrosesan
Throughput untuk ruang Genie dibatasi hingga 20 pertanyaan per menit per ruang kerja, berlaku untuk semua ruang Genie.