Mengonfigurasi pemeringkat semantik dan mengembalikan keterangan dalam hasil pencarian
Peringkat semantik berulang selama kumpulan hasil awal, menerapkan metodologi peringkat L2 yang mempromosikan hasil yang paling relevan secara semantik ke bagian atas tumpukan. Anda juga bisa mendapatkan keterangan semantik, dengan sorotan atas istilah dan frasa yang paling relevan, dan jawaban semantik.
Artikel ini menjelaskan cara mengonfigurasi indeks pencarian untuk reranking semantik.
Catatan
Jika Anda memiliki kode yang sudah ada yang memanggil pratinjau atau versi API sebelumnya, lihat Memigrasikan kode peringkat semantik untuk bantuan dalam memodifikasi kode Anda.
Prasyarat
Layanan pencarian pada tingkat Dasar atau yang lebih tinggi, tergantung pada ketersediaan wilayah.
Peringkat semantik diaktifkan pada layanan pencarian Anda.
Indeks pencarian yang sudah ada dengan konten teks kaya. Peringkat semantik berlaku untuk bidang string (nonvector) dan berfungsi paling baik pada konten yang bersifat informasi atau deskriptif.
Memilih klien
Anda dapat menentukan konfigurasi semantik pada indeks baru atau yang sudah ada, menggunakan salah satu alat dan kit pengembangan perangkat lunak (SDK) berikut untuk menambahkan konfigurasi semantik:
- portal Azure, menggunakan perancang indeks untuk menambahkan konfigurasi semantik.
- Visual Studio Code dengan klien REST dan API Buat atau Perbarui Indeks (REST).
- Azure SDK untuk .Net
- Azure SDK untuk Python
- Azure SDK untuk Java
- Azure SDK untuk JavaScript
Menambahkan konfigurasi semantik
Konfigurasi semantik adalah bagian dalam indeks Anda yang menetapkan input bidang untuk peringkat semantik. Anda dapat menambahkan atau memperbarui konfigurasi semantik kapan saja, tidak perlu membangun kembali. Jika Membuat beberapa konfigurasi, Anda dapat menentukan default. Pada waktu kueri, tentukan konfigurasi semantik pada permintaan kueri, atau biarkan kosong untuk menggunakan default.
Konfigurasi semantik memiliki nama dan properti berikut:
Properti | Karakteristik |
---|---|
Bidang judul | String pendek, idealnya di bawah 25 kata. Bidang ini bisa berupa judul dokumen, nama produk, atau pengidentifikasi unik. Jika Anda tidak memiliki bidang yang sesuai, biarkan bidang kosong. |
Bidang konten | Potongan teks yang lebih panjang dalam bentuk bahasa alami, tunduk pada batas input token maksimum pada model pembelajaran mesin. Contoh umum termasuk isi dokumen, deskripsi produk, atau teks bentuk bebas lainnya. |
Bidang kata kunci | Daftar kata kunci, seperti tag pada dokumen, atau istilah deskriptif, seperti kategori item. |
Anda hanya bisa menentukan satu bidang judul, tetapi Anda bisa memiliki bidang konten dan kata kunci sebanyak yang Anda inginkan. Untuk bidang konten dan kata kunci, cantumkan bidang dalam urutan prioritas karena bidang prioritas yang lebih rendah mungkin terpotong.
Di semua properti konfigurasi semantik, bidang yang Anda tetapkan harus:
- Diatribusikan sebagai
searchable
danretrievable
- String jenis
Edm.String
,Collection(Edm.String)
, subbidang string dariEdm.ComplexType
Masuk ke portal Azure dan navigasikan ke layanan pencarian yang mengaktifkan peringkat semantik.
Dari Indeks di panel navigasi kiri, pilih indeks.
Pilih Konfigurasi semantik lalu pilih Tambahkan konfigurasi semantik.
Pada halaman Konfigurasi semantik baru, masukkan nama konfigurasi semantik dan pilih bidang yang akan digunakan dalam konfigurasi semantik. Hanya bidang string yang dapat dicari dan dapat diambil yang memenuhi syarat. Pastikan untuk mencantumkan bidang konten dan bidang kata kunci dalam urutan prioritas.
Pilih Simpan untuk menyimpan pengaturan konfigurasi.
Pilih Simpan lagi di halaman indeks untuk menyimpan konfigurasi semantik dalam indeks.
Langkah berikutnya
Uji konfigurasi semantik Anda dengan menjalankan kueri semantik.