Bagikan melalui


Mengonfigurasi pemeringkat semantik dan mengembalikan keterangan dalam hasil pencarian

Peringkat semantik berulang selama kumpulan hasil awal, menerapkan metodologi peringkat L2 yang mempromosikan hasil yang paling relevan secara semantik ke bagian atas tumpukan. Anda juga bisa mendapatkan keterangan semantik, dengan sorotan atas istilah dan frasa yang paling relevan, dan jawaban semantik.

Artikel ini menjelaskan cara mengonfigurasi indeks pencarian untuk reranking semantik.

Catatan

Jika Anda memiliki kode yang sudah ada yang memanggil pratinjau atau versi API sebelumnya, lihat Memigrasikan kode peringkat semantik untuk bantuan dalam memodifikasi kode Anda.

Prasyarat

  • Layanan pencarian pada tingkat Dasar atau yang lebih tinggi, tergantung pada ketersediaan wilayah.

  • Peringkat semantik diaktifkan pada layanan pencarian Anda.

  • Indeks pencarian yang sudah ada dengan konten teks kaya. Peringkat semantik berlaku untuk bidang string (nonvector) dan berfungsi paling baik pada konten yang bersifat informasi atau deskriptif.

Memilih klien

Anda dapat menentukan konfigurasi semantik pada indeks baru atau yang sudah ada, menggunakan salah satu alat dan kit pengembangan perangkat lunak (SDK) berikut untuk menambahkan konfigurasi semantik:

Menambahkan konfigurasi semantik

Konfigurasi semantik adalah bagian dalam indeks Anda yang menetapkan input bidang untuk peringkat semantik. Anda dapat menambahkan atau memperbarui konfigurasi semantik kapan saja, tidak perlu membangun kembali. Jika Membuat beberapa konfigurasi, Anda dapat menentukan default. Pada waktu kueri, tentukan konfigurasi semantik pada permintaan kueri, atau biarkan kosong untuk menggunakan default.

Konfigurasi semantik memiliki nama dan properti berikut:

Properti Karakteristik
Bidang judul String pendek, idealnya di bawah 25 kata. Bidang ini bisa berupa judul dokumen, nama produk, atau pengidentifikasi unik. Jika Anda tidak memiliki bidang yang sesuai, biarkan bidang kosong.
Bidang konten Potongan teks yang lebih panjang dalam bentuk bahasa alami, tunduk pada batas input token maksimum pada model pembelajaran mesin. Contoh umum termasuk isi dokumen, deskripsi produk, atau teks bentuk bebas lainnya.
Bidang kata kunci Daftar kata kunci, seperti tag pada dokumen, atau istilah deskriptif, seperti kategori item.

Anda hanya bisa menentukan satu bidang judul, tetapi Anda bisa memiliki bidang konten dan kata kunci sebanyak yang Anda inginkan. Untuk bidang konten dan kata kunci, cantumkan bidang dalam urutan prioritas karena bidang prioritas yang lebih rendah mungkin terpotong.

Di semua properti konfigurasi semantik, bidang yang Anda tetapkan harus:

  • Diatribusikan sebagai searchable dan retrievable
  • String jenis Edm.String, Collection(Edm.String), subbidang string dari Edm.ComplexType
  1. Masuk ke portal Azure dan navigasikan ke layanan pencarian yang mengaktifkan peringkat semantik.

  2. Dari Indeks di panel navigasi kiri, pilih indeks.

  3. Pilih Konfigurasi semantik lalu pilih Tambahkan konfigurasi semantik.

    Cuplikan layar yang memperlihatkan opsi untuk menambahkan konfigurasi semantik di portal Azure.

  4. Pada halaman Konfigurasi semantik baru, masukkan nama konfigurasi semantik dan pilih bidang yang akan digunakan dalam konfigurasi semantik. Hanya bidang string yang dapat dicari dan dapat diambil yang memenuhi syarat. Pastikan untuk mencantumkan bidang konten dan bidang kata kunci dalam urutan prioritas.

    Cuplikan layar yang memperlihatkan cara membuat konfigurasi semantik di portal Azure.

  5. Pilih Simpan untuk menyimpan pengaturan konfigurasi.

  6. Pilih Simpan lagi di halaman indeks untuk menyimpan konfigurasi semantik dalam indeks.

Langkah berikutnya

Uji konfigurasi semantik Anda dengan menjalankan kueri semantik.