Fitur Pencarian Azure AI
Azure AI Search menyediakan pengambilan informasi dan menggunakan integrasi AI opsional untuk mengekstrak lebih banyak nilai dari teks dan konten vektor.
Tabel berikut ini meringkas fitur menurut kategori. Untuk informasi selengkapnya tentang bagaimana Azure AI Search dibandingkan dengan teknologi pencarian lainnya, lihat Membandingkan opsi pencarian.
Ada paritas fitur di semua cloud publik, privat, dan berdaulat Azure, tetapi beberapa fitur tidak didukung di wilayah tertentu. Untuk informasi selengkapnya, lihat Memilih wilayah.
Catatan
Mencari fitur pratinjau? Lihat daftar fitur pratinjau.
Fitur pengindeksan
Golongan | Fitur |
---|---|
Sumber data | Indeks pencarian dapat menerima teks dari sumber apa pun, asalkan dikirimkan sebagai dokumen JSON. Pengindeks adalah fitur yang mengotomatiskan impor data dari sumber data yang didukung untuk mengekstrak konten yang dapat dicari di penyimpanan data primer. Pengindeks menangani serialisasi JSON untuk Anda dan sebagian besar mendukung beberapa bentuk deteksi perubahan dan penghapusan. Anda dapat menyambungkan ke berbagai sumber data, termasuk Penyimpanan OneLake, Azure SQL Database, Azure Cosmos DB, atau Azure Blob. |
Struktur data hierarkis dan berlapis | Jenis kompleks dan koleksi memungkinkan Anda untuk memodelkan hampir semua jenis struktur JSON dalam indeks pencarian. Kardinalitas satu-ke-banyak dan banyak-ke-banyak dapat diekspresikan secara asli melalui koleksi, jenis kompleks, dan koleksi jenis yang kompleks. |
Analisis Linguistik | Penganalisaan adalah komponen yang digunakan untuk pemrosesan teks selama operasi pengindeksan dan pencarian. Secara default, Anda dapat menggunakan penganalisis Standard Lucene tujuan umum, atau mengganti default dengan penganalisis bahasa, penganalisis kustom yang Anda konfigurasi, atau penganalisis lain yang telah ditentukan yang menghasilkan token dalam format yang Anda butuhkan. Penganalisis bahasa dari Lucene atau Microsoft digunakan untuk menangani linguistik khusus bahasa secara cerdas termasuk kata kerja, bentuk kata kerja, jenis kelamin, kata benda jamak yang tidak teratur (misalnya, 'mouse' vs. 'tikus'), penguraian kata, pemecah kata (untuk bahasa tanpa spasi), dan banyak lagi. Pengaalisa leksikal kustom digunakan untuk formulir kueri yang kompleks seperti pencocokan genggam dan ekspresi reguler. |
Pencarian vektor dan hibrid
Golongan | Fitur |
---|---|
Pengindeksan vektor | Dalam indeks pencarian, tambahkan bidang vektor untuk mendukung skenario pencarian vektor. Bidang vektor dapat berdampingan dengan bidang nonvektor dalam dokumen pencarian yang sama. |
Kueri vektor | Merumuskan kueri vektor tunggal dan beberapa. |
Algoritma pencarian vektor | Gunakan Hierarkis Navigable Small World (HNSW) atau K-Nearest Neighbors (KNN) lengkap untuk menemukan vektor serupa dalam indeks pencarian. |
Filter vektor | Terapkan filter sebelum atau sesudah eksekusi kueri untuk presisi yang lebih besar selama pengambilan informasi. |
Pengambilan informasi hibrid | Cari konsep dan kata kunci dalam satu permintaan kueri hibrid. Pencarian hibrid mengonsolidasikan vektor dan pencarian teks, dengan peringkat semantik opsional dan penyetelan relevansi untuk hasil terbaik. |
Pemotongan dan vektorisasi data terintegrasi | Pemotongan data asli melalui keterampilan Pemisahan Teks. Vektorisasi asli melalui vektorizer dan keterampilan penyematan seperti AzureOpenAIEmbeddingModel, multimodal Azure AI Vision, dan keterampilan AML yang dapat Anda gunakan untuk terhubung ke titik akhir dalam katalog model Azure AI Foundry. Vektorisasi terintegrasi menyediakan alur pengindeksan end-to-end dari file sumber ke kueri. |
Kompresi dan kuantisasi vektor terintegrasi | Gunakan kuantisasi skalar dan biner bawaan untuk mengurangi ukuran indeks vektor dalam memori dan pada disk. Anda juga dapat melakukan forego penyimpanan vektor yang tidak Anda butuhkan, atau menetapkan jenis data sempit ke bidang vektor untuk mengurangi persyaratan penyimpanan. |
AI terapan dan penambangan pengetahuan
Golongan | Fitur |
---|---|
Pemrosesan AI selama pengindeksan | Pengayaan AI mengacu pada gambar yang disematkan dan pemrosesan bahasa alami dalam alur pengindeks yang mengekstrak teks dan informasi dari konten yang tidak dapat diindeks untuk pencarian teks lengkap. Pemrosesan AI dicapai dengan menambahkan dan menggabungkan keterampilan dalam set keterampilan, yang kemudian melekat pada pengindeks. AI dapat berupa keterampilan bawaan dari Microsoft, seperti terjemahan teks atau Pengenalan Karakter Optik (OCR), atau keterampilan khusus yang Anda berikan. |
Menyimpan konten yang diperkaya untuk analisis dan konsumsi dalam skenario non-pencarian | Penyimpanan pengetahuan adalah penyimpanan konten yang diperkaya secara terus-menerus, yang ditujukan untuk skenario non-pencarian seperti penambangan pengetahuan dan pemrosesan ilmu data. Sebuah penyimpanan pengetahuan ditentukan dalam set keterampilan, tetapi dibuat dalam Azure Storage sebagai objek atau rowsets tabular. |
Pengayaan yang di-cache | Penembolokan pengayaan (pratinjau) mengacu pada pengayaan cache yang dapat digunakan kembali selama eksekusi skillset. Penembolokan sangat berharga dalam set keterampilan yang mencakup OCR dan analisis gambar, yang membutuhkan biaya besar untuk diproses. |
Teks lengkap dan formulir kueri lainnya
Golongan | Fitur |
---|---|
Pencarian teks bentuk bebas |
Pencarian teks lengkap adalah kasus penggunaan utama untuk sebagian besar aplikasi berbasis pencarian. Kueri bisa dirumuskan menggunakan sintaks yang didukung. Sintaks kueri sederhana menyediakan operator logis, operator pencarian frasa, operator akhiran, operator prioritas. Sintaks kueri Lucene penuh mencakup semua operasi dalam sintaks sederhana, dengan ekstensi untuk pencarian fuzzy, pencarian kedekatan, peningkatan istilah, dan ekspresi reguler. |
Relevansi |
Penilaian sederhana adalah manfaat utama dari Azure AI Search. Profil penilaian digunakan untuk memodelkan relevansi sebagai fungsi nilai dalam dokumen itu sendiri. Misalnya, Anda mungkin ingin produk yang lebih baru atau produk diskon muncul lebih tinggi di hasil pencarian. Anda juga dapat membuat profil penilaian menggunakan tag untuk penilaian yang dipersonalisasi berdasarkan preferensi penelusuran pelanggan yang telah Anda lacak dan simpan secara terpisah. Peringkat semantik adalah fitur premium yang melakukan rerank hasil berdasarkan relevansi semantik dengan kueri. Tergantung pada konten dan skenario Anda, ini dapat secara signifikan meningkatkan relevansi pencarian dengan konfigurasi atau upaya yang hampir minimal. |
Pencarian geospasial | Fungsi geospasial memfilter dan mencocokkan koordinat geografis . Anda dapat mencocokkan pada jarak atau dengan penyertaan dalam bentuk poligon. |
Filter dan faset |
Navigasi tersaring diaktifkan melalui satu parameter kueri. Azure AI Search mengembalikan struktur navigasi tersaring yang dapat Anda gunakan sebagai kode di belakang daftar kategori, untuk pemfilteran yang diarahkan sendiri (misalnya, untuk memfilter item katalog menurut rentang harga atau merek). Filter dapat digunakan untuk menggabungkan navigasi tersaring ke dalam UI aplikasi Anda, menyempurnakan formulasi kueri, dan memfilter berdasarkan kriteria yang ditentukan pengguna atau pengembang. Membuat filter menggunakan sintaks OData. |
Pengalaman pengguna |
Autocomplete dapat diaktifkan untuk kueri yang diketik di bar pencarian. Saran pencarian juga berfungsi dari input teks parsial di bar pencarian, tetapi hasilnya adalah dokumen aktual dalam indeks Anda daripada istilah kueri. Sinonim mengaitkan istilah yang setara yang secara implisit memperluas cakupan kueri, tanpa pengguna harus memberikan persyaratan alternatif. Penyorotan klik menerapkan pemformatan teks ke kata kunci yang cocok di hasil pencarian. Anda dapat memilih bidang mana yang mengembalikan cuplikan yang disorot. Pengurutan ditawarkan untuk beberapa bidang melalui skema indeks lalu beralih pada waktu kueri dengan satu parameter pencarian. Penomoran dan pembatasan hasil pencarian Anda mudah dengan kontrol yang disetel dengan baik yang ditawarkan Azure AI Search atas hasil pencarian Anda. |
Fitur keamanan
Golongan | Fitur |
---|---|
Enkripsi data |
Enkripsi yang dikelola Microsoft saat istirahat dibangun ke dalam lapisan penyimpanan internal dan tidak dapat diurungkan. Kunci enkripsi yang dikelola pelanggan yang Anda buat dan kelola di Azure Key Vault dapat digunakan untuk enkripsi tambahan indeks dan peta sinonim. Untuk layanan yang dibuat setelah 1 Agustus 2020, enkripsi CMK diperluas ke data pada disk sementara, untuk enkripsi ganda penuh dari konten yang diindeks. |
Perlindungan Titik Akhir |
Aturan IP untuk dukungan firewall masuk memungkinkan Anda untuk mengatur rentang IP di mana layanan pencarian akan menerima permintaan. Buat titik akhir privat menggunakan Azure Private Link untuk memaksa semua permintaan melalui jaringan virtual. |
Akses masuk | Kontrol akses berbasis peran menetapkan peran kepada pengguna dan grup di ID Microsoft Entra untuk akses terkontrol ke konten dan operasi pencarian. Anda juga dapat menggunakan autentikasi berbasis kunci jika Anda tidak ingin menggunakan penetapan peran. |
Keamanan outbound (pengindeks) |
Akses data melalui titik akhir privat memungkinkan pengindeks tersambung ke Azure Resource Manager yang dilindungi melalui Azure Private Link. Akses data menggunakan identitas tepercaya berarti bahwa string koneksi ke sumber data eksternal dapat menghilangkan nama pengguna dan kata sandi. Ketika pengindeks tersambung ke sumber data, sumber daya memungkinkan koneksi jika layanan pencarian sebelumnya terdaftar sebagai layanan tepercaya. |
Fitur portal
Golongan | Fitur |
---|---|
Alat untuk prototyping dan inspeksi |
Tambahkan indeks adalah perancang indeks di portal Azure yang dapat Anda gunakan untuk membuat skema dasar yang terdiri dari bidang atribut dan beberapa pengaturan lainnya. Setelah menyimpan indeks, Anda dapat mengisinya menggunakan SDK atau REST API untuk memberikan data. Wizard impor data membuat indeks, pengindeks, set keterampilan, dan definisi sumber data. Jika data Anda ada di Azure, wizard ini dapat menghemat waktu dan upaya yang signifikan, terutama untuk investigasi dan eksplorasi bukti konsep. Mengimpor dan mem-vektorisasi data membuat alur pengindeksan lengkap yang mencakup pemotongan dan vektorisasi data. Wizard membuat semua objek dan pengaturan konfigurasi. Penjelajah pencarian digunakan untuk menguji kueri dan memperbaiki profil penilaian. Membuat aplikasi demo digunakan untuk menghasilkan halaman HTML yang dapat digunakan untuk menguji pengalaman pencarian. Sesi Debug adalah editor visual yang memungkinkan Anda men-debug set keterampilan secara interaktif. Ini menunjukkan dependensi, output, dan transformasi. |
Pemantauan dan diagnostik | Aktifkan fitur pemantauan untuk melampaui metrik sekilas yang selalu terlihat di portal Azure. Metrik pada kueri per detik, latensi, dan pembatasan diambil dan dilaporkan di halaman portal tanpa memerlukan konfigurasi tambahan. |
Keterprograman
Golongan | Fitur |
---|---|
REST |
Service REST API adalah untuk operasi pesawat data, termasuk semua operasi yang terkait dengan pengindeksan, kueri, dan pengayaan AI. Anda juga bisa menggunakan pustaka klien ini untuk mengambil informasi dan statistik sistem. REST API Manajemen adalah untuk pembuatan dan provisi layanan melalui Azure Resource Manager. Anda juga dapat menggunakan API ini untuk mengelola kunci dan kapasitas. |
Azure SDK untuk .NET |
dokumen pencarian azure adalah untuk operasi pesawat data, termasuk semua operasi yang terkait dengan pengindeksan, kueri, dan pengayaan AI. Anda juga bisa menggunakan pustaka klien ini untuk mengambil informasi dan statistik sistem. Microsoft.Azure.Management.Search adalah untuk pembuatan dan provisi layanan melalui Azure Resource Manager. Anda juga dapat menggunakan API ini untuk mengelola kunci dan kapasitas. |
Azure SDK untuk Java |
com.azure.search.doc adalah untuk operasi pesawat data, termasuk semua operasi yang terkait dengan pengindeksan, kueri, dan pengayaan AI. Anda juga bisa menggunakan pustaka klien ini untuk mengambil informasi dan statistik sistem. com.microsoft.azure.management.search adalah untuk pembuatan dan provisi layanan melalui Azure Resource Manager. Anda juga dapat menggunakan API ini untuk mengelola kunci dan kapasitas. |
SDK Azure untuk Python |
dokumen pencarian azure adalah untuk operasi pesawat data, termasuk semua operasi yang terkait dengan pengindeksan, kueri, dan pengayaan AI. Anda juga bisa menggunakan pustaka klien ini untuk mengambil informasi dan statistik sistem. azure-mgmt-search adalah untuk pembuatan dan provisi layanan melalui Azure Resource Manager. Anda juga dapat menggunakan API ini untuk mengelola kunci dan kapasitas. |
Azure SDK untuk JavaScript/TypeScript |
dokumen pencarian azure adalah untuk operasi pesawat data, termasuk semua operasi yang terkait dengan pengindeksan, kueri, dan pengayaan AI. Anda juga bisa menggunakan pustaka klien ini untuk mengambil informasi dan statistik sistem. azure/arm-search adalah untuk pembuatan dan provisi layanan melalui Azure Resource Manager. Anda juga dapat menggunakan API ini untuk mengelola kunci dan kapasitas. |