Membuat model kustom pemrosesan dokumen
Setelah meninjau persyaratan, Anda dapat mulai membuat model pemrosesan dokumen Anda.
Masuk ke AI Builder
Masuk ke Power Apps atau Power Automate.
Di panel kiri, pilih ... Lebih banyak>hub AI.
Di bawah Temukan kemampuan AI, pilih model AI.
(Opsional) Untuk menyimpan model AI secara permanen di menu agar mudah diakses, pilih ikon pin.
Pilih Ekstrak informasi kustom dari dokumen.
Pilih Buat model kustom.
Wizard langkah demi langkah memandu Anda melalui proses dengan meminta Anda untuk mencantumkan semua data yang ingin Anda ekstrak dari dokumen Anda. Jika Anda ingin membuat model dengan menggunakan dokumen Anda sendiri, pastikan Anda memiliki setidaknya lima contoh yang menggunakan tata letak yang sama. Jika tidak, Anda dapat menggunakan data sampel untuk membuat model.
Pilih Latih.
Uji model dengan memilih Uji cepat.
Pilih jenis dokumen
Pada langkah Pilih jenis dokumen, pilih jenis dokumen yang ingin Anda buat model AI untuk mengotomatiskan ekstraksi data. Ada tiga pilihan:
- Dokumen templat tetap: Sebelumnya dikenal sebagai terstruktur, opsi ini ideal ketika, untuk tata letak tertentu, bidang, tabel, kotak centang, tanda tangan, dan item lainnya dapat ditemukan di tempat yang serupa. Anda dapat mengajarkan model ini untuk mengekstrak data dari dokumen terstruktur yang memiliki tata letak berbeda. Model ini memiliki waktu pelatihan yang cepat.
- Dokumen umum: Sebelumnya dikenal sebagai tidak terstruktur, opsi ini sangat ideal untuk semua jenis dokumen, terutama ketika tidak ada struktur yang ditetapkan, atau ketika formatnya rumit. Anda dapat mengajarkan model ini untuk mengekstrak data dari dokumen terstruktur atau tidak terstruktur yang memiliki tata letak berbeda. Model ini kuat, tetapi memiliki waktu pelatihan yang lama.
- Faktur: Menambah perilaku model pemrosesan faktur bawaan dengan menambahkan bidang baru yang akan diekstraksi selain yang secara default, atau sampel dokumen yang tidak diekstraksi dengan benar.
Coba versi model baru (Pratinjau)
Dengan memilih sakelar Coba versi model baru (Pratinjau), Anda dapat mencoba versi model pratinjau terbaru untuk Dokumen templat tetap, Dokumen umum, dan Faktur.
Penting
- Versi model baru adalah rilis pratinjau.
- Rilis pratinjau tidak dimaksudkan untuk penggunaan produksi dan mungkin memiliki fungsionalitas yang terbatas. Rilis ini tunduk pada persyaratan penggunaan tambahan, dan tersedia sebelum rilis resmi sehingga pelanggan bisa mendapatkan akses awal dan memberikan umpan balik.
Prasyarat
Lingkungan Anda harus berada di salah satu wilayah berikut: Australia, Asia, Kanada, Eropa, Prancis, Jerman, Jepang, India, Norwegia, Afrika Selatan, Amerika Selatan, Korea Selatan, Swiss, Uni Emirat Arab, dan Amerika Serikat.
Manfaat menggunakan model pratinjau
- Akurasi yang ditingkatkan: Harapkan akurasi yang lebih tinggi dalam ekstraksi data.
- Penyempurnaan OCR terbaru: Model pratinjau menyertakan pembaruan Optical Character Recognition (OCR) terbaru. Pembaruan ini menyelesaikan banyak masalah OCR umum, terutama saat menangani format teks kompleks seperti kode batang, kode QR, dan tanda air.
- Skor kepercayaan untuk tabel: Anda bisa mendapatkan skor kepercayaan untuk tabel, baris tabel, dan sel tabel individual
Cara memeriksa versi model
Anda dapat dengan mudah memverifikasi versi yang digunakan untuk melatih dan menerbitkan model Anda. Pilih Pengaturan Versi>model>yang diterbitkan Versi model terlatih terakhir.
Cara mengubah versi model
Anda dapat mengedit versi model yang dilatih atau dipublikasikan (pratinjau) dan melatihnya dengan versi ketersediaan umum (GA).
- Pilih Edit model.
- Pilih Coba versi model baru (Pratinjau).
- Pilih tombol Tidak .
Anda dapat mengedit versi ketersediaan umum (GA) model yang dilatih atau diterbitkan dan melatihnya dengan versi model (Pratinjau).
- Pilih Edit model.
- Pilih Coba versi model baru (Pratinjau).
- Pilih tombol Ya .
Tentukan informasi yang akan diekstrak
Pada layar Pilih informasi untuk diekstrak, tentukan bidang, tabel, dan kotak centang yang ingin Anda ajarkan untuk diekstrak oleh model Anda. Pilih tombol +Tambahkan untuk mulai menentukannya.
Untuk setiap bidang Teks, berikan nama untuk bidang yang akan digunakan dalam model.
Untuk setiap bidang Angka, berikan nama untuk bidang yang akan digunakan dalam model.
Juga, tentukan format titik (.) atau koma (,) sebagai pemisah desimal.
Untuk setiap bidang Tanggal, berikan nama untuk bidang yang akan digunakan dalam model.
Juga, tentukan format (Tahun, Bulan, Hari ), atau ( Bulanan, Hari, Tahun ), atau (Hari , Bulan, Tahun).
Untuk setiap Kotak Centang, berikan nama untuk kotak centang yang akan digunakan dalam model.
Tentukan kotak centang terpisah untuk setiap item yang dapat dicentang dalam dokumen.
Untuk setiap Tabel, berikan nama untuk tabel.
Juga, tentukan kolom berbeda yang harus diekstrak model.
Catatan
Model faktur kustom dilengkapi dengan bidang default yang tidak dapat diedit.
Mengelompokkan dokumen berdasarkan koleksi
Koleksi adalah sekelompok dokumen yang memiliki tata letak yang sama. Buat koleksi sebanyak tata letak dokumen yang Anda inginkan untuk diproses oleh model Anda. Misalnya, jika Anda membangun model AI untuk memproses faktur dari dua vendor berbeda, masing-masing memiliki templat fakturnya sendiri, buat dua koleksi.
Untuk setiap koleksi yang Anda buat, Anda harus mengunggah setidaknya lima contoh dokumen per koleksi. File dengan format file JPG, PNG, dan PDF saat ini diterima.
Catatan
Anda dapat membuat hingga 200 koleksi per model.
Langkah selanjutnya
Menandai dokumen dalam model pemrosesan dokumen