Apa yang baru di Azure OpenAI Service
Artikel ini menyediakan ringkasan rilis terbaru dan pembaruan dokumentasi utama untuk Azure OpenAI Service.
Februari 2025
Penyebaran standar zona data o3-mini
o3-mini
sekarang tersedia untuk standar global, dan penyebaran standar zona data untuk pelanggan akses terbatas terdaftar. Wilayah penyebaran standar data saat ini hanya Amerika Serikat wilayah.
Untuk informasi selengkapnya, lihat panduan model penalaran kami.
audio mini gpt-4o dirilis
Model gpt-4o-mini-audio-preview
(2024-12-17) adalah model penyelesaian audio terbaru. Untuk informasi selengkapnya, lihat mulai cepat pembuatan audio.
Model gpt-4o-mini-realtime-preview
(2024-12-17) adalah model audio real time terbaru. Model real time menggunakan model audio GPT-4o yang mendasar yang sama dengan API penyelesaian, tetapi dioptimalkan untuk interaksi audio latensi rendah dan real-time. Untuk informasi selengkapnya, lihat mulai cepat audio real-time.
Untuk informasi selengkapnya tentang model yang tersedia, lihat dokumentasi model dan versi.
Januari 2025
o3-mini dirilis
o3-mini
(2025-01-31) adalah model penalaran terbaru, menawarkan kemampuan penalaran yang ditingkatkan. Untuk informasi selengkapnya, lihat panduan model penalaran kami.
Penyelesaian audio GPT-4o
Model gpt-4o-audio-preview
ini sekarang tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah.
gpt-4o-audio-preview
Gunakan model untuk pembuatan audio.
Model ini gpt-4o-audio-preview
memperkenalkan modalitas audio ke dalam API yang ada /chat/completions
. Model audio memperluas potensi aplikasi AI dalam interaksi teks dan berbasis suara dan analisis audio. Modalitas yang didukung dalam gpt-4o-audio-preview
model meliputi: teks, audio, dan teks + audio. Untuk informasi selengkapnya, lihat mulai cepat pembuatan audio.
Catatan
API Realtime menggunakan model audio GPT-4o yang mendasari yang sama dengan API penyelesaian, tetapi dioptimalkan untuk interaksi audio latensi rendah dan real-time.
GPT-4o Realtime API 2024-12-17
Model gpt-4o-realtime-preview
versi 2024-12-17 tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah.
gpt-4o-realtime-preview
Gunakan model versi 2024-12-17 alih-alih gpt-4o-realtime-preview
model pratinjau versi 2024-10-01 untuk interaksi audio real time.
- Menambahkan dukungan untuk penembolokan permintaan dengan
gpt-4o-realtime-preview
model. - Menambahkan dukungan untuk suara baru. Model
gpt-4o-realtime-preview
sekarang mendukung suara berikut: "alloy", "ash", "ballad", "coral", "echo", "sage", "shimmer", "verse". - Batas tarif tidak lagi didasarkan pada koneksi per menit. Pembatasan tarif sekarang didasarkan pada RPM (permintaan per menit) dan TPM (token per menit) untuk
gpt-4o-realtime-preview
model. Batas tarif untuk setiapgpt-4o-realtime-preview
penyebaran model adalah 100K TPM dan 1K RPM. Selama pratinjau, portal dan API Azure AI Foundry mungkin secara tidak akurat menunjukkan batas laju yang berbeda. Bahkan jika Anda mencoba menetapkan batas tarif yang berbeda, batas tarif aktual adalah 100K TPM dan RPM 1K.
Untuk informasi selengkapnya, lihat mulai cepat audio real time GPT-4o dan panduan cara penggunaan.
Desember 2024
Model penalaran o1 dirilis untuk akses terbatas
Model terbaru o1
sekarang tersedia untuk akses API dan penyebaran model.
Pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang sebelumnya menerapkan dan menerima akses ke o1-preview
, tidak perlu menerapkan kembali karena mereka secara otomatis berada di daftar tunggu untuk model terbaru.
Meminta akses: aplikasi model akses terbatas
Untuk mempelajari selengkapnya tentang model seri lanjutan o1
lihat, mulai menggunakan model penalaran seri o1.
Ketersediaan wilayah
Model | Wilayah |
---|---|
o1 (Versi: 2024-12-17) |
US Timur2 (Standar Global) Swedia Tengah (Standar Global) |
Penyempurnaan preferensi (pratinjau)
Pengoptimalan preferensi langsung (DPO) adalah teknik penyelarasan baru untuk model bahasa besar, yang dirancang untuk menyesuaikan bobot model berdasarkan preferensi manusia. Tidak seperti pembelajaran penguatan dari umpan balik manusia (RLHF), DPO tidak memerlukan pemasangan model hadiah dan menggunakan data yang lebih sederhana (preferensi biner) untuk pelatihan. Metode ini secara komputasi lebih ringan dan lebih cepat, membuatnya sama-sama efektif dalam penyelarasan sambil menjadi lebih efisien. DPO sangat berguna dalam skenario di mana elemen subjektif seperti nada, gaya, atau preferensi konten tertentu penting. Kami sangat senang mengumumkan pratinjau publik DPO di Azure OpenAI Service, dimulai dengan gpt-4o-2024-08-06
model.
Untuk menyempurnakan ketersediaan wilayah model, lihat halaman model.
Penyelesaian tersimpan & distilasi
Penyelesaian tersimpan memungkinkan Anda mengambil riwayat percakapan dari sesi penyelesaian obrolan untuk digunakan sebagai himpunan data untuk evaluasi dan penyempurnaan.
GPT-4o 2024-11-20
gpt-4o-2024-11-20
sekarang tersedia untuk penyebaran standar global di:
- AS Timur
- AS Timur 2
- US Tengah Utara
- US Tengah Selatan
- AS Barat
- AS Barat 3
- Swedia Tengah
Jenis penyebaran yang disediakan zona data BARU
Penyebaran yang disediakan zona data tersedia di sumber daya Azure OpenAI yang sama dengan semua jenis penyebaran Azure OpenAI lainnya tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dalam zona data yang ditentukan Microsoft dengan ketersediaan terbaik untuk setiap permintaan. Penyebaran yang disediakan zona data menyediakan kapasitas pemrosesan model yang dipesan untuk throughput tinggi dan dapat diprediksi menggunakan infrastruktur Azure dalam zona data yang ditentukan Microsoft. Penyebaran yang disediakan zona data didukung pada gpt-4o-2024-08-06
model , , gpt-4o-2024-05-13
dan gpt-4o-mini-2024-07-18
.
Untuk informasi selengkapnya, lihat panduan jenis penyebaran.
November 2024
GA Penghalusan Visi
Penyempurnaan penglihatan dengan GPT-4o (2024-08-06) sekarang Tersedia Secara Umum (GA).
Penyempurnaan visi memungkinkan Anda menambahkan gambar ke data pelatihan JSONL Anda. Sama seperti Anda dapat mengirim satu atau banyak input gambar ke penyelesaian obrolan, Anda dapat menyertakan jenis pesan yang sama dalam data pelatihan Anda. Gambar dapat disediakan baik sebagai URL atau sebagai gambar yang dikodekan base64.
Untuk menyempurnakan ketersediaan wilayah model, lihat halaman model.
Pemantauan penyalahgunaan AI BARU
Kami memperkenalkan bentuk baru pemantauan penyalahgunaan yang memanfaatkan LLM untuk meningkatkan efisiensi deteksi penggunaan layanan Azure OpenAI yang berpotensi melecehkan dan untuk mengaktifkan pemantauan penyalahgunaan tanpa perlu meninjau permintaan dan penyelesaian manusia. Pelajari selengkapnya, lihat Pemantauan penyalahgunaan.
Permintaan dan penyelesaian yang ditandai melalui klasifikasi konten dan/atau diidentifikasi sebagai bagian dari pola penggunaan yang berpotensi melecehkan dikenakan proses peninjauan tambahan untuk membantu mengonfirmasi analisis sistem dan menginformasikan keputusan tindakan. Sistem pemantauan penyalahgunaan kami telah diperluas untuk mengaktifkan peninjauan oleh LLM secara default dan oleh manusia jika diperlukan dan sesuai.
Oktober 2024
Jenis penyebaran standar zona data BARU
Penyebaran standar zona data tersedia di sumber daya Azure OpenAI yang sama dengan semua jenis penyebaran Azure OpenAI lainnya tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dalam zona data yang ditentukan Microsoft dengan ketersediaan terbaik untuk setiap permintaan. Standar zona data menyediakan kuota default yang lebih tinggi daripada jenis penyebaran berbasis geografi Azure kami. Penyebaran standar zona data didukung pada gpt-4o-2024-08-06
model , gpt-4o-2024-05-13
, dan gpt-4o-mini-2024-07-18
.
Untuk informasi selengkapnya, lihat panduan jenis penyebaran.
Global Batch GA
Batch global Azure OpenAI sekarang tersedia secara umum.
Azure OpenAI Batch API dirancang untuk menangani tugas pemrosesan skala besar dan volume tinggi secara efisien. Proses grup permintaan asinkron dengan kuota terpisah, dengan penyelesaian target 24 jam, dengan biaya 50% lebih murah daripada standar global. Dengan pemrosesan batch, daripada mengirim satu permintaan pada satu waktu Anda mengirim sejumlah besar permintaan dalam satu file. Permintaan batch global memiliki kuota token antrean terpisah yang menghindari gangguan beban kerja online Anda.
Kasus penggunaan utama meliputi:
Pemrosesan Data Skala Besar: Menganalisis himpunan data yang luas secara paralel dengan cepat.
Pembuatan Konten: Membuat teks dalam volume besar, seperti deskripsi produk atau artikel.
Tinjauan dan Ringkasan Dokumen: Mengotomatiskan tinjauan dan ringkasan dokumen yang panjang.
Automasi Dukungan Pelanggan: Tangani banyak kueri secara bersamaan untuk respons yang lebih cepat.
Ekstraksi dan Analisis Data: Mengekstrak dan menganalisis informasi dari sejumlah besar data yang tidak terstruktur.
Tugas Pemrosesan Bahasa Alami (NLP): Lakukan tugas seperti analisis sentimen atau terjemahan pada himpunan data besar.
Pemasaran dan Personalisasi: Hasilkan konten dan rekomendasi yang dipersonalisasi dalam skala besar.
Untuk informasi selengkapnya tentang memulai penyebaran batch global.
Akses terbatas model o1-preview dan o1-mini
Model o1-preview
dan o1-mini
sekarang tersedia untuk akses API dan penyebaran model.
Pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft.
Meminta akses: aplikasi model akses terbatas
Pelanggan yang sudah disetujui dan memiliki akses ke model melalui taman bermain akses awal tidak perlu diterapkan lagi, Anda akan secara otomatis diberikan akses API. Setelah akses diberikan, Anda harus membuat penyebaran untuk setiap model.
Dukungan API:
Dukungan untuk model seri o1 ditambahkan dalam versi 2024-09-01-preview
API .
Parameter max_tokens
telah ditolak dan diganti dengan parameter baru max_completion_tokens
.
Model seri o1 hanya akan berfungsi dengan max_completion_tokens
parameter .
Ketersediaan wilayah:
Model tersedia untuk penyebaran standar dan global di US Timur2 dan Swedia Tengah untuk pelanggan yang disetujui.
API Realtime GPT-4o baru untuk pratinjau publik ucapan dan audio
Audio GPT-4o Azure OpenAI adalah bagian dari keluarga model GPT-4o yang mendukung interaksi percakapan latensi rendah, "ucapan masuk, ucapan keluar". API audio realtime
GPT-4o dirancang untuk menangani interaksi percakapan latensi rendah real time, sehingga sangat cocok untuk kasus penggunaan yang melibatkan interaksi langsung antara pengguna dan model, seperti agen dukungan pelanggan, asisten suara, dan penerjemah real time.
Model gpt-4o-realtime-preview
ini tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah.
Untuk informasi selengkapnya, lihat mulai cepat audio real time GPT-4o.
Pembaruan dukungan batch global
Batch global sekarang mendukung GPT-4o (2024-08-06). Lihat panduan memulai batch global untuk informasi selengkapnya.
September 2024
Pembaruan UX Azure OpenAI Studio
Mulai 19 September 2024, saat Anda membuka Azure OpenAI Studio , Anda tidak lagi melihat Azure OpenAI Studio warisan secara default. Jika diperlukan, Anda masih dapat kembali ke pengalaman sebelumnya dengan menggunakan tombol Alihkan ke tampilan lama di bilah atas UI selama beberapa minggu ke depan. Jika Anda beralih kembali ke portal Azure AI Foundry warisan, ini membantu jika Anda mengisi formulir umpan balik untuk memberi tahu kami alasannya. Kami secara aktif memantau umpan balik ini untuk meningkatkan pengalaman baru.
Penyebaran yang disediakan GPT-4o 2024-08-06
GPT-4o 2024-08-06 sekarang tersedia untuk penyebaran yang disediakan di US Timur, US Timur 2, US Tengah Utara, dan Swedia Tengah. Ini juga tersedia untuk penyebaran yang disediakan global.
Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.
Jenis penyebaran global baru yang disediakan
Penyebaran global tersedia di sumber daya Azure OpenAI yang sama dengan jenis penyebaran non-global tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dengan ketersediaan terbaik untuk setiap permintaan. Penyebaran global yang disediakan menyediakan kapasitas pemrosesan model yang dipesan untuk throughput tinggi dan dapat diprediksi menggunakan infrastruktur global Azure. Penyebaran global yang disediakan didukung pada gpt-4o-2024-08-06
model dan gpt-4o-mini-2024-07-18
.
Untuk informasi selengkapnya, lihat panduan jenis penyebaran.
Model o1-preview dan o1-mini baru tersedia untuk akses terbatas
Azure OpenAI o1-preview
dan o1-mini
model dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika dibandingkan dengan iterasi sebelumnya.
Kemampuan utama seri o1
- Pembuatan Kode Kompleks: Mampu menghasilkan algoritma dan menangani tugas pengkodean tingkat lanjut untuk mendukung pengembang.
- Pemecahan Masalah Tingkat Lanjut: Ideal untuk sesi curah otak yang komprehensif dan mengatasi tantangan multifaktor.
- Perbandingan Dokumen Kompleks: Sempurna untuk menganalisis kontrak, file kasus, atau dokumen hukum untuk mengidentifikasi perbedaan yang halang.
- Instruksi Mengikuti dan Manajemen Alur Kerja: Sangat efektif untuk mengelola alur kerja yang membutuhkan konteks yang lebih pendek.
Varian model
-
o1-preview
:o1-preview
adalah yang lebih mampu dario1
model seri. -
o1-mini
:o1-mini
adalah model seri yango1
lebih cepat dan lebih murah.
Versi model: 2024-09-12
Meminta akses: aplikasi model akses terbatas
Batasan
Model o1
seri saat ini dalam pratinjau dan tidak menyertakan beberapa fitur yang tersedia dalam model lain, seperti pemahaman gambar dan output terstruktur yang tersedia dalam model GPT-4o terbaru. Untuk banyak tugas, model GPT-4o yang tersedia secara umum mungkin masih lebih cocok.
Keamanan
OpenAI telah memasukkan langkah-langkah keamanan tambahan ke dalam o1
model, termasuk teknik baru untuk membantu model menolak permintaan yang tidak aman. Kemajuan ini membuat o1
seri beberapa model paling kuat tersedia.
Ketersediaan
o1-preview
dan o1-mini
tersedia di wilayah US Timur2 untuk akses terbatas melalui portal Azure AI Foundry taman bermain akses awal. Pemrosesan data untuk o1
model mungkin terjadi di wilayah yang berbeda dari tempat model tersedia untuk digunakan.
Untuk mencoba o1-preview
model dan o1-mini
dalam pendaftaran taman bermain akses awal diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft.
Meminta akses: aplikasi model akses terbatas
Setelah akses diberikan, Anda harus:
- Navigasi ke https://ai.azure.com/resources dan pilih sumber daya di wilayah tersebut
eastus2
. Jika Anda tidak memiliki sumber daya Azure OpenAI di wilayah ini, Anda harus membuatnya. -
eastus2
Setelah sumber daya Azure OpenAI dipilih, di panel kiri atas di bawah Playgrounds pilih Taman bermain akses awal (pratinjau).
Agustus 2024
Output terstruktur GPT-4o 2024-08-06
- Tersedia untuk penyebaran standar dan global di semua wilayah AS dan Swedia Tengah.
- Model ini menambahkan dukungan untuk output terstruktur.
Penyebaran yang disediakan mini GPT-4o
GPT-4o mini sekarang tersedia untuk penyebaran yang disediakan di Kanada Timur, AS Timur, US Timur2, US Tengah Utara, dan Swedia Tengah.
Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.
Penyempurnaan GPT-4o (Pratinjau Umum)
Penyempurnaan GPT-4o sekarang tersedia untuk Azure OpenAI dalam pratinjau publik di US Tengah Utara dan Swedia Tengah.
Untuk mengetahui informasi selengkapnya, lihat posting blog kami.
Rilis API pratinjau baru
Versi 2024-07-01-preview
API adalah rilis API penulisan &inferensi dataplane terbaru. Ini menggantikan versi 2024-05-01-preview
API dan menambahkan dukungan untuk:
- Dukungan API Batch ditambahkan
- Parameter strategi potongan penyimpanan vektor
-
max_num_results
bahwa alat pencarian file harus menghasilkan.
Untuk informasi selengkapnya, lihat dokumentasi referensi kami
Ketersediaan regional mini GPT-4o
- GPT-4o mini tersedia untuk penyebaran standar dan global di wilayah US Timur dan Swedia Tengah.
- GPT-4o mini tersedia untuk penyebaran batch global di wilayah US Timur, Swedia Tengah, dan US Barat.
Panduan evaluasi
- Posting blog baru tentang memulai evaluasi model. Sebaiknya gunakan panduan ini sebagai bagian dari proses peningkatan dan penghentian model.
Model GPT-4o terbaru tersedia di taman bermain akses awal (pratinjau)
Pada 6 Agustus 2024, OpenAI mengumumkan versi terbaru dari versi 2024-08-06
model GPT-4o andalan mereka . GPT-4o 2024-08-06
memiliki semua kemampuan versi sebelumnya serta:
- Kemampuan yang ditingkatkan untuk mendukung output terstruktur yang kompleks.
- Token output maks telah ditingkatkan dari 4.096 menjadi 16.384.
Pelanggan Azure dapat menguji GPT-4o 2024-08-06
hari ini di taman bermain akses awal Azure AI Foundry baru (pratinjau).
Tidak seperti taman bermain akses awal sebelumnya, taman bermain akses awal portal Azure AI Foundry (pratinjau) tidak mengharuskan Anda memiliki sumber daya di wilayah tertentu.
Catatan
Perintah dan penyelesaian yang dilakukan melalui taman bermain akses awal (pratinjau) mungkin diproses di wilayah Azure OpenAI mana pun, dan saat ini tunduk pada batas langganan 10 permintaan per menit per Azure. Batas ini mungkin berubah di masa mendatang.
Pemantauan penyalahgunaan Layanan Azure OpenAI diaktifkan untuk semua pengguna playground akses awal bahkan jika disetujui untuk modifikasi; filter konten default diaktifkan dan tidak dapat dimodifikasi.
Untuk menguji GPT-4o2024-08-06
, masuk ke taman bermain akses awal Azure AI (pratinjau) menggunakan tautan ini.
Penyebaran batch global sekarang tersedia
Azure OpenAI Batch API dirancang untuk menangani tugas pemrosesan skala besar dan volume tinggi secara efisien. Proses grup permintaan asinkron dengan kuota terpisah, dengan penyelesaian target 24 jam, dengan biaya 50% lebih murah daripada standar global. Dengan pemrosesan batch, daripada mengirim satu permintaan pada satu waktu Anda mengirim sejumlah besar permintaan dalam satu file. Permintaan batch global memiliki kuota token antrean terpisah yang menghindari gangguan beban kerja online Anda.
Kasus penggunaan utama meliputi:
Pemrosesan Data Skala Besar: Menganalisis himpunan data yang luas secara paralel dengan cepat.
Pembuatan Konten: Membuat teks dalam volume besar, seperti deskripsi produk atau artikel.
Tinjauan dan Ringkasan Dokumen: Mengotomatiskan tinjauan dan ringkasan dokumen yang panjang.
Automasi Dukungan Pelanggan: Tangani banyak kueri secara bersamaan untuk respons yang lebih cepat.
Ekstraksi dan Analisis Data: Mengekstrak dan menganalisis informasi dari sejumlah besar data yang tidak terstruktur.
Tugas Pemrosesan Bahasa Alami (NLP): Lakukan tugas seperti analisis sentimen atau terjemahan pada himpunan data besar.
Pemasaran dan Personalisasi: Hasilkan konten dan rekomendasi yang dipersonalisasi dalam skala besar.
Untuk informasi selengkapnya tentang memulai penyebaran batch global.
Juli 2024
GPT-4o mini sekarang tersedia untuk penyempurnaan
Penyempurnaan mini GPT-4o sekarang tersedia dalam pratinjau publik di Swedia Tengah dan di US Tengah Utara.
Alat Pencarian File Asisten sekarang ditagih
Alat pencarian file untuk Asisten sekarang memiliki biaya tambahan untuk penggunaan. Lihat halaman harga untuk informasi selengkapnya.
Model mini GPT-4o tersedia untuk penyebaran
GPT-4o mini adalah model Azure OpenAI terbaru yang pertama kali diumumkan pada 18 Juli 2024:
"GPT-4o mini memungkinkan pelanggan untuk memberikan aplikasi yang menakjubkan dengan biaya lebih rendah dengan kecepatan blazing. GPT-4o mini secara signifikan lebih pintar daripada GPT-3.5 Turbo—mencetak 82% pada Mengukur Pemahaman Bahasa Multitask Masif (MMLU) dibandingkan dengan 70%—dan lebih dari 60% lebih murah.1 Model ini memberikan jendela konteks 128K yang diperluas dan mengintegrasikan kemampuan multibahasa GPT-4o yang ditingkatkan, membawa kualitas yang lebih besar ke bahasa dari seluruh dunia."
Model ini saat ini tersedia untuk penyebaran standar dan global di wilayah US Timur.
Untuk informasi tentang kuota model, lihat halaman kuota dan batasan dan untuk informasi terbaru tentang ketersediaan model, lihat halaman model.
Kebijakan pemfilteran konten default AI yang Bertanggung Jawab Baru
Kebijakan DefaultV2
pemfilteran konten default baru memberikan mitigasi keamanan dan keselamatan terbaru untuk seri model GPT (teks), termasuk:
- Prompt Shields untuk serangan jailbreak pada permintaan pengguna (filter),
- Deteksi bahan yang dilindungi untuk teks (filter) pada penyelesaian model
- Deteksi material yang dilindungi untuk kode (anotasi) pada penyelesaian model
Meskipun tidak ada perubahan pada filter konten untuk sumber daya dan penyebaran yang ada (konfigurasi pemfilteran konten default atau kustom tetap tidak berubah), sumber daya baru dan penyebaran GPT akan secara otomatis mewarisi kebijakan DefaultV2
pemfilteran konten baru . Pelanggan memiliki opsi untuk beralih di antara default keamanan dan membuat konfigurasi pemfilteran konten kustom.
Lihat dokumentasi Kebijakan keselamatan default kami untuk informasi selengkapnya.
Rilis GA API baru
Versi 2024-06-01
API adalah rilis API inferensi sarana data GA terbaru. Ini menggantikan versi 2024-02-01
API dan menambahkan dukungan untuk:
- penyematan
encoding_format
&dimensions
parameter. - penyelesaian
logprobs
obrolan &top_logprobs
parameter.
Lihat dokumentasi referensi inferensi sarana data kami untuk informasi selengkapnya.
Perluasan wilayah yang tersedia untuk penyebaran standar global gpt-4o
GPT-4o sekarang tersedia untuk penyebaran standar global di:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- francecentral git
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- polandcentral
- southafricanorth
- southcentralus
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
Untuk informasi tentang kuota standar global, lihat halaman kuota dan batasan.
Juni 2024
Pembaruan tanggal penghentian
- Tanggal penghentian 0301 yang diperbarui
gpt-35-turbo
menjadi tidak lebih awal dari 1 Oktober 2024. - Diperbarui
gpt-35-turbo
&gpt-35-turbo-16k
0613 tanggal penghentian hingga 1 Oktober 2024. - Diperbarui
gpt-4
&gpt-4-32k
0314 tanggal penghentian hingga 1 Oktober 2024, dan tanggal penghentian menjadi 6 Juni 2025.
Lihat panduan penghentian model kami untuk informasi terbaru tentang penghentian dan penghentian model.
Penagihan berbasis token untuk penyempurnaan
- Penagihan penyempurnaan Azure OpenAI sekarang didasarkan pada jumlah token dalam file pelatihan Anda - alih-alih total waktu pelatihan yang berlalu. Ini dapat mengakibatkan pengurangan biaya yang signifikan untuk beberapa eksekusi pelatihan, dan membuat memperkirakan biaya penyempurnaan jauh lebih mudah. Untuk mempelajari lebih lanjut, Anda dapat berkonsultasi dengan pengumuman resmi.
GPT-4o dirilis di wilayah baru
- GPT-4o sekarang juga tersedia di:
- Swedia Tengah untuk penyebaran regional standar.
- Australia Timur, Kanada Timur, Jepang Timur, Korea Tengah, Swedia Tengah, Swiss Utara, & US Barat 3 untuk penyebaran yang disediakan.
Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.
Dukungan kunci yang dikelola pelanggan (CMK) untuk Asisten
Utas dan File di Asisten sekarang mendukung CMK di wilayah berikut:
- AS Barat 3
Mei 2024
Penyebaran yang disediakan GPT-4o
gpt-4o
Versi: 2024-05-13
tersedia untuk penyebaran standar dan yang disediakan. Penyebaran model yang disediakan dan standar menerima permintaan inferensi teks dan gambar/penglihatan.
Untuk informasi tentang ketersediaan regional model, lihat matriks model untuk penyebaran yang disediakan.
Asisten v2 (pratinjau)
Refresh Assistants API sekarang tersedia untuk umum. Ini berisi pembaruan berikut:
- Alat pencarian file dan penyimpanan vektor
- Penyelesaian maksimum dan dukungan token prompt maks untuk mengelola penggunaan token.
-
tool_choice
parameter untuk memaksa Asisten menggunakan alat tertentu. Anda sekarang dapat membuat pesan dengan peran asisten untuk membuat riwayat percakapan kustom di Utas. - Dukungan untuk
temperature
parameter ,top_p
,response_format
. - Dukungan streaming dan polling. Anda dapat menggunakan fungsi pembantu di Python SDK kami untuk membuat respons eksekusi dan streaming. Kami juga telah menambahkan pembantu SDK polling untuk berbagi pembaruan status objek tanpa perlu polling.
- Bereksperimen dengan Logic Apps dan Function Calling menggunakan Azure OpenAI Studio. Impor REST API Anda yang diterapkan di Logic Apps sebagai fungsi dan studio memanggil fungsi (sebagai alur kerja Logic Apps) secara otomatis berdasarkan permintaan pengguna.
- AutoGen by Microsoft Research menyediakan kerangka kerja percakapan multi-agen untuk memungkinkan pembuatan alur kerja Model Bahasa Besar (LLM) yang nyaman di berbagai aplikasi. Asisten Azure OpenAI sekarang diintegrasikan ke dalam AutoGen melalui
GPTAssistantAgent
, agen eksperimental baru yang memungkinkan Anda menambahkan Asisten dengan mulus ke dalam alur kerja multi-agen berbasis AutoGen. Ini memungkinkan beberapa asisten Azure OpenAI yang dapat menjadi tugas atau domain khusus untuk berkolaborasi dan mengatasi tugas yang kompleks. - Dukungan untuk model yang disempurnakan
gpt-3.5-turbo-0125
di wilayah berikut:- AS Timur 2
- Swedia Tengah
- Dukungan regional yang diperluas untuk:
- Jepang Timur
- UK Selatan
- US Barat
- AS Barat 3
- Norwegia timur
Untuk informasi selengkapnya, lihat posting blog tentang asisten.
Ketersediaan umum model GPT-4o (GA)
GPT-4o ("o adalah untuk "omni") adalah model terbaru dari OpenAI yang diluncurkan pada 13 Mei 2024.
- GPT-4o mengintegrasikan teks, dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer.
- GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi, menetapkan tolok ukur baru untuk kemampuan AI.
Untuk informasi tentang ketersediaan regional model, lihat halaman model.
Jenis penyebaran standar global (pratinjau)
Penyebaran global tersedia di sumber daya Azure OpenAI yang sama dengan penawaran non-global tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dengan ketersediaan terbaik untuk setiap permintaan. Standar global menyediakan kuota default tertinggi untuk model baru dan menghilangkan kebutuhan untuk memuat keseimbangan di beberapa sumber daya.
Untuk informasi selengkapnya, lihat panduan jenis penyebaran.
Menyempurnakan pembaruan
- Penyempurnaan GPT-4 sekarang tersedia dalam pratinjau publik.
- Menambahkan dukungan untuk benih, peristiwa, statistik validasi penuh, dan titik pemeriksaan sebagai bagian
2024-05-01-preview
dari rilis API.
Filter konten DALL-E dan GPT-4 Turbo Vision GA yang dapat dikonfigurasi
Buat filter konten kustom untuk penyebaran DALL-E 2 dan 3, GPT-4 Turbo dengan Vision GA (turbo-2024-04-09
), dan GPT-4o Anda.
Pemfilteran konten
Filter Asinkron tersedia untuk semua pelanggan Azure OpenAI
Menjalankan filter secara asinkron untuk meningkatkan latensi dalam skenario streaming sekarang tersedia untuk semua pelanggan Azure OpenAI. Pemfilteran konten
Prompt Shields
Prompt Shields melindungi aplikasi yang didukung oleh model Azure OpenAI dari dua jenis serangan: serangan langsung (jailbreak) dan tidak langsung. Serangan Tidak Langsung (juga dikenal sebagai Serangan Prompt Tidak Langsung atau Serangan Injeksi Prompt Lintas Domain) adalah jenis serangan pada sistem yang didukung oleh model AI Generatif yang mungkin terjadi ketika aplikasi memproses informasi yang tidak secara langsung ditulis oleh pengembang aplikasi atau pengguna. Pemfilteran konten
Rilis API pratinjau 05-01-2024
- Untuk informasi selengkapnya, lihat siklus hidup versi API.
Ketersediaan umum model GPT-4 Turbo (GA)
Rilis GA terbaru dari GPT-4 Turbo adalah:
-
gpt-4
Versi:turbo-2024-04-09
Ini adalah pengganti untuk model pratinjau berikut:
-
gpt-4
Versi:1106-Preview
-
gpt-4
Versi:0125-Preview
-
gpt-4
Versi:vision-preview
Perbedaan antara OpenAI dan Azure OpenAI GPT-4 Turbo GA Model
- Versi OpenAI dari model turbo terbaru
0409
mendukung mode JSON dan panggilan fungsi untuk semua permintaan inferensi. - Versi
turbo-2024-04-09
Terbaru Azure OpenAI saat ini tidak mendukung penggunaan mode JSON dan panggilan fungsi saat membuat permintaan inferensi dengan input gambar (visi). Permintaan input berbasis teks (permintaan tanpaimage_url
dan gambar sebaris) mendukung mode JSON dan panggilan fungsi.
Perbedaan dari gpt-4 vision-preview
- Integrasi peningkatan Visi khusus Azure AI dengan GPT-4 Turbo dengan Visi tidak didukung untuk
gpt-4
Versi:turbo-2024-04-09
. Ini termasuk Pengenalan Karakter Optik (OCR), landasan objek, permintaan video, dan peningkatan penanganan data Anda dengan gambar.
Penting
Fitur pratinjau peningkatan visi termasuk Optical Character Recognition (OCR), object grounding, perintah video akan dihentikan dan tidak lagi tersedia setelah gpt-4
Versi: vision-preview
ditingkatkan ke turbo-2024-04-09
. Jika saat ini Anda mengandalkan salah satu fitur pratinjau ini, peningkatan model otomatis ini akan menjadi perubahan yang melanggar.
Ketersediaan terkelola yang disediakan GPT-4 Turbo
-
gpt-4
Versi:turbo-2024-04-09
tersedia untuk penyebaran standar dan yang disediakan. Saat ini versi yang disediakan dari model ini tidak mendukung permintaan inferensi gambar/penglihatan. Penyebaran yang disediakan dari model ini hanya menerima input teks. Penyebaran model standar menerima permintaan inferensi teks dan gambar/visi.
Menyebarkan GPT-4 Turbo dengan Vision GA
Untuk menyebarkan model GA dari portal Azure AI Foundry, pilih GPT-4
lalu pilih turbo-2024-04-09
versi dari menu dropdown. Kuota default untuk gpt-4-turbo-2024-04-09
model akan sama dengan kuota saat ini untuk GPT-4-Turbo.
Lihat batas kuota regional.
April 2024
Penyempurnaan sekarang didukung di dua wilayah baru US Timur 2 dan Swiss Barat
Penyempurnaan sekarang tersedia dengan dukungan untuk:
AS Timur 2
-
gpt-35-turbo
(0613) -
gpt-35-turbo
(1106) -
gpt-35-turbo
(0125)
Swiss Barat
babbage-002
davinci-002
-
gpt-35-turbo
(0613) -
gpt-35-turbo
(1106) -
gpt-35-turbo
(0125)
Periksa halaman model, untuk informasi terbaru tentang ketersediaan model dan dukungan penyempurnaan di setiap wilayah.
Contoh pelatihan obrolan multi-giliran
Penyempurnaan sekarang mendukung contoh pelatihan obrolan multi-giliran.
GPT-4 (0125) tersedia untuk Azure OpenAI On Your Data
Anda sekarang dapat menggunakan model GPT-4 (0125) di wilayah yang tersedia dengan Azure OpenAI On Your Data.
Maret 2024
Risiko & Pemantauan keamanan di Azure OpenAI Studio
Azure OpenAI Studio sekarang menyediakan dasbor Risks & Safety untuk setiap penyebaran Anda yang menggunakan konfigurasi filter konten. Gunakan untuk memeriksa hasil aktivitas pemfilteran. Kemudian Anda dapat menyesuaikan konfigurasi filter untuk melayani kebutuhan bisnis Anda dengan lebih baik dan memenuhi prinsip AI yang Bertanggung Jawab.
Gunakan Risiko & Pemantauan keamanan
Pembaruan Azure OpenAI On Your Data
- Anda sekarang dapat menyambungkan ke database vektor Elasticsearch untuk digunakan dengan Azure OpenAI On Your Data.
- Anda dapat menggunakan parameter ukuran gugus selama penyerapan data untuk mengatur jumlah maksimum token dari potongan data tertentu dalam indeks Anda.
API ketersediaan umum (GA) 2024-02-01 dirilis
Ini adalah rilis GA API terbaru dan merupakan pengganti rilis GA sebelumnya 2023-05-15
. Rilis ini menambahkan dukungan untuk fitur Azure OpenAI GA terbaru seperti Whisper, DALLE-3, fine-tuning, pada data Anda, dan banyak lagi.
Fitur yang ada dalam pratinjau seperti Asisten, teks ke ucapan (TTS), dan beberapa sumber data "pada data Anda", memerlukan versi API pratinjau. Untuk informasi selengkapnya, lihat panduan siklus hidup versi API kami.
Ketersediaan umum bisikan (GA)
Model Ucapan ke teks Berbisik sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.
Cobalah Whisper dengan mengikuti mulai cepat.
Ketersediaan umum DALL-E 3 (GA)
Model pembuatan gambar DALL-E 3 sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.
Cobalah DALL-E 3 dengan mengikuti mulai cepat.
Dukungan regional baru untuk DALL-E 3
Anda sekarang dapat mengakses DALL-E 3 dengan sumber daya Azure OpenAI di East US
wilayah atau AustraliaEast
Azure, selain SwedenCentral
.
Penghentian dan penghentian model
Kami telah menambahkan halaman untuk melacak penghentian dan penghentian model di Azure OpenAI Service. Halaman ini menyediakan informasi tentang model yang saat ini tersedia, tidak digunakan lagi, dan dihentikan.
API pratinjau 03-03-2024 dirilis
2024-03-01-preview
memiliki semua fungsionalitas yang sama dengan 2024-02-15-preview
dan menambahkan dua parameter baru untuk penyematan:
-
encoding_format
memungkinkan Anda menentukan format untuk menghasilkan penyematan difloat
, ataubase64
. Default adalahfloat
. -
dimensions
memungkinkan Anda mengatur jumlah penyematan output. Parameter ini hanya didukung dengan model penyematan generasi ketiga baru:text-embedding-3-large
,text-embedding-3-small
. Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameterdimensions
tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru:pip install openai --upgrade
.
Jika saat ini Anda menggunakan versi API pratinjau untuk memanfaatkan fitur terbaru, sebaiknya konsultasikan dengan artikel siklus hidup versi API untuk melacak berapa lama versi API Anda saat ini akan didukung.
Memperbarui ke paket peningkatan Pratinjau GPT-4-1106
Peningkatan penyebaran gpt-4
Pratinjau 1106 ke gpt-4
Pratinjau 0125 yang dijadwalkan pada 8 Maret 2024 tidak lagi berlangsung. Penyebaran gpt-4
versi 1106-Preview dan 0125-Preview diatur ke "Pembaruan otomatis ke default" dan "Tingkatkan ketika kedaluwarsa" akan mulai ditingkatkan setelah versi stabil model dirilis.
Untuk informasi selengkapnya tentang proses peningkatan, lihat halaman model.
Februari 2024
Model GPT-3.5-turbo-0125 tersedia
Model ini memiliki berbagai peningkatan, termasuk akurasi yang lebih tinggi dalam merespons dalam format yang diminta dan perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi bahasa non-bahasa Inggris.
Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.
Model penyematan generasi ketiga tersedia
text-embedding-3-large
text-embedding-3-small
Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa yang lebih baik untuk tugas bahasa Inggris dengan tolok ukur MTEB daripada model text-embedding-ada-002 generasi kedua.
Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.
Konsolidasi kuota GPT-3.5 Turbo
Untuk menyederhanakan migrasi antara berbagai versi model GPT-3.5-Turbo (termasuk 16k), kami akan mengonsolidasikan semua kuota GPT-3.5-Turbo ke dalam satu nilai kuota.
Setiap pelanggan yang telah meningkatkan kuota yang disetujui akan memiliki total kuota gabungan yang mencerminkan peningkatan sebelumnya.
Setiap pelanggan yang total penggunaannya saat ini di seluruh versi model kurang dari default akan mendapatkan total kuota gabungan baru secara default.
Model pratinjau GPT-4-0125 tersedia
Versi gpt-4
0125-preview
model sekarang tersedia di Azure OpenAI Service di wilayah US Timur, US Tengah Utara, dan US Tengah Selatan. Pelanggan dengan penyebaran gpt-4
versi 1106-preview
akan secara otomatis ditingkatkan ke 0125-preview
dalam beberapa minggu mendatang.
Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.
Pratinjau publik ASSISTANTS API
Azure OpenAI sekarang mendukung API yang mendukung GPM OpenAI. Asisten Azure OpenAI (Pratinjau) memungkinkan Anda membuat asisten AI yang disesuaikan dengan kebutuhan Anda melalui instruksi kustom dan alat tingkat lanjut seperti penerjemah kode, dan fungsi kustom. Untuk mempelajari selengkapnya, lihat:
- Mulai Cepat
- Konsep
- Panduan Python mendalam
- Penerjemah Kode
- Pemanggilan fungsi
- Model asisten & ketersediaan wilayah
- Referensi Asisten Python & REST
- Sampel Asisten
Pratinjau publik teks openAI ke suara ucapan
Azure OpenAI Service sekarang mendukung API teks ke ucapan dengan suara OpenAI. Dapatkan ucapan yang dihasilkan AI dari teks yang Anda berikan. Untuk mempelajari selengkapnya, lihat panduan gambaran umum dan coba mulai cepat.
Catatan
Azure AI Speech juga mendukung teks OpenAI ke suara ucapan. Untuk mempelajari selengkapnya, lihat Teks OpenAI ke suara ucapan melalui Azure OpenAI Service atau melalui panduan Azure AI Speech .
Kemampuan penyempurnaan dan dukungan model baru
Dukungan regional baru untuk Azure OpenAI On Your Data
Sekarang Anda dapat menggunakan Azure OpenAI On Your Data di wilayah Azure berikut:
- Afrika Selatan Utara
Ketersediaan umum Azure OpenAI On Your Data
- Azure OpenAI On Your Data sekarang tersedia secara umum.
Desember 2023
Azure OpenAI Pada data Anda
- Dukungan VPN lengkap dan titik akhir privat untuk Azure OpenAI On Your Data, termasuk dukungan keamanan untuk: akun penyimpanan, sumber daya Azure OpenAI, dan sumber daya Azure AI layanan Pencarian.
- Artikel baru untuk menggunakan konfigurasi Azure OpenAI On Your Data dengan melindungi data dengan jaringan virtual dan titik akhir privat.
GPT-4 Turbo dengan Visi sekarang tersedia
GPT-4 Turbo dengan Visi di layanan Azure OpenAI sekarang dalam pratinjau publik. GPT-4 Turbo with Vision adalah model multimodal besar (LMM) yang dikembangkan oleh OpenAI yang dapat menganalisis gambar dan memberikan respons tekstual terhadap pertanyaan tentang mereka. Ini menggabungkan pemrosesan bahasa alami dan pemahaman visual. Dengan mode yang disempurnakan , Anda dapat menggunakan fitur Azure AI Vision untuk menghasilkan wawasan tambahan dari gambar.
- Jelajahi kemampuan GPT-4 Turbo dengan Vision dalam pengalaman tanpa kode menggunakan Azure OpenAI Playground. Pelajari selengkapnya di panduan Mulai Cepat.
- Peningkatan visi menggunakan GPT-4 Turbo dengan Visi sekarang tersedia di Azure OpenAI Playground dan mencakup dukungan untuk Pengenalan Karakter Optik, landasan objek, dukungan gambar untuk "tambahkan data Anda," dan dukungan untuk permintaan video.
- Lakukan panggilan ke API obrolan secara langsung menggunakan REST API.
- Ketersediaan wilayah saat ini terbatas pada
SwitzerlandNorth
,SwedenCentral
,WestUS
, danAustraliaEast
- Pelajari lebih lanjut tentang batasan GPT-4 Turbo yang diketahui dengan Visi dan pertanyaan umum lainnya.
November 2023
Dukungan sumber data baru di Azure OpenAI On Your Data
- Anda sekarang dapat menggunakan Azure Cosmos DB untuk MongoDB vCore dan URL/alamat web sebagai sumber data untuk menyerap data Anda dan mengobrol dengan model Azure OpenAI yang didukung.
Pratinjau GPT-4 Turbo & GPT-3.5-Turbo-1106 dirilis
Kedua model adalah rilis terbaru dari OpenAI dengan instruksi yang ditingkatkan berikut, mode JSON, output yang dapat direproduksi, dan panggilan fungsi paralel.
Pratinjau Turbo GPT-4 memiliki jendela konteks maksimum 128.000 token dan dapat menghasilkan 4.096 token output. Ini memiliki data pelatihan terbaru dengan pengetahuan hingga April 2023. Model ini dalam pratinjau dan tidak disarankan untuk penggunaan produksi. Semua penyebaran model pratinjau ini akan diperbarui secara otomatis setelah rilis stabil tersedia.
GPT-3.5-Turbo-1106 memiliki jendela konteks maksimum 16.385 token dan dapat menghasilkan 4.096 token output.
Untuk informasi tentang ketersediaan regional model, lihat halaman model.
Model memiliki alokasi kuota unik per wilayahnya sendiri.
Pratinjau publik DALL-E 3
DALL-E 3 adalah model pembuatan gambar terbaru dari OpenAI. Ini fitur kualitas gambar yang ditingkatkan, adegan yang lebih kompleks, dan peningkatan performa saat merender teks dalam gambar. Ini juga dilengkapi dengan lebih banyak opsi rasio aspek. DALL-E 3 tersedia melalui OpenAI Studio dan melalui REST API. Sumber daya OpenAI Anda harus berada di SwedenCentral
wilayah Azure.
DALL-E 3 mencakup penulisan ulang permintaan bawaan untuk meningkatkan gambar, mengurangi bias, dan meningkatkan variasi alami.
Cobalah DALL-E 3 dengan mengikuti mulai cepat.
AI yang Bertanggung Jawab
Konfigurasi pelanggan yang diperluas: Semua pelanggan Azure OpenAI sekarang dapat mengonfigurasi semua tingkat keparahan (rendah, sedang, tinggi) untuk kategori kebencian, kekerasan, seksual dan bahaya diri, termasuk hanya memfilter konten dengan tingkat keparahan tinggi. Mengonfigurasi filter konten
Kredensial Konten di semua model DALL-E: Gambar yang dihasilkan AI dari semua model DALL-E sekarang menyertakan kredensial digital yang mengungkapkan konten sebagai yang dihasilkan AI. Aplikasi yang menampilkan aset gambar dapat memanfaatkan SDK Inisiatif Keaslian Konten sumber terbuka untuk menampilkan kredensial dalam gambar yang dihasilkan AI mereka. Kredensial Konten di Azure OpenAI
Model RAI baru
- Deteksi risiko Jailbreak: Serangan Jailbreak adalah permintaan pengguna yang dirancang untuk memprovokasi model AI Generatif agar menunjukkan perilaku yang dilatih untuk menghindari atau melanggar aturan yang ditetapkan dalam Pesan Sistem. Model deteksi risiko jailbreak bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada permintaan pengguna.
- Teks materi yang dilindungi: Teks materi yang dilindungi menjelaskan konten teks yang diketahui (misalnya, lirik lagu, artikel, resep, dan konten web yang dipilih) yang dapat dihasilkan oleh model bahasa besar. Model teks material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.
- Kode material yang dilindungi: Kode material yang dilindungi menjelaskan kode sumber yang cocok dengan sekumpulan kode sumber dari repositori publik, yang dapat dihasilkan oleh model bahasa besar tanpa kutipan repositori sumber yang tepat. Model kode material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.
Daftar blokir: Pelanggan sekarang dapat dengan cepat menyesuaikan perilaku filter konten untuk permintaan dan penyelesaian lebih lanjut dengan membuat daftar blokir kustom di filter mereka. Daftar blokir kustom memungkinkan filter untuk mengambil tindakan pada daftar pola yang disesuaikan, seperti istilah tertentu atau pola regex. Selain daftar blokir kustom, kami menyediakan daftar blokir kata-kata kokoh Microsoft (Bahasa Inggris). Menggunakan daftar blokir
Oktober 2023
Model penyempurnaan baru (pratinjau)
gpt-35-turbo-0613
sekarang tersedia untuk penyempurnaan.babbage-002
dandavinci-002
sekarang tersedia untuk penyempurnaan. Model-model ini menggantikan model dasar warisan ada, babbage, curie, dan davinci yang sebelumnya tersedia untuk penyempurnaan.Ketersediaan penyempurnaan terbatas pada wilayah tertentu. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Model yang disempurnakan memiliki batas kuota yang berbeda dari model reguler.
Azure OpenAI Pada data Anda
- Parameter kustom baru untuk menentukan jumlah dokumen dan ketegasan yang diambil.
- Pengaturan ketat mengatur ambang batas untuk mengategorikan dokumen yang relevan dengan kueri Anda.
- Pengaturan dokumen yang diambil menentukan jumlah dokumen dengan skor teratas dari indeks data Anda yang digunakan untuk menghasilkan respons.
- Anda dapat melihat status penyerapan/pengunggahan data di Azure OpenAI Studio.
- Dukungan untuk titik akhir privat & VPN untuk kontainer blob.
September 2023
GPT-4
GPT-4 dan GPT-4-32k sekarang tersedia untuk semua pelanggan Azure OpenAI Service. Pelanggan tidak perlu lagi mengajukan daftar tunggu untuk menggunakan GPT-4 dan GPT-4-32k (persyaratan pendaftaran Akses Terbatas terus berlaku untuk semua model Azure OpenAI). Ketersediaan mungkin bervariasi menurut wilayah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
GPT-3.5 Instruksi Turbo
Azure OpenAI Service sekarang mendukung model GPT-3.5 Turbo Instruct. Model ini memiliki performa yang sebanding text-davinci-003
dengan dan tersedia untuk digunakan dengan API Penyelesaian. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Pratinjau publik bisikan
Azure OpenAI Service sekarang mendukung API ucapan ke teks yang didukung oleh model Whisper OpenAI. Dapatkan teks yang dihasilkan AI berdasarkan audio ucapan yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat.
Catatan
Azure AI Speech juga mendukung model Whisper OpenAI melalui API transkripsi batch. Untuk mempelajari lebih lanjut , lihat panduan Membuat transkripsi batch. Lihat Apa model Whisper? untuk mempelajari selengkapnya tentang kapan menggunakan Azure AI Speech vs. Azure OpenAI Service.
Wilayah Baru
- Azure OpenAI sekarang juga tersedia di wilayah Swedia Tengah, dan Swiss Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Batas kuota regional meningkat
- Meningkatkan ke batas kuota default maksimum untuk model dan wilayah tertentu. Memigrasikan beban kerja ke model dan wilayah ini akan memungkinkan Anda memanfaatkan Token per menit (TPM) yang lebih tinggi.
Agustus 2023
Azure OpenAI pada pembaruan data Anda sendiri (pratinjau)
- Anda sekarang dapat menyebarkan Azure OpenAI On Your Data ke Power Virtual Agents.
- Azure OpenAI On Your Data sekarang mendukung titik akhir privat.
- Kemampuan untuk memfilter akses ke dokumen sensitif.
- Refresh indeks Anda secara otomatis sesuai jadwal.
- Opsi pencarian vektor dan pencarian semantik.
- Menampilkan riwayat obrolan Anda di aplikasi web yang disebarkan
Juli 2023
Dukungan untuk panggilan fungsi
- Azure OpenAI sekarang mendukung panggilan fungsi untuk memungkinkan Anda bekerja dengan fungsi di API penyelesaian obrolan.
Menyematkan peningkatan array input
- Azure OpenAI sekarang mendukung array dengan hingga 16 input per permintaan API dengan text-embedding-ada-002 Versi 2.
Wilayah Baru
- Azure OpenAI sekarang juga tersedia di wilayah Kanada Timur, US Timur 2, Jepang Timur, dan US Tengah Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Juni 2023
Menggunakan Azure OpenAI pada data Anda sendiri (pratinjau)
- Azure OpenAI On Your Data sekarang tersedia dalam pratinjau, memungkinkan Anda untuk mengobrol dengan model OpenAI seperti GPT-35-Turbo dan GPT-4 dan menerima respons berdasarkan data Anda.
Versi baru model gpt-35-turbo dan gpt-4
- gpt-35-turbo (versi 0613)
- gpt-35-turbo-16k (versi 0613)
- gpt-4 (versi 0613)
- gpt-4-32k (versi 0613)
UK Selatan
- Azure OpenAI sekarang tersedia di wilayah Inggris Selatan. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Pemfilteran konten & anotasi (Pratinjau)
- Cara mengonfigurasi filter konten dengan Azure OpenAI Service.
- Aktifkan anotasi untuk melihat kategori pemfilteran konten dan informasi tingkat keparahan sebagai bagian dari panggilan Penyelesaian dan Penyelesaian Obrolan berbasis GPT Anda.
Kuota
- Kuota memberikan fleksibilitas untuk secara aktif mengelola alokasi batas tarif di seluruh penyebaran dalam langganan Anda.
Mei 2023
Dukungan Java & JavaScript SDK
- SDK pratinjau Azure OpenAI BARU menawarkan dukungan untuk JavaScript dan Java.
Ketersediaan Umum Penyelesaian Obrolan Azure OpenAI (GA)
- Dukungan ketersediaan umum untuk:
- Versi API
2023-05-15
Penyelesaian Obrolan . - Model GPT-35-Turbo.
- Seri model GPT-4.
- Versi API
Jika saat ini Anda menggunakan 2023-03-15-preview
API, sebaiknya migrasikan ke GA 2023-05-15
API. Jika saat ini Anda menggunakan versi 2022-12-01
API, API ini tetap ga, tetapi tidak menyertakan kemampuan Penyelesaian Obrolan terbaru.
Penting
Menggunakan versi model GPT-35-Turbo saat ini dengan titik akhir penyelesaian tetap dalam pratinjau.
Prancis Tengah
- Azure OpenAI sekarang tersedia di wilayah Prancis Tengah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
April 2023
Pratinjau publik DALL-E 2. Azure OpenAI Service sekarang mendukung API pembuatan gambar yang didukung oleh model DALL-E 2 OpenAI. Dapatkan gambar yang dihasilkan AI berdasarkan teks deskriptif yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat.
Penyebaran model yang disesuaikan yang tidak aktif sekarang akan dihapus setelah 15 hari; model akan tetap tersedia untuk penyebaran ulang. Jika model yang disesuaikan (disempurnakan) disebarkan selama lebih dari lima belas (15) hari di mana tidak ada penyelesaian atau panggilan penyelesaian obrolan yang dilakukan padanya, penyebaran akan secara otomatis dihapus (dan tidak ada biaya hosting lebih lanjut yang akan dikeluarkan untuk penyebaran tersebut). Model yang disesuaikan yang mendasar akan tetap tersedia dan dapat disebarkan ulang kapan saja. Untuk mempelajari selengkapnya, lihat artikel cara penggunaan.
Maret 2023
Model seri GPT-4 sekarang tersedia dalam pratinjau di Azure OpenAI. Untuk meminta akses, pelanggan Azure OpenAI yang ada dapat mendaftar dengan mengisi formulir ini. Model-model ini saat ini tersedia di wilayah US Timur dan US Tengah Selatan.
API Penyelesaian Obrolan Baru untuk model GPT-35-Turbo dan GPT-4 dirilis dalam pratinjau pada 3/21. Untuk mempelajari lebih lanjut, lihat artikel mulai cepat dan panduan yang diperbarui.
Pratinjau GPT-35-Turbo. Untuk mempelajari lebih lanjut , lihat artikel cara penggunaan.
Peningkatan batas pelatihan untuk penyempurnaan: Ukuran pekerjaan pelatihan maks (token dalam file pelatihan) x (# dari epoch) adalah 2 Miliar token untuk semua model. Kami juga telah meningkatkan pekerjaan pelatihan maks dari 120 menjadi 720 jam.
Menambahkan kasus penggunaan tambahan ke akses Anda yang sudah ada. Sebelumnya, proses untuk menambahkan kasus penggunaan baru mengharuskan pelanggan untuk menerapkan kembali ke layanan. Sekarang, kami merilis proses baru yang memungkinkan Anda menambahkan kasus penggunaan baru dengan cepat ke penggunaan layanan. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI. Pelanggan yang ada dapat membuktikan setiap dan semua kasus penggunaan baru di sini. Harap dicatat bahwa ini diperlukan kapan saja Anda ingin menggunakan layanan untuk kasus penggunaan baru yang awalnya tidak Anda ajukan.
Februari 2023
Fitur baru
- Sampel rilis | pratinjau .NET SDK(inferensi)
- Pembaruan Terraform SDK untuk mendukung operasi manajemen Azure OpenAI.
- Menyisipkan teks di akhir penyelesaian sekarang didukung dengan
suffix
parameter .
Pembaruan
- Pemfilteran konten aktif secara default.
Artikel baru tentang:
Kursus pelatihan baru:
Januari 2023
Fitur baru
Layanan GA. Layanan Azure OpenAI sekarang tersedia secara umum.
Model baru: Penambahan model teks terbaru, text-davinci-003 (US Timur, Eropa Barat), text-ada-embeddings-002 (US Timur, US Tengah Selatan, Eropa Barat)
Desember 2022
Fitur baru
Model terbaru dari OpenAI. Azure OpenAI menyediakan akses ke semua model terbaru termasuk seri GPT-3.5.
Versi API baru (2022-12-01). Pembaruan ini mencakup beberapa penyempurnaan yang diminta termasuk informasi penggunaan token dalam respons API, pesan kesalahan yang ditingkatkan untuk file, penyelarasan dengan OpenAI pada struktur data pembuatan penyempurnaan, dan dukungan untuk parameter akhiran untuk memungkinkan penamaan kustom pekerjaan yang disempurnakan.
Batas permintaan per detik yang lebih tinggi. 50 untuk model non-Davinci. 20 untuk model Davinci.
Penyebaran penyempurnaan yang lebih cepat. Sebarkan model Ada dan Curie yang disempurnakan dalam waktu kurang dari 10 menit.
Batas pelatihan yang lebih tinggi: Token pelatihan 40M untuk Ada, Babbage, dan Curie. 10M untuk Davinci.
Proses untuk meminta modifikasi pada penyalahgunaan & pengelogan data yang tidak digunakan & tinjauan manusia. Saat ini, layanan mencatat data permintaan/respons untuk tujuan penyalahgunaan dan penyalahgunaan deteksi untuk memastikan bahwa model yang kuat ini tidak disalahgunakan. Namun, banyak pelanggan memiliki persyaratan privasi dan keamanan data yang ketat yang memerlukan kontrol yang lebih besar atas data mereka. Untuk mendukung kasus penggunaan ini, kami merilis proses baru bagi pelanggan untuk mengubah kebijakan pemfilteran konten atau menonaktifkan pengelogan penyalahgunaan untuk kasus penggunaan berisiko rendah. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI dan pelanggan OpenAI yang ada dapat diterapkan di sini.
Enkripsi kunci yang dikelola pelanggan (CMK). CMK memberi pelanggan kontrol yang lebih besar atas pengelolaan data mereka di Azure OpenAI dengan menyediakan kunci enkripsi mereka sendiri yang digunakan untuk menyimpan data pelatihan dan model yang disesuaikan. Kunci yang dikelola pelanggan (CMK),juga dikenal sebagai Bring Your Own Key (BYOK), menawarkan fleksibilitas yang lebih luas untuk membuat, memutar, menonaktifkan, dan mencabut kontrol akses. Anda juga dapat mengaudit kunci enkripsi yang digunakan untuk melindungi data Anda. Pelajari lebih lanjut dari dokumentasi enkripsi saat tidak aktif.
Dukungan lockbox
Kepatuhan SOC-2
Pengelogan dan diagnostik melalui Pengaturan Azure Resource Health, Analisis Biaya, dan Metrik & Diagnostik.
Penyempurnaan studio. Banyak peningkatan kegunaan pada alur kerja Studio termasuk dukungan peran Azure ACTIVE Directory untuk mengontrol siapa di tim yang memiliki akses untuk membuat model dan penyebaran yang disempurnakan.
Perubahan (melanggar)
Permintaan API pembuatan penyempurnaan telah diperbarui agar sesuai dengan skema OpenAI.
Pratinjau versi API:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API versi 2022-12-01:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
Pemfilteran konten untuk sementara nonaktif secara default. Azure con mode tenda ration bekerja secara berbeda dari Azure OpenAI. Azure OpenAI menjalankan filter konten selama panggilan pembuatan untuk mendeteksi konten berbahaya atau kasar dan memfilternya dari respons. Pelajari lebih lanjut
Model-model ini akan diaktifkan kembali pada Q1 2023 dan aktif secara default.
Tindakan pelanggan
- Hubungi Dukungan Azure jika Anda ingin ini diaktifkan untuk langganan Anda.
- Terapkan untuk modifikasi pemfilteran, jika Anda ingin membuatnya tetap nonaktif. (Opsi ini hanya untuk kasus penggunaan berisiko rendah.)
Langkah berikutnya
Pelajari selengkapnya tentang model yang mendasari yang mendukung Azure OpenAI.