Apa yang baru di Azure OpenAI Service

Artikel
02/19/2025

Artikel ini menyediakan ringkasan rilis terbaru dan pembaruan dokumentasi utama untuk Azure OpenAI Service.

Februari 2025

Penyebaran standar zona data o3-mini

o3-mini sekarang tersedia untuk standar global, dan penyebaran standar zona data untuk pelanggan akses terbatas terdaftar. Wilayah penyebaran standar data saat ini hanya Amerika Serikat wilayah.

Untuk informasi selengkapnya, lihat panduan model penalaran kami.

audio mini gpt-4o dirilis

Model gpt-4o-mini-audio-preview (2024-12-17) adalah model penyelesaian audio terbaru. Untuk informasi selengkapnya, lihat mulai cepat pembuatan audio.

Model gpt-4o-mini-realtime-preview (2024-12-17) adalah model audio real time terbaru. Model real time menggunakan model audio GPT-4o yang mendasar yang sama dengan API penyelesaian, tetapi dioptimalkan untuk interaksi audio latensi rendah dan real-time. Untuk informasi selengkapnya, lihat mulai cepat audio real-time.

Untuk informasi selengkapnya tentang model yang tersedia, lihat dokumentasi model dan versi.

Januari 2025

o3-mini dirilis

o3-mini (2025-01-31) adalah model penalaran terbaru, menawarkan kemampuan penalaran yang ditingkatkan. Untuk informasi selengkapnya, lihat panduan model penalaran kami.

Penyelesaian audio GPT-4o

Model gpt-4o-audio-preview ini sekarang tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah. gpt-4o-audio-preview Gunakan model untuk pembuatan audio.

Model ini gpt-4o-audio-preview memperkenalkan modalitas audio ke dalam API yang ada /chat/completions . Model audio memperluas potensi aplikasi AI dalam interaksi teks dan berbasis suara dan analisis audio. Modalitas yang didukung dalam gpt-4o-audio-preview model meliputi: teks, audio, dan teks + audio. Untuk informasi selengkapnya, lihat mulai cepat pembuatan audio.

Catatan

API Realtime menggunakan model audio GPT-4o yang mendasari yang sama dengan API penyelesaian, tetapi dioptimalkan untuk interaksi audio latensi rendah dan real-time.

GPT-4o Realtime API 2024-12-17

Model gpt-4o-realtime-preview versi 2024-12-17 tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah. gpt-4o-realtime-preview Gunakan model versi 2024-12-17 alih-alih gpt-4o-realtime-preview model pratinjau versi 2024-10-01 untuk interaksi audio real time.

Menambahkan dukungan untuk penembolokan permintaan dengan gpt-4o-realtime-preview model.
Menambahkan dukungan untuk suara baru. Model gpt-4o-realtime-preview sekarang mendukung suara berikut: "alloy", "ash", "ballad", "coral", "echo", "sage", "shimmer", "verse".
Batas tarif tidak lagi didasarkan pada koneksi per menit. Pembatasan tarif sekarang didasarkan pada RPM (permintaan per menit) dan TPM (token per menit) untuk gpt-4o-realtime-preview model. Batas tarif untuk setiap gpt-4o-realtime-preview penyebaran model adalah 100K TPM dan 1K RPM. Selama pratinjau, portal dan API Azure AI Foundry mungkin secara tidak akurat menunjukkan batas laju yang berbeda. Bahkan jika Anda mencoba menetapkan batas tarif yang berbeda, batas tarif aktual adalah 100K TPM dan RPM 1K.

Untuk informasi selengkapnya, lihat mulai cepat audio real time GPT-4o dan panduan cara penggunaan.

Desember 2024

Model penalaran o1 dirilis untuk akses terbatas

Model terbaru o1 sekarang tersedia untuk akses API dan penyebaran model. Pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang sebelumnya menerapkan dan menerima akses ke o1-preview, tidak perlu menerapkan kembali karena mereka secara otomatis berada di daftar tunggu untuk model terbaru.

Meminta akses: aplikasi model akses terbatas

Untuk mempelajari selengkapnya tentang model seri lanjutan o1 lihat, mulai menggunakan model penalaran seri o1.

Ketersediaan wilayah

Model	Wilayah
`o1` (Versi: 2024-12-17)	US Timur2 (Standar Global) Swedia Tengah (Standar Global)

Penyempurnaan preferensi (pratinjau)

Pengoptimalan preferensi langsung (DPO) adalah teknik penyelarasan baru untuk model bahasa besar, yang dirancang untuk menyesuaikan bobot model berdasarkan preferensi manusia. Tidak seperti pembelajaran penguatan dari umpan balik manusia (RLHF), DPO tidak memerlukan pemasangan model hadiah dan menggunakan data yang lebih sederhana (preferensi biner) untuk pelatihan. Metode ini secara komputasi lebih ringan dan lebih cepat, membuatnya sama-sama efektif dalam penyelarasan sambil menjadi lebih efisien. DPO sangat berguna dalam skenario di mana elemen subjektif seperti nada, gaya, atau preferensi konten tertentu penting. Kami sangat senang mengumumkan pratinjau publik DPO di Azure OpenAI Service, dimulai dengan gpt-4o-2024-08-06 model.

Untuk menyempurnakan ketersediaan wilayah model, lihat halaman model.

Penyelesaian tersimpan & distilasi

Penyelesaian tersimpan memungkinkan Anda mengambil riwayat percakapan dari sesi penyelesaian obrolan untuk digunakan sebagai himpunan data untuk evaluasi dan penyempurnaan.

GPT-4o 2024-11-20

gpt-4o-2024-11-20 sekarang tersedia untuk penyebaran standar global di:

AS Timur
AS Timur 2
US Tengah Utara
US Tengah Selatan
AS Barat
AS Barat 3
Swedia Tengah

Jenis penyebaran yang disediakan zona data BARU

Penyebaran yang disediakan zona data tersedia di sumber daya Azure OpenAI yang sama dengan semua jenis penyebaran Azure OpenAI lainnya tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dalam zona data yang ditentukan Microsoft dengan ketersediaan terbaik untuk setiap permintaan. Penyebaran yang disediakan zona data menyediakan kapasitas pemrosesan model yang dipesan untuk throughput tinggi dan dapat diprediksi menggunakan infrastruktur Azure dalam zona data yang ditentukan Microsoft. Penyebaran yang disediakan zona data didukung pada gpt-4o-2024-08-06model , , gpt-4o-2024-05-13dan gpt-4o-mini-2024-07-18 .

Untuk informasi selengkapnya, lihat panduan jenis penyebaran.

November 2024

GA Penghalusan Visi

Penyempurnaan penglihatan dengan GPT-4o (2024-08-06) sekarang Tersedia Secara Umum (GA).

Penyempurnaan visi memungkinkan Anda menambahkan gambar ke data pelatihan JSONL Anda. Sama seperti Anda dapat mengirim satu atau banyak input gambar ke penyelesaian obrolan, Anda dapat menyertakan jenis pesan yang sama dalam data pelatihan Anda. Gambar dapat disediakan baik sebagai URL atau sebagai gambar yang dikodekan base64.

Untuk menyempurnakan ketersediaan wilayah model, lihat halaman model.

Pemantauan penyalahgunaan AI BARU

Kami memperkenalkan bentuk baru pemantauan penyalahgunaan yang memanfaatkan LLM untuk meningkatkan efisiensi deteksi penggunaan layanan Azure OpenAI yang berpotensi melecehkan dan untuk mengaktifkan pemantauan penyalahgunaan tanpa perlu meninjau permintaan dan penyelesaian manusia. Pelajari selengkapnya, lihat Pemantauan penyalahgunaan.

Permintaan dan penyelesaian yang ditandai melalui klasifikasi konten dan/atau diidentifikasi sebagai bagian dari pola penggunaan yang berpotensi melecehkan dikenakan proses peninjauan tambahan untuk membantu mengonfirmasi analisis sistem dan menginformasikan keputusan tindakan. Sistem pemantauan penyalahgunaan kami telah diperluas untuk mengaktifkan peninjauan oleh LLM secara default dan oleh manusia jika diperlukan dan sesuai.

Oktober 2024

Jenis penyebaran standar zona data BARU

Penyebaran standar zona data tersedia di sumber daya Azure OpenAI yang sama dengan semua jenis penyebaran Azure OpenAI lainnya tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dalam zona data yang ditentukan Microsoft dengan ketersediaan terbaik untuk setiap permintaan. Standar zona data menyediakan kuota default yang lebih tinggi daripada jenis penyebaran berbasis geografi Azure kami. Penyebaran standar zona data didukung pada gpt-4o-2024-08-06model , gpt-4o-2024-05-13, dan gpt-4o-mini-2024-07-18 .

Untuk informasi selengkapnya, lihat panduan jenis penyebaran.

Global Batch GA

Batch global Azure OpenAI sekarang tersedia secara umum.

Azure OpenAI Batch API dirancang untuk menangani tugas pemrosesan skala besar dan volume tinggi secara efisien. Proses grup permintaan asinkron dengan kuota terpisah, dengan penyelesaian target 24 jam, dengan biaya 50% lebih murah daripada standar global. Dengan pemrosesan batch, daripada mengirim satu permintaan pada satu waktu Anda mengirim sejumlah besar permintaan dalam satu file. Permintaan batch global memiliki kuota token antrean terpisah yang menghindari gangguan beban kerja online Anda.

Kasus penggunaan utama meliputi:

Pemrosesan Data Skala Besar: Menganalisis himpunan data yang luas secara paralel dengan cepat.
Pembuatan Konten: Membuat teks dalam volume besar, seperti deskripsi produk atau artikel.
Tinjauan dan Ringkasan Dokumen: Mengotomatiskan tinjauan dan ringkasan dokumen yang panjang.
Automasi Dukungan Pelanggan: Tangani banyak kueri secara bersamaan untuk respons yang lebih cepat.
Ekstraksi dan Analisis Data: Mengekstrak dan menganalisis informasi dari sejumlah besar data yang tidak terstruktur.
Tugas Pemrosesan Bahasa Alami (NLP): Lakukan tugas seperti analisis sentimen atau terjemahan pada himpunan data besar.
Pemasaran dan Personalisasi: Hasilkan konten dan rekomendasi yang dipersonalisasi dalam skala besar.

Untuk informasi selengkapnya tentang memulai penyebaran batch global.

Akses terbatas model o1-preview dan o1-mini

Model o1-preview dan o1-mini sekarang tersedia untuk akses API dan penyebaran model. Pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft.

Meminta akses: aplikasi model akses terbatas

Pelanggan yang sudah disetujui dan memiliki akses ke model melalui taman bermain akses awal tidak perlu diterapkan lagi, Anda akan secara otomatis diberikan akses API. Setelah akses diberikan, Anda harus membuat penyebaran untuk setiap model.

Dukungan API:

Dukungan untuk model seri o1 ditambahkan dalam versi 2024-09-01-previewAPI .

Parameter max_tokens telah ditolak dan diganti dengan parameter baru max_completion_tokens . Model seri o1 hanya akan berfungsi dengan max_completion_tokens parameter .

Ketersediaan wilayah:

Model tersedia untuk penyebaran standar dan global di US Timur2 dan Swedia Tengah untuk pelanggan yang disetujui.

API Realtime GPT-4o baru untuk pratinjau publik ucapan dan audio

Audio GPT-4o Azure OpenAI adalah bagian dari keluarga model GPT-4o yang mendukung interaksi percakapan latensi rendah, "ucapan masuk, ucapan keluar". API audio realtime GPT-4o dirancang untuk menangani interaksi percakapan latensi rendah real time, sehingga sangat cocok untuk kasus penggunaan yang melibatkan interaksi langsung antara pengguna dan model, seperti agen dukungan pelanggan, asisten suara, dan penerjemah real time.

Model gpt-4o-realtime-preview ini tersedia untuk penyebaran global di wilayah US Timur 2 dan Swedia Tengah.

Untuk informasi selengkapnya, lihat mulai cepat audio real time GPT-4o.

Pembaruan dukungan batch global

Batch global sekarang mendukung GPT-4o (2024-08-06). Lihat panduan memulai batch global untuk informasi selengkapnya.

September 2024

Pembaruan UX Azure OpenAI Studio

Mulai 19 September 2024, saat Anda membuka Azure OpenAI Studio , Anda tidak lagi melihat Azure OpenAI Studio warisan secara default. Jika diperlukan, Anda masih dapat kembali ke pengalaman sebelumnya dengan menggunakan tombol Alihkan ke tampilan lama di bilah atas UI selama beberapa minggu ke depan. Jika Anda beralih kembali ke portal Azure AI Foundry warisan, ini membantu jika Anda mengisi formulir umpan balik untuk memberi tahu kami alasannya. Kami secara aktif memantau umpan balik ini untuk meningkatkan pengalaman baru.

Penyebaran yang disediakan GPT-4o 2024-08-06

GPT-4o 2024-08-06 sekarang tersedia untuk penyebaran yang disediakan di US Timur, US Timur 2, US Tengah Utara, dan Swedia Tengah. Ini juga tersedia untuk penyebaran yang disediakan global.

Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.

Jenis penyebaran global baru yang disediakan

Penyebaran global tersedia di sumber daya Azure OpenAI yang sama dengan jenis penyebaran non-global tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dengan ketersediaan terbaik untuk setiap permintaan. Penyebaran global yang disediakan menyediakan kapasitas pemrosesan model yang dipesan untuk throughput tinggi dan dapat diprediksi menggunakan infrastruktur global Azure. Penyebaran global yang disediakan didukung pada gpt-4o-2024-08-06 model dan gpt-4o-mini-2024-07-18 .

Untuk informasi selengkapnya, lihat panduan jenis penyebaran.

Model o1-preview dan o1-mini baru tersedia untuk akses terbatas

Azure OpenAI o1-preview dan o1-mini model dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika dibandingkan dengan iterasi sebelumnya.

Kemampuan utama seri o1

Pembuatan Kode Kompleks: Mampu menghasilkan algoritma dan menangani tugas pengkodean tingkat lanjut untuk mendukung pengembang.
Pemecahan Masalah Tingkat Lanjut: Ideal untuk sesi curah otak yang komprehensif dan mengatasi tantangan multifaktor.
Perbandingan Dokumen Kompleks: Sempurna untuk menganalisis kontrak, file kasus, atau dokumen hukum untuk mengidentifikasi perbedaan yang halang.
Instruksi Mengikuti dan Manajemen Alur Kerja: Sangat efektif untuk mengelola alur kerja yang membutuhkan konteks yang lebih pendek.

Varian model

o1-preview: o1-preview adalah yang lebih mampu dari o1 model seri.
o1-mini: o1-mini adalah model seri yang o1 lebih cepat dan lebih murah.

Versi model: 2024-09-12

Meminta akses: aplikasi model akses terbatas

Batasan

Model o1 seri saat ini dalam pratinjau dan tidak menyertakan beberapa fitur yang tersedia dalam model lain, seperti pemahaman gambar dan output terstruktur yang tersedia dalam model GPT-4o terbaru. Untuk banyak tugas, model GPT-4o yang tersedia secara umum mungkin masih lebih cocok.

Keamanan

OpenAI telah memasukkan langkah-langkah keamanan tambahan ke dalam o1 model, termasuk teknik baru untuk membantu model menolak permintaan yang tidak aman. Kemajuan ini membuat o1 seri beberapa model paling kuat tersedia.

Ketersediaan

o1-preview dan o1-mini tersedia di wilayah US Timur2 untuk akses terbatas melalui portal Azure AI Foundry taman bermain akses awal. Pemrosesan data untuk o1 model mungkin terjadi di wilayah yang berbeda dari tempat model tersedia untuk digunakan.

Untuk mencoba o1-preview model dan o1-mini dalam pendaftaran taman bermain akses awal diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan Microsoft.

Meminta akses: aplikasi model akses terbatas

Setelah akses diberikan, Anda harus:

Navigasi ke https://ai.azure.com/resources dan pilih sumber daya di wilayah tersebut eastus2 . Jika Anda tidak memiliki sumber daya Azure OpenAI di wilayah ini, Anda harus membuatnya.
eastus2 Setelah sumber daya Azure OpenAI dipilih, di panel kiri atas di bawah Playgrounds pilih Taman bermain akses awal (pratinjau).

Agustus 2024

Output terstruktur GPT-4o 2024-08-06

Tersedia untuk penyebaran standar dan global di semua wilayah AS dan Swedia Tengah.
Model ini menambahkan dukungan untuk output terstruktur.

Penyebaran yang disediakan mini GPT-4o

GPT-4o mini sekarang tersedia untuk penyebaran yang disediakan di Kanada Timur, AS Timur, US Timur2, US Tengah Utara, dan Swedia Tengah.

Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.

Penyempurnaan GPT-4o (Pratinjau Umum)

Penyempurnaan GPT-4o sekarang tersedia untuk Azure OpenAI dalam pratinjau publik di US Tengah Utara dan Swedia Tengah.

Untuk mengetahui informasi selengkapnya, lihat posting blog kami.

Rilis API pratinjau baru

Versi 2024-07-01-preview API adalah rilis API penulisan &inferensi dataplane terbaru. Ini menggantikan versi 2024-05-01-preview API dan menambahkan dukungan untuk:

Dukungan API Batch ditambahkan
Parameter strategi potongan penyimpanan vektor
max_num_results bahwa alat pencarian file harus menghasilkan.

Untuk informasi selengkapnya, lihat dokumentasi referensi kami

Ketersediaan regional mini GPT-4o

GPT-4o mini tersedia untuk penyebaran standar dan global di wilayah US Timur dan Swedia Tengah.
GPT-4o mini tersedia untuk penyebaran batch global di wilayah US Timur, Swedia Tengah, dan US Barat.

Panduan evaluasi

Posting blog baru tentang memulai evaluasi model. Sebaiknya gunakan panduan ini sebagai bagian dari proses peningkatan dan penghentian model.

Model GPT-4o terbaru tersedia di taman bermain akses awal (pratinjau)

Pada 6 Agustus 2024, OpenAI mengumumkan versi terbaru dari versi 2024-08-06model GPT-4o andalan mereka . GPT-4o 2024-08-06 memiliki semua kemampuan versi sebelumnya serta:

Kemampuan yang ditingkatkan untuk mendukung output terstruktur yang kompleks.
Token output maks telah ditingkatkan dari 4.096 menjadi 16.384.

Pelanggan Azure dapat menguji GPT-4o 2024-08-06 hari ini di taman bermain akses awal Azure AI Foundry baru (pratinjau).

Tidak seperti taman bermain akses awal sebelumnya, taman bermain akses awal portal Azure AI Foundry (pratinjau) tidak mengharuskan Anda memiliki sumber daya di wilayah tertentu.

Catatan

Perintah dan penyelesaian yang dilakukan melalui taman bermain akses awal (pratinjau) mungkin diproses di wilayah Azure OpenAI mana pun, dan saat ini tunduk pada batas langganan 10 permintaan per menit per Azure. Batas ini mungkin berubah di masa mendatang.

Pemantauan penyalahgunaan Layanan Azure OpenAI diaktifkan untuk semua pengguna playground akses awal bahkan jika disetujui untuk modifikasi; filter konten default diaktifkan dan tidak dapat dimodifikasi.

Untuk menguji GPT-4o2024-08-06, masuk ke taman bermain akses awal Azure AI (pratinjau) menggunakan tautan ini.

Penyebaran batch global sekarang tersedia

Kasus penggunaan utama meliputi:

Pemrosesan Data Skala Besar: Menganalisis himpunan data yang luas secara paralel dengan cepat.
Pembuatan Konten: Membuat teks dalam volume besar, seperti deskripsi produk atau artikel.
Tinjauan dan Ringkasan Dokumen: Mengotomatiskan tinjauan dan ringkasan dokumen yang panjang.
Automasi Dukungan Pelanggan: Tangani banyak kueri secara bersamaan untuk respons yang lebih cepat.
Ekstraksi dan Analisis Data: Mengekstrak dan menganalisis informasi dari sejumlah besar data yang tidak terstruktur.
Tugas Pemrosesan Bahasa Alami (NLP): Lakukan tugas seperti analisis sentimen atau terjemahan pada himpunan data besar.
Pemasaran dan Personalisasi: Hasilkan konten dan rekomendasi yang dipersonalisasi dalam skala besar.

Untuk informasi selengkapnya tentang memulai penyebaran batch global.

Juli 2024

GPT-4o mini sekarang tersedia untuk penyempurnaan

Penyempurnaan mini GPT-4o sekarang tersedia dalam pratinjau publik di Swedia Tengah dan di US Tengah Utara.

Alat Pencarian File Asisten sekarang ditagih

Alat pencarian file untuk Asisten sekarang memiliki biaya tambahan untuk penggunaan. Lihat halaman harga untuk informasi selengkapnya.

Model mini GPT-4o tersedia untuk penyebaran

GPT-4o mini adalah model Azure OpenAI terbaru yang pertama kali diumumkan pada 18 Juli 2024:

"GPT-4o mini memungkinkan pelanggan untuk memberikan aplikasi yang menakjubkan dengan biaya lebih rendah dengan kecepatan blazing. GPT-4o mini secara signifikan lebih pintar daripada GPT-3.5 Turbo—mencetak 82% pada Mengukur Pemahaman Bahasa Multitask Masif (MMLU) dibandingkan dengan 70%—dan lebih dari 60% lebih murah.1 Model ini memberikan jendela konteks 128K yang diperluas dan mengintegrasikan kemampuan multibahasa GPT-4o yang ditingkatkan, membawa kualitas yang lebih besar ke bahasa dari seluruh dunia."

Model ini saat ini tersedia untuk penyebaran standar dan global di wilayah US Timur.

Untuk informasi tentang kuota model, lihat halaman kuota dan batasan dan untuk informasi terbaru tentang ketersediaan model, lihat halaman model.

Kebijakan pemfilteran konten default AI yang Bertanggung Jawab Baru

Kebijakan DefaultV2 pemfilteran konten default baru memberikan mitigasi keamanan dan keselamatan terbaru untuk seri model GPT (teks), termasuk:

Prompt Shields untuk serangan jailbreak pada permintaan pengguna (filter),
Deteksi bahan yang dilindungi untuk teks (filter) pada penyelesaian model
Deteksi material yang dilindungi untuk kode (anotasi) pada penyelesaian model

Meskipun tidak ada perubahan pada filter konten untuk sumber daya dan penyebaran yang ada (konfigurasi pemfilteran konten default atau kustom tetap tidak berubah), sumber daya baru dan penyebaran GPT akan secara otomatis mewarisi kebijakan DefaultV2pemfilteran konten baru . Pelanggan memiliki opsi untuk beralih di antara default keamanan dan membuat konfigurasi pemfilteran konten kustom.

Lihat dokumentasi Kebijakan keselamatan default kami untuk informasi selengkapnya.

Rilis GA API baru

Versi 2024-06-01 API adalah rilis API inferensi sarana data GA terbaru. Ini menggantikan versi 2024-02-01 API dan menambahkan dukungan untuk:

penyematan encoding_format & dimensions parameter.
penyelesaian logprobs obrolan & top_logprobs parameter.

Lihat dokumentasi referensi inferensi sarana data kami untuk informasi selengkapnya.

Perluasan wilayah yang tersedia untuk penyebaran standar global gpt-4o

GPT-4o sekarang tersedia untuk penyebaran standar global di:

australiaeast
brazilsouth
canadaeast
eastus
eastus2
francecentral git
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
polandcentral
southafricanorth
southcentralus
southindia
swedencentral
switzerlandnorth
uksouth
westeurope
westus
westus3

Untuk informasi tentang kuota standar global, lihat halaman kuota dan batasan.

Juni 2024

Pembaruan tanggal penghentian

Tanggal penghentian 0301 yang diperbarui gpt-35-turbo menjadi tidak lebih awal dari 1 Oktober 2024.
Diperbarui gpt-35-turbo & gpt-35-turbo-16k0613 tanggal penghentian hingga 1 Oktober 2024.
Diperbarui gpt-4 & gpt-4-32k 0314 tanggal penghentian hingga 1 Oktober 2024, dan tanggal penghentian menjadi 6 Juni 2025.

Lihat panduan penghentian model kami untuk informasi terbaru tentang penghentian dan penghentian model.

Penagihan berbasis token untuk penyempurnaan

Penagihan penyempurnaan Azure OpenAI sekarang didasarkan pada jumlah token dalam file pelatihan Anda - alih-alih total waktu pelatihan yang berlalu. Ini dapat mengakibatkan pengurangan biaya yang signifikan untuk beberapa eksekusi pelatihan, dan membuat memperkirakan biaya penyempurnaan jauh lebih mudah. Untuk mempelajari lebih lanjut, Anda dapat berkonsultasi dengan pengumuman resmi.

GPT-4o dirilis di wilayah baru

GPT-4o sekarang juga tersedia di:
- Swedia Tengah untuk penyebaran regional standar.
- Australia Timur, Kanada Timur, Jepang Timur, Korea Tengah, Swedia Tengah, Swiss Utara, & US Barat 3 untuk penyebaran yang disediakan.

Untuk informasi terbaru tentang ketersediaan model, lihat halaman model.

Dukungan kunci yang dikelola pelanggan (CMK) untuk Asisten

Utas dan File di Asisten sekarang mendukung CMK di wilayah berikut:

AS Barat 3

Mei 2024

Penyebaran yang disediakan GPT-4o

gpt-4o Versi: 2024-05-13 tersedia untuk penyebaran standar dan yang disediakan. Penyebaran model yang disediakan dan standar menerima permintaan inferensi teks dan gambar/penglihatan. Untuk informasi tentang ketersediaan regional model, lihat matriks model untuk penyebaran yang disediakan.

Asisten v2 (pratinjau)

Refresh Assistants API sekarang tersedia untuk umum. Ini berisi pembaruan berikut:

Alat pencarian file dan penyimpanan vektor
Penyelesaian maksimum dan dukungan token prompt maks untuk mengelola penggunaan token.
tool_choice parameter untuk memaksa Asisten menggunakan alat tertentu. Anda sekarang dapat membuat pesan dengan peran asisten untuk membuat riwayat percakapan kustom di Utas.
Dukungan untuk temperatureparameter , top_p, response_format.
Dukungan streaming dan polling. Anda dapat menggunakan fungsi pembantu di Python SDK kami untuk membuat respons eksekusi dan streaming. Kami juga telah menambahkan pembantu SDK polling untuk berbagi pembaruan status objek tanpa perlu polling.
Bereksperimen dengan Logic Apps dan Function Calling menggunakan Azure OpenAI Studio. Impor REST API Anda yang diterapkan di Logic Apps sebagai fungsi dan studio memanggil fungsi (sebagai alur kerja Logic Apps) secara otomatis berdasarkan permintaan pengguna.
AutoGen by Microsoft Research menyediakan kerangka kerja percakapan multi-agen untuk memungkinkan pembuatan alur kerja Model Bahasa Besar (LLM) yang nyaman di berbagai aplikasi. Asisten Azure OpenAI sekarang diintegrasikan ke dalam AutoGen melalui GPTAssistantAgent, agen eksperimental baru yang memungkinkan Anda menambahkan Asisten dengan mulus ke dalam alur kerja multi-agen berbasis AutoGen. Ini memungkinkan beberapa asisten Azure OpenAI yang dapat menjadi tugas atau domain khusus untuk berkolaborasi dan mengatasi tugas yang kompleks.
Dukungan untuk model yang disempurnakan gpt-3.5-turbo-0125di wilayah berikut:
- AS Timur 2
- Swedia Tengah
Dukungan regional yang diperluas untuk:
- Jepang Timur
- UK Selatan
- US Barat
- AS Barat 3
- Norwegia timur

Untuk informasi selengkapnya, lihat posting blog tentang asisten.

Ketersediaan umum model GPT-4o (GA)

GPT-4o ("o adalah untuk "omni") adalah model terbaru dari OpenAI yang diluncurkan pada 13 Mei 2024.

GPT-4o mengintegrasikan teks, dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer.
GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi, menetapkan tolok ukur baru untuk kemampuan AI.

Untuk informasi tentang ketersediaan regional model, lihat halaman model.

Jenis penyebaran standar global (pratinjau)

Penyebaran global tersedia di sumber daya Azure OpenAI yang sama dengan penawaran non-global tetapi memungkinkan Anda memanfaatkan infrastruktur global Azure untuk merutekan lalu lintas secara dinamis ke pusat data dengan ketersediaan terbaik untuk setiap permintaan. Standar global menyediakan kuota default tertinggi untuk model baru dan menghilangkan kebutuhan untuk memuat keseimbangan di beberapa sumber daya.

Untuk informasi selengkapnya, lihat panduan jenis penyebaran.

Menyempurnakan pembaruan

Penyempurnaan GPT-4 sekarang tersedia dalam pratinjau publik.
Menambahkan dukungan untuk benih, peristiwa, statistik validasi penuh, dan titik pemeriksaan sebagai bagian 2024-05-01-preview dari rilis API.

Filter konten DALL-E dan GPT-4 Turbo Vision GA yang dapat dikonfigurasi

Buat filter konten kustom untuk penyebaran DALL-E 2 dan 3, GPT-4 Turbo dengan Vision GA (turbo-2024-04-09), dan GPT-4o Anda. Pemfilteran konten

Filter Asinkron tersedia untuk semua pelanggan Azure OpenAI

Menjalankan filter secara asinkron untuk meningkatkan latensi dalam skenario streaming sekarang tersedia untuk semua pelanggan Azure OpenAI. Pemfilteran konten

Prompt Shields

Prompt Shields melindungi aplikasi yang didukung oleh model Azure OpenAI dari dua jenis serangan: serangan langsung (jailbreak) dan tidak langsung. Serangan Tidak Langsung (juga dikenal sebagai Serangan Prompt Tidak Langsung atau Serangan Injeksi Prompt Lintas Domain) adalah jenis serangan pada sistem yang didukung oleh model AI Generatif yang mungkin terjadi ketika aplikasi memproses informasi yang tidak secara langsung ditulis oleh pengembang aplikasi atau pengguna. Pemfilteran konten

Rilis API pratinjau 05-01-2024

Untuk informasi selengkapnya, lihat siklus hidup versi API.

Ketersediaan umum model GPT-4 Turbo (GA)

Rilis GA terbaru dari GPT-4 Turbo adalah:

gpt-4 Versi:turbo-2024-04-09

Ini adalah pengganti untuk model pratinjau berikut:

gpt-4 Versi:1106-Preview
gpt-4 Versi:0125-Preview
gpt-4 Versi:vision-preview

Perbedaan antara OpenAI dan Azure OpenAI GPT-4 Turbo GA Model

Versi OpenAI dari model turbo terbaru 0409 mendukung mode JSON dan panggilan fungsi untuk semua permintaan inferensi.
Versi turbo-2024-04-09 Terbaru Azure OpenAI saat ini tidak mendukung penggunaan mode JSON dan panggilan fungsi saat membuat permintaan inferensi dengan input gambar (visi). Permintaan input berbasis teks (permintaan tanpa image_url dan gambar sebaris) mendukung mode JSON dan panggilan fungsi.

Perbedaan dari gpt-4 vision-preview

Integrasi peningkatan Visi khusus Azure AI dengan GPT-4 Turbo dengan Visi tidak didukung untuk gpt-4 Versi:turbo-2024-04-09. Ini termasuk Pengenalan Karakter Optik (OCR), landasan objek, permintaan video, dan peningkatan penanganan data Anda dengan gambar.

Penting

Fitur pratinjau peningkatan visi termasuk Optical Character Recognition (OCR), object grounding, perintah video akan dihentikan dan tidak lagi tersedia setelah gpt-4 Versi: vision-preview ditingkatkan ke turbo-2024-04-09. Jika saat ini Anda mengandalkan salah satu fitur pratinjau ini, peningkatan model otomatis ini akan menjadi perubahan yang melanggar.

Ketersediaan terkelola yang disediakan GPT-4 Turbo

gpt-4 Versi:turbo-2024-04-09 tersedia untuk penyebaran standar dan yang disediakan. Saat ini versi yang disediakan dari model ini tidak mendukung permintaan inferensi gambar/penglihatan. Penyebaran yang disediakan dari model ini hanya menerima input teks. Penyebaran model standar menerima permintaan inferensi teks dan gambar/visi.

Menyebarkan GPT-4 Turbo dengan Vision GA

Untuk menyebarkan model GA dari portal Azure AI Foundry, pilih GPT-4 lalu pilih turbo-2024-04-09 versi dari menu dropdown. Kuota default untuk gpt-4-turbo-2024-04-09 model akan sama dengan kuota saat ini untuk GPT-4-Turbo. Lihat batas kuota regional.

April 2024

Penyempurnaan sekarang didukung di dua wilayah baru US Timur 2 dan Swiss Barat

Penyempurnaan sekarang tersedia dengan dukungan untuk:

AS Timur 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Swiss Barat

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Periksa halaman model, untuk informasi terbaru tentang ketersediaan model dan dukungan penyempurnaan di setiap wilayah.

Contoh pelatihan obrolan multi-giliran

Penyempurnaan sekarang mendukung contoh pelatihan obrolan multi-giliran.

GPT-4 (0125) tersedia untuk Azure OpenAI On Your Data

Anda sekarang dapat menggunakan model GPT-4 (0125) di wilayah yang tersedia dengan Azure OpenAI On Your Data.

Maret 2024

Risiko & Pemantauan keamanan di Azure OpenAI Studio

Azure OpenAI Studio sekarang menyediakan dasbor Risks & Safety untuk setiap penyebaran Anda yang menggunakan konfigurasi filter konten. Gunakan untuk memeriksa hasil aktivitas pemfilteran. Kemudian Anda dapat menyesuaikan konfigurasi filter untuk melayani kebutuhan bisnis Anda dengan lebih baik dan memenuhi prinsip AI yang Bertanggung Jawab.

Gunakan Risiko & Pemantauan keamanan

Pembaruan Azure OpenAI On Your Data

Anda sekarang dapat menyambungkan ke database vektor Elasticsearch untuk digunakan dengan Azure OpenAI On Your Data.
Anda dapat menggunakan parameter ukuran gugus selama penyerapan data untuk mengatur jumlah maksimum token dari potongan data tertentu dalam indeks Anda.

API ketersediaan umum (GA) 2024-02-01 dirilis

Ini adalah rilis GA API terbaru dan merupakan pengganti rilis GA sebelumnya 2023-05-15 . Rilis ini menambahkan dukungan untuk fitur Azure OpenAI GA terbaru seperti Whisper, DALLE-3, fine-tuning, pada data Anda, dan banyak lagi.

Fitur yang ada dalam pratinjau seperti Asisten, teks ke ucapan (TTS), dan beberapa sumber data "pada data Anda", memerlukan versi API pratinjau. Untuk informasi selengkapnya, lihat panduan siklus hidup versi API kami.

Ketersediaan umum bisikan (GA)

Model Ucapan ke teks Berbisik sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.

Cobalah Whisper dengan mengikuti mulai cepat.

Ketersediaan umum DALL-E 3 (GA)

Model pembuatan gambar DALL-E 3 sekarang menjadi GA untuk REST dan Python. SDK pustaka klien saat ini masih dalam pratinjau publik.

Cobalah DALL-E 3 dengan mengikuti mulai cepat.

Dukungan regional baru untuk DALL-E 3

Anda sekarang dapat mengakses DALL-E 3 dengan sumber daya Azure OpenAI di East US wilayah atau AustraliaEast Azure, selain SwedenCentral.

Penghentian dan penghentian model

Kami telah menambahkan halaman untuk melacak penghentian dan penghentian model di Azure OpenAI Service. Halaman ini menyediakan informasi tentang model yang saat ini tersedia, tidak digunakan lagi, dan dihentikan.

API pratinjau 03-03-2024 dirilis

2024-03-01-preview memiliki semua fungsionalitas yang sama dengan 2024-02-15-preview dan menambahkan dua parameter baru untuk penyematan:

encoding_format memungkinkan Anda menentukan format untuk menghasilkan penyematan di float, atau base64. Default adalah float.
dimensions memungkinkan Anda mengatur jumlah penyematan output. Parameter ini hanya didukung dengan model penyematan generasi ketiga baru: text-embedding-3-large, text-embedding-3-small. Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade.

Jika saat ini Anda menggunakan versi API pratinjau untuk memanfaatkan fitur terbaru, sebaiknya konsultasikan dengan artikel siklus hidup versi API untuk melacak berapa lama versi API Anda saat ini akan didukung.

Memperbarui ke paket peningkatan Pratinjau GPT-4-1106

Peningkatan penyebaran gpt-4 Pratinjau 1106 ke gpt-4 Pratinjau 0125 yang dijadwalkan pada 8 Maret 2024 tidak lagi berlangsung. Penyebaran gpt-4 versi 1106-Preview dan 0125-Preview diatur ke "Pembaruan otomatis ke default" dan "Tingkatkan ketika kedaluwarsa" akan mulai ditingkatkan setelah versi stabil model dirilis.

Untuk informasi selengkapnya tentang proses peningkatan, lihat halaman model.

Februari 2024

Model GPT-3.5-turbo-0125 tersedia

Model ini memiliki berbagai peningkatan, termasuk akurasi yang lebih tinggi dalam merespons dalam format yang diminta dan perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi bahasa non-bahasa Inggris.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Model penyematan generasi ketiga tersedia

text-embedding-3-large
text-embedding-3-small

Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa yang lebih baik untuk tugas bahasa Inggris dengan tolok ukur MTEB daripada model text-embedding-ada-002 generasi kedua.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Konsolidasi kuota GPT-3.5 Turbo

Untuk menyederhanakan migrasi antara berbagai versi model GPT-3.5-Turbo (termasuk 16k), kami akan mengonsolidasikan semua kuota GPT-3.5-Turbo ke dalam satu nilai kuota.

Setiap pelanggan yang telah meningkatkan kuota yang disetujui akan memiliki total kuota gabungan yang mencerminkan peningkatan sebelumnya.
Setiap pelanggan yang total penggunaannya saat ini di seluruh versi model kurang dari default akan mendapatkan total kuota gabungan baru secara default.

Model pratinjau GPT-4-0125 tersedia

Versi gpt-40125-preview model sekarang tersedia di Azure OpenAI Service di wilayah US Timur, US Tengah Utara, dan US Tengah Selatan. Pelanggan dengan penyebaran gpt-4 versi 1106-preview akan secara otomatis ditingkatkan ke 0125-preview dalam beberapa minggu mendatang.

Untuk informasi tentang ketersediaan dan peningkatan regional model, lihat halaman model.

Pratinjau publik ASSISTANTS API

Azure OpenAI sekarang mendukung API yang mendukung GPM OpenAI. Asisten Azure OpenAI (Pratinjau) memungkinkan Anda membuat asisten AI yang disesuaikan dengan kebutuhan Anda melalui instruksi kustom dan alat tingkat lanjut seperti penerjemah kode, dan fungsi kustom. Untuk mempelajari selengkapnya, lihat:

Pratinjau publik teks openAI ke suara ucapan

Azure OpenAI Service sekarang mendukung API teks ke ucapan dengan suara OpenAI. Dapatkan ucapan yang dihasilkan AI dari teks yang Anda berikan. Untuk mempelajari selengkapnya, lihat panduan gambaran umum dan coba mulai cepat.

Catatan

Azure AI Speech juga mendukung teks OpenAI ke suara ucapan. Untuk mempelajari selengkapnya, lihat Teks OpenAI ke suara ucapan melalui Azure OpenAI Service atau melalui panduan Azure AI Speech .

Kemampuan penyempurnaan dan dukungan model baru

Dukungan regional baru untuk Azure OpenAI On Your Data

Sekarang Anda dapat menggunakan Azure OpenAI On Your Data di wilayah Azure berikut:

Afrika Selatan Utara

Ketersediaan umum Azure OpenAI On Your Data

Azure OpenAI On Your Data sekarang tersedia secara umum.

Desember 2023

Azure OpenAI Pada data Anda

Dukungan VPN lengkap dan titik akhir privat untuk Azure OpenAI On Your Data, termasuk dukungan keamanan untuk: akun penyimpanan, sumber daya Azure OpenAI, dan sumber daya Azure AI layanan Pencarian.
Artikel baru untuk menggunakan konfigurasi Azure OpenAI On Your Data dengan melindungi data dengan jaringan virtual dan titik akhir privat.

GPT-4 Turbo dengan Visi sekarang tersedia

GPT-4 Turbo dengan Visi di layanan Azure OpenAI sekarang dalam pratinjau publik. GPT-4 Turbo with Vision adalah model multimodal besar (LMM) yang dikembangkan oleh OpenAI yang dapat menganalisis gambar dan memberikan respons tekstual terhadap pertanyaan tentang mereka. Ini menggabungkan pemrosesan bahasa alami dan pemahaman visual. Dengan mode yang disempurnakan , Anda dapat menggunakan fitur Azure AI Vision untuk menghasilkan wawasan tambahan dari gambar.

Jelajahi kemampuan GPT-4 Turbo dengan Vision dalam pengalaman tanpa kode menggunakan Azure OpenAI Playground. Pelajari selengkapnya di panduan Mulai Cepat.
Peningkatan visi menggunakan GPT-4 Turbo dengan Visi sekarang tersedia di Azure OpenAI Playground dan mencakup dukungan untuk Pengenalan Karakter Optik, landasan objek, dukungan gambar untuk "tambahkan data Anda," dan dukungan untuk permintaan video.
Lakukan panggilan ke API obrolan secara langsung menggunakan REST API.
Ketersediaan wilayah saat ini terbatas pada SwitzerlandNorth, SwedenCentral, WestUS, dan AustraliaEast
Pelajari lebih lanjut tentang batasan GPT-4 Turbo yang diketahui dengan Visi dan pertanyaan umum lainnya.

November 2023

Dukungan sumber data baru di Azure OpenAI On Your Data

Anda sekarang dapat menggunakan Azure Cosmos DB untuk MongoDB vCore dan URL/alamat web sebagai sumber data untuk menyerap data Anda dan mengobrol dengan model Azure OpenAI yang didukung.

Pratinjau GPT-4 Turbo & GPT-3.5-Turbo-1106 dirilis

Kedua model adalah rilis terbaru dari OpenAI dengan instruksi yang ditingkatkan berikut, mode JSON, output yang dapat direproduksi, dan panggilan fungsi paralel.

Pratinjau Turbo GPT-4 memiliki jendela konteks maksimum 128.000 token dan dapat menghasilkan 4.096 token output. Ini memiliki data pelatihan terbaru dengan pengetahuan hingga April 2023. Model ini dalam pratinjau dan tidak disarankan untuk penggunaan produksi. Semua penyebaran model pratinjau ini akan diperbarui secara otomatis setelah rilis stabil tersedia.
GPT-3.5-Turbo-1106 memiliki jendela konteks maksimum 16.385 token dan dapat menghasilkan 4.096 token output.

Untuk informasi tentang ketersediaan regional model, lihat halaman model.

Model memiliki alokasi kuota unik per wilayahnya sendiri.

Pratinjau publik DALL-E 3

DALL-E 3 adalah model pembuatan gambar terbaru dari OpenAI. Ini fitur kualitas gambar yang ditingkatkan, adegan yang lebih kompleks, dan peningkatan performa saat merender teks dalam gambar. Ini juga dilengkapi dengan lebih banyak opsi rasio aspek. DALL-E 3 tersedia melalui OpenAI Studio dan melalui REST API. Sumber daya OpenAI Anda harus berada di SwedenCentral wilayah Azure.

DALL-E 3 mencakup penulisan ulang permintaan bawaan untuk meningkatkan gambar, mengurangi bias, dan meningkatkan variasi alami.

Cobalah DALL-E 3 dengan mengikuti mulai cepat.

AI yang Bertanggung Jawab

Konfigurasi pelanggan yang diperluas: Semua pelanggan Azure OpenAI sekarang dapat mengonfigurasi semua tingkat keparahan (rendah, sedang, tinggi) untuk kategori kebencian, kekerasan, seksual dan bahaya diri, termasuk hanya memfilter konten dengan tingkat keparahan tinggi. Mengonfigurasi filter konten
Kredensial Konten di semua model DALL-E: Gambar yang dihasilkan AI dari semua model DALL-E sekarang menyertakan kredensial digital yang mengungkapkan konten sebagai yang dihasilkan AI. Aplikasi yang menampilkan aset gambar dapat memanfaatkan SDK Inisiatif Keaslian Konten sumber terbuka untuk menampilkan kredensial dalam gambar yang dihasilkan AI mereka. Kredensial Konten di Azure OpenAI
Model RAI baru
- Deteksi risiko Jailbreak: Serangan Jailbreak adalah permintaan pengguna yang dirancang untuk memprovokasi model AI Generatif agar menunjukkan perilaku yang dilatih untuk menghindari atau melanggar aturan yang ditetapkan dalam Pesan Sistem. Model deteksi risiko jailbreak bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada permintaan pengguna.
- Teks materi yang dilindungi: Teks materi yang dilindungi menjelaskan konten teks yang diketahui (misalnya, lirik lagu, artikel, resep, dan konten web yang dipilih) yang dapat dihasilkan oleh model bahasa besar. Model teks material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.
- Kode material yang dilindungi: Kode material yang dilindungi menjelaskan kode sumber yang cocok dengan sekumpulan kode sumber dari repositori publik, yang dapat dihasilkan oleh model bahasa besar tanpa kutipan repositori sumber yang tepat. Model kode material yang dilindungi bersifat opsional (default nonaktif), dan tersedia dalam model anotasi dan filter. Ini berjalan pada penyelesaian LLM.
Mengonfigurasi filter konten
Daftar blokir: Pelanggan sekarang dapat dengan cepat menyesuaikan perilaku filter konten untuk permintaan dan penyelesaian lebih lanjut dengan membuat daftar blokir kustom di filter mereka. Daftar blokir kustom memungkinkan filter untuk mengambil tindakan pada daftar pola yang disesuaikan, seperti istilah tertentu atau pola regex. Selain daftar blokir kustom, kami menyediakan daftar blokir kata-kata kokoh Microsoft (Bahasa Inggris). Menggunakan daftar blokir

Oktober 2023

Model penyempurnaan baru (pratinjau)

gpt-35-turbo-0613 sekarang tersedia untuk penyempurnaan.
babbage-002 dan davinci-002 sekarang tersedia untuk penyempurnaan. Model-model ini menggantikan model dasar warisan ada, babbage, curie, dan davinci yang sebelumnya tersedia untuk penyempurnaan.
Ketersediaan penyempurnaan terbatas pada wilayah tertentu. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.
Model yang disempurnakan memiliki batas kuota yang berbeda dari model reguler.
Tutorial: menyempurnakan GPT-3.5-Turbo

Azure OpenAI Pada data Anda

Parameter kustom baru untuk menentukan jumlah dokumen dan ketegasan yang diambil.
- Pengaturan ketat mengatur ambang batas untuk mengategorikan dokumen yang relevan dengan kueri Anda.
- Pengaturan dokumen yang diambil menentukan jumlah dokumen dengan skor teratas dari indeks data Anda yang digunakan untuk menghasilkan respons.
Anda dapat melihat status penyerapan/pengunggahan data di Azure OpenAI Studio.
Dukungan untuk titik akhir privat & VPN untuk kontainer blob.

September 2023

GPT-4

GPT-4 dan GPT-4-32k sekarang tersedia untuk semua pelanggan Azure OpenAI Service. Pelanggan tidak perlu lagi mengajukan daftar tunggu untuk menggunakan GPT-4 dan GPT-4-32k (persyaratan pendaftaran Akses Terbatas terus berlaku untuk semua model Azure OpenAI). Ketersediaan mungkin bervariasi menurut wilayah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

GPT-3.5 Instruksi Turbo

Azure OpenAI Service sekarang mendukung model GPT-3.5 Turbo Instruct. Model ini memiliki performa yang sebanding text-davinci-003 dengan dan tersedia untuk digunakan dengan API Penyelesaian. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Pratinjau publik bisikan

Azure OpenAI Service sekarang mendukung API ucapan ke teks yang didukung oleh model Whisper OpenAI. Dapatkan teks yang dihasilkan AI berdasarkan audio ucapan yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat.

Catatan

Azure AI Speech juga mendukung model Whisper OpenAI melalui API transkripsi batch. Untuk mempelajari lebih lanjut , lihat panduan Membuat transkripsi batch. Lihat Apa model Whisper? untuk mempelajari selengkapnya tentang kapan menggunakan Azure AI Speech vs. Azure OpenAI Service.

Wilayah Baru

Azure OpenAI sekarang juga tersedia di wilayah Swedia Tengah, dan Swiss Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Batas kuota regional meningkat

Meningkatkan ke batas kuota default maksimum untuk model dan wilayah tertentu. Memigrasikan beban kerja ke model dan wilayah ini akan memungkinkan Anda memanfaatkan Token per menit (TPM) yang lebih tinggi.

Agustus 2023

Azure OpenAI pada pembaruan data Anda sendiri (pratinjau)

Anda sekarang dapat menyebarkan Azure OpenAI On Your Data ke Power Virtual Agents.
Azure OpenAI On Your Data sekarang mendukung titik akhir privat.
Kemampuan untuk memfilter akses ke dokumen sensitif.
Refresh indeks Anda secara otomatis sesuai jadwal.
Opsi pencarian vektor dan pencarian semantik.
Menampilkan riwayat obrolan Anda di aplikasi web yang disebarkan

Juli 2023

Dukungan untuk panggilan fungsi

Azure OpenAI sekarang mendukung panggilan fungsi untuk memungkinkan Anda bekerja dengan fungsi di API penyelesaian obrolan.

Menyematkan peningkatan array input

Azure OpenAI sekarang mendukung array dengan hingga 16 input per permintaan API dengan text-embedding-ada-002 Versi 2.

Wilayah Baru

Azure OpenAI sekarang juga tersedia di wilayah Kanada Timur, US Timur 2, Jepang Timur, dan US Tengah Utara. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Juni 2023

Menggunakan Azure OpenAI pada data Anda sendiri (pratinjau)

Azure OpenAI On Your Data sekarang tersedia dalam pratinjau, memungkinkan Anda untuk mengobrol dengan model OpenAI seperti GPT-35-Turbo dan GPT-4 dan menerima respons berdasarkan data Anda.

Versi baru model gpt-35-turbo dan gpt-4

gpt-35-turbo (versi 0613)
gpt-35-turbo-16k (versi 0613)
gpt-4 (versi 0613)
gpt-4-32k (versi 0613)

UK Selatan

Azure OpenAI sekarang tersedia di wilayah Inggris Selatan. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

Pemfilteran konten & anotasi (Pratinjau)

Cara mengonfigurasi filter konten dengan Azure OpenAI Service.
Aktifkan anotasi untuk melihat kategori pemfilteran konten dan informasi tingkat keparahan sebagai bagian dari panggilan Penyelesaian dan Penyelesaian Obrolan berbasis GPT Anda.

Kuota

Kuota memberikan fleksibilitas untuk secara aktif mengelola alokasi batas tarif di seluruh penyebaran dalam langganan Anda.

Mei 2023

Dukungan Java & JavaScript SDK

SDK pratinjau Azure OpenAI BARU menawarkan dukungan untuk JavaScript dan Java.

Ketersediaan Umum Penyelesaian Obrolan Azure OpenAI (GA)

Dukungan ketersediaan umum untuk:
- Versi API 2023-05-15Penyelesaian Obrolan .
- Model GPT-35-Turbo.
- Seri model GPT-4.

Jika saat ini Anda menggunakan 2023-03-15-preview API, sebaiknya migrasikan ke GA 2023-05-15 API. Jika saat ini Anda menggunakan versi 2022-12-01 API, API ini tetap ga, tetapi tidak menyertakan kemampuan Penyelesaian Obrolan terbaru.

Penting

Menggunakan versi model GPT-35-Turbo saat ini dengan titik akhir penyelesaian tetap dalam pratinjau.

Prancis Tengah

Azure OpenAI sekarang tersedia di wilayah Prancis Tengah. Periksa halaman model, untuk informasi terbaru tentang ketersediaan model di setiap wilayah.

April 2023

Pratinjau publik DALL-E 2. Azure OpenAI Service sekarang mendukung API pembuatan gambar yang didukung oleh model DALL-E 2 OpenAI. Dapatkan gambar yang dihasilkan AI berdasarkan teks deskriptif yang Anda berikan. Untuk mempelajari lebih lanjut , lihat mulai cepat.
Penyebaran model yang disesuaikan yang tidak aktif sekarang akan dihapus setelah 15 hari; model akan tetap tersedia untuk penyebaran ulang. Jika model yang disesuaikan (disempurnakan) disebarkan selama lebih dari lima belas (15) hari di mana tidak ada penyelesaian atau panggilan penyelesaian obrolan yang dilakukan padanya, penyebaran akan secara otomatis dihapus (dan tidak ada biaya hosting lebih lanjut yang akan dikeluarkan untuk penyebaran tersebut). Model yang disesuaikan yang mendasar akan tetap tersedia dan dapat disebarkan ulang kapan saja. Untuk mempelajari selengkapnya, lihat artikel cara penggunaan.

Maret 2023

Model seri GPT-4 sekarang tersedia dalam pratinjau di Azure OpenAI. Untuk meminta akses, pelanggan Azure OpenAI yang ada dapat mendaftar dengan mengisi formulir ini. Model-model ini saat ini tersedia di wilayah US Timur dan US Tengah Selatan.
API Penyelesaian Obrolan Baru untuk model GPT-35-Turbo dan GPT-4 dirilis dalam pratinjau pada 3/21. Untuk mempelajari lebih lanjut, lihat artikel mulai cepat dan panduan yang diperbarui.
Pratinjau GPT-35-Turbo. Untuk mempelajari lebih lanjut , lihat artikel cara penggunaan.
Peningkatan batas pelatihan untuk penyempurnaan: Ukuran pekerjaan pelatihan maks (token dalam file pelatihan) x (# dari epoch) adalah 2 Miliar token untuk semua model. Kami juga telah meningkatkan pekerjaan pelatihan maks dari 120 menjadi 720 jam.
Menambahkan kasus penggunaan tambahan ke akses Anda yang sudah ada. Sebelumnya, proses untuk menambahkan kasus penggunaan baru mengharuskan pelanggan untuk menerapkan kembali ke layanan. Sekarang, kami merilis proses baru yang memungkinkan Anda menambahkan kasus penggunaan baru dengan cepat ke penggunaan layanan. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI. Pelanggan yang ada dapat membuktikan setiap dan semua kasus penggunaan baru di sini. Harap dicatat bahwa ini diperlukan kapan saja Anda ingin menggunakan layanan untuk kasus penggunaan baru yang awalnya tidak Anda ajukan.

Februari 2023

Fitur baru

Sampel rilis | pratinjau .NET SDK(inferensi)
Pembaruan Terraform SDK untuk mendukung operasi manajemen Azure OpenAI.
Menyisipkan teks di akhir penyelesaian sekarang didukung dengan suffix parameter .

Pembaruan

Pemfilteran konten aktif secara default.

Artikel baru tentang:

Kursus pelatihan baru:

Penganuliran ke Azure OpenAI

Januari 2023

Fitur baru

Layanan GA. Layanan Azure OpenAI sekarang tersedia secara umum.
Model baru: Penambahan model teks terbaru, text-davinci-003 (US Timur, Eropa Barat), text-ada-embeddings-002 (US Timur, US Tengah Selatan, Eropa Barat)

Desember 2022

Fitur baru

Model terbaru dari OpenAI. Azure OpenAI menyediakan akses ke semua model terbaru termasuk seri GPT-3.5.
Versi API baru (2022-12-01). Pembaruan ini mencakup beberapa penyempurnaan yang diminta termasuk informasi penggunaan token dalam respons API, pesan kesalahan yang ditingkatkan untuk file, penyelarasan dengan OpenAI pada struktur data pembuatan penyempurnaan, dan dukungan untuk parameter akhiran untuk memungkinkan penamaan kustom pekerjaan yang disempurnakan.
Batas permintaan per detik yang lebih tinggi. 50 untuk model non-Davinci. 20 untuk model Davinci.
Penyebaran penyempurnaan yang lebih cepat. Sebarkan model Ada dan Curie yang disempurnakan dalam waktu kurang dari 10 menit.
Batas pelatihan yang lebih tinggi: Token pelatihan 40M untuk Ada, Babbage, dan Curie. 10M untuk Davinci.
Proses untuk meminta modifikasi pada penyalahgunaan & pengelogan data yang tidak digunakan & tinjauan manusia. Saat ini, layanan mencatat data permintaan/respons untuk tujuan penyalahgunaan dan penyalahgunaan deteksi untuk memastikan bahwa model yang kuat ini tidak disalahgunakan. Namun, banyak pelanggan memiliki persyaratan privasi dan keamanan data yang ketat yang memerlukan kontrol yang lebih besar atas data mereka. Untuk mendukung kasus penggunaan ini, kami merilis proses baru bagi pelanggan untuk mengubah kebijakan pemfilteran konten atau menonaktifkan pengelogan penyalahgunaan untuk kasus penggunaan berisiko rendah. Proses ini mengikuti proses Akses Terbatas yang ditetapkan dalam layanan Azure AI dan pelanggan OpenAI yang ada dapat diterapkan di sini.
Enkripsi kunci yang dikelola pelanggan (CMK). CMK memberi pelanggan kontrol yang lebih besar atas pengelolaan data mereka di Azure OpenAI dengan menyediakan kunci enkripsi mereka sendiri yang digunakan untuk menyimpan data pelatihan dan model yang disesuaikan. Kunci yang dikelola pelanggan (CMK),juga dikenal sebagai Bring Your Own Key (BYOK), menawarkan fleksibilitas yang lebih luas untuk membuat, memutar, menonaktifkan, dan mencabut kontrol akses. Anda juga dapat mengaudit kunci enkripsi yang digunakan untuk melindungi data Anda. Pelajari lebih lanjut dari dokumentasi enkripsi saat tidak aktif.
Dukungan lockbox
Kepatuhan SOC-2
Pengelogan dan diagnostik melalui Pengaturan Azure Resource Health, Analisis Biaya, dan Metrik & Diagnostik.
Penyempurnaan studio. Banyak peningkatan kegunaan pada alur kerja Studio termasuk dukungan peran Azure ACTIVE Directory untuk mengontrol siapa di tim yang memiliki akses untuk membuat model dan penyebaran yang disempurnakan.

Perubahan (melanggar)

Permintaan API pembuatan penyempurnaan telah diperbarui agar sesuai dengan skema OpenAI.

Pratinjau versi API:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API versi 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

Pemfilteran konten untuk sementara nonaktif secara default. Azure con mode tenda ration bekerja secara berbeda dari Azure OpenAI. Azure OpenAI menjalankan filter konten selama panggilan pembuatan untuk mendeteksi konten berbahaya atau kasar dan memfilternya dari respons. Pelajari lebih lanjut

Model-model ini akan diaktifkan kembali pada Q1 2023 dan aktif secara default.

Tindakan pelanggan

Hubungi Dukungan Azure jika Anda ingin ini diaktifkan untuk langganan Anda.
Terapkan untuk modifikasi pemfilteran, jika Anda ingin membuatnya tetap nonaktif. (Opsi ini hanya untuk kasus penggunaan berisiko rendah.)

Langkah berikutnya

Pelajari selengkapnya tentang model yang mendasari yang mendukung Azure OpenAI.

Bagikan melalui

Apa yang baru di Azure OpenAI Service

Februari 2025

Penyebaran standar zona data o3-mini

audio mini gpt-4o dirilis

Januari 2025

o3-mini dirilis

Penyelesaian audio GPT-4o

GPT-4o Realtime API 2024-12-17

Desember 2024

Model penalaran o1 dirilis untuk akses terbatas

Ketersediaan wilayah

Penyempurnaan preferensi (pratinjau)

Penyelesaian tersimpan & distilasi

GPT-4o 2024-11-20

Jenis penyebaran yang disediakan zona data BARU

November 2024

GA Penghalusan Visi

Pemantauan penyalahgunaan AI BARU

Oktober 2024

Jenis penyebaran standar zona data BARU

Global Batch GA

Akses terbatas model o1-preview dan o1-mini

API Realtime GPT-4o baru untuk pratinjau publik ucapan dan audio

Pembaruan dukungan batch global

September 2024

Pembaruan UX Azure OpenAI Studio

Penyebaran yang disediakan GPT-4o 2024-08-06

Jenis penyebaran global baru yang disediakan

Model o1-preview dan o1-mini baru tersedia untuk akses terbatas

Kemampuan utama seri o1

Varian model

Batasan

Keamanan

Ketersediaan

Agustus 2024

Output terstruktur GPT-4o 2024-08-06

Penyebaran yang disediakan mini GPT-4o

Penyempurnaan GPT-4o (Pratinjau Umum)

Rilis API pratinjau baru

Ketersediaan regional mini GPT-4o

Panduan evaluasi

Model GPT-4o terbaru tersedia di taman bermain akses awal (pratinjau)

Penyebaran batch global sekarang tersedia

Juli 2024

GPT-4o mini sekarang tersedia untuk penyempurnaan

Alat Pencarian File Asisten sekarang ditagih

Model mini GPT-4o tersedia untuk penyebaran

Kebijakan pemfilteran konten default AI yang Bertanggung Jawab Baru

Rilis GA API baru

Perluasan wilayah yang tersedia untuk penyebaran standar global gpt-4o

Juni 2024

Pembaruan tanggal penghentian

Penagihan berbasis token untuk penyempurnaan

GPT-4o dirilis di wilayah baru

Dukungan kunci yang dikelola pelanggan (CMK) untuk Asisten

Mei 2024

Penyebaran yang disediakan GPT-4o

Asisten v2 (pratinjau)

Ketersediaan umum model GPT-4o (GA)

Jenis penyebaran standar global (pratinjau)

Menyempurnakan pembaruan

Filter konten DALL-E dan GPT-4 Turbo Vision GA yang dapat dikonfigurasi

Filter Asinkron tersedia untuk semua pelanggan Azure OpenAI

Prompt Shields

Rilis API pratinjau 05-01-2024

Ketersediaan umum model GPT-4 Turbo (GA)

Perbedaan antara OpenAI dan Azure OpenAI GPT-4 Turbo GA Model

Perbedaan dari gpt-4 vision-preview

Ketersediaan terkelola yang disediakan GPT-4 Turbo

Menyebarkan GPT-4 Turbo dengan Vision GA

April 2024

Penyempurnaan sekarang didukung di dua wilayah baru US Timur 2 dan Swiss Barat

AS Timur 2

Swiss Barat

Contoh pelatihan obrolan multi-giliran

GPT-4 (0125) tersedia untuk Azure OpenAI On Your Data

Maret 2024

Risiko & Pemantauan keamanan di Azure OpenAI Studio

Pembaruan Azure OpenAI On Your Data