Model yang tersedia dalam inferensi model Azure AI

Artikel
01/30/2025

Inferensi model Azure AI di Azure AI Foundry memberi Anda akses ke model unggulan di Azure AI untuk menggunakannya sebagai API tanpa menghostingnya di infrastruktur Anda.

Ketersediaan model bervariasi menurut penyedia model, SKU penyebaran, dan cloud. Semua model yang tersedia di Azure AI Model Inference mendukung jenis penyebaran standar Global yang menggunakan kapasitas global untuk menjamin throughput. Model Azure OpenAI juga mendukung penyebaran regional dan sovereign cloud—Azure Government, Azure Jerman, dan Azure Tiongkok 21Vianet.

Pelajari selengkapnya tentang kemampuan penyebaran tertentu untuk Azure OpenAI di ketersediaan Azure OpenAI Model.

Tip

Katalog model Azure AI menawarkan pilihan model yang lebih besar, dari berbagai penyedia yang lebih besar. Namun, model tersebut mungkin mengharuskan Anda untuk menghostingnya di infrastruktur Anda, termasuk pembuatan hub dan proyek AI. Layanan model Azure AI menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di infrastruktur Anda, dengan penagihan prabayar. Pelajari selengkapnya tentang katalog model Azure AI.

Anda dapat melihat semua model yang tersedia untuk Anda di katalog model untuk portal Azure AI Foundry.

Lab AI21

Model keluarga Jamba adalah model bahasa besar berbasis Mamba (LLM) berbasis produksi AI21 yang menggunakan arsitektur Mamba-Transformer hibrid AI21. Ini adalah versi yang disetel instruksi dari model Jamba transformator model ruang status terstruktur hibrid (SSM) AI21. Model keluarga Jamba dibangun untuk penggunaan komersial yang andal sehubungan dengan kualitas dan performa.

Model	Jenis	Tingkat	Kemampuan
AI21-Jamba-1.5-Mini	penyelesaian obrolan	Standar global	- Input: teks (262.144 token) - Output: (4.096 token) - Bahasa:`en`, , `fres`, `pt`, `de`, , `ar`dan`he` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
AI21-Jamba-1.5-Large	penyelesaian obrolan	Standar global	- Input: teks (262.144 token) - Output: (4.096 token) - Bahasa:`en`, , `fres`, `pt`, `de`, , `ar`dan`he` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur

Lihat koleksi model ini di portal Azure AI Foundry.

Azure OpenAI

Layanan Azure OpenAI menawarkan serangkaian model yang beragam dengan kemampuan dan titik harga yang berbeda. Model-model ini meliputi:

Model canggih yang dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan
Model yang dapat memahami dan menghasilkan bahasa dan kode alami
Model yang dapat mentranskripsikan dan menerjemahkan ucapan ke teks

Model	Jenis	Tingkat	Kemampuan
o3-mini	penyelesaian obrolan	Standar global	- Input: teks dan gambar (200.000 token) - Output: teks (100.000 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
o1	penyelesaian obrolan	Standar global	- Input: teks dan gambar (200.000 token) - Output: teks (100.000 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
pratinjau o1	penyelesaian obrolan	Standar global Standard	- Input: teks (128.000 token) - Output: (32.768 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
o1-mini	penyelesaian obrolan	Standar global Standard	- Input: teks (128.000 token) - Output: (65.536 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Tidak - Format respons: Teks
gpt-4o-realtime-preview	Real-time	Standar global	- Input: kontrol, teks, dan audio (131.072 token) - Output: teks dan audio (16.384 token) - Bahasa: en - Panggilan alat: Ya - Format respons: Teks, JSON
gpt-4o	penyelesaian obrolan	Standar global Standard Batch Tersedia Penyediaan global Zona Data	- Input: teks dan gambar (131.072 token) - Output: teks (16.384 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
gpt-4o-mini	penyelesaian obrolan	Standar global Standard Batch Tersedia Penyediaan global Zona Data	- Input: teks, gambar, dan audio (131.072 token) - Output: (16.384 token) - Bahasa: , , `it`, `afes`, `de`, `fr`, `id`, `ru`, `pl`, `eluk`, , , `lvarjatrzh`, , `cysw`, , `ko`, `is`, `bnur`, , `ne`, `th`, `pa`, , `mr`dan .`teen` - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur
text-embedding-3-large	penyematan	Standar global Standard Tersedia Penyediaan global	- Input: teks (8.191 token) - Output: Vektor (3.072 dim.) - Bahasa:`en`
text-embedding-3-small	penyematan	Standar global Standard Tersedia Penyediaan global	- Input: teks (8.191 token) - Output: Vektor (1.536 redup.) - Bahasa:`en`

Lihat koleksi model ini di portal Azure AI Foundry.

Cohere

Keluarga model Cohere mencakup berbagai model yang dioptimalkan untuk kasus penggunaan yang berbeda, termasuk penyelesaian obrolan dan penyematan. Model Cohere dioptimalkan untuk berbagai kasus penggunaan yang mencakup penalaran, ringkasan, dan jawaban atas pertanyaan.

Model	Jenis	Tingkat	Kemampuan
Cohere-embed-v3-english	penyematan penyematan gambar	Standar global	- Input: teks (512 token) - Output: Vektor (1.024 dim.) - Bahasa: en
Cohere-embed-v3-multilingual	penyematan penyematan gambar	Standar global	- Input: teks (512 token) - Output: Vektor (1.024 dim.) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar
Cohere-command-r-plus-08-2024	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON
Kohere-command-r-08-2024	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON
Cohere-command-r-plus	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON
Cohere-command-r	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON

Lihat koleksi model ini di portal Azure AI Foundry.

Core42

Core42 mencakup LLM dua bahasa otomatis untuk bahasa Arab & Inggris dengan kemampuan canggih dalam bahasa Arab.

Model	Jenis	Tingkat	Kemampuan
jais-30b-chat	penyelesaian obrolan	Standar global	- Input: teks (8.192 token) - Output: (4.096 token) - Bahasa: en dan ar - Panggilan alat: Ya - Format respons: Teks, JSON

Lihat koleksi model ini di portal Azure AI Foundry.

DeepSeek

Keluarga model DeepSeek termasuk DeepSeek-R1, yang unggul dalam tugas penalaran menggunakan proses pelatihan langkah demi langkah, seperti bahasa, penalaran ilmiah, dan tugas pengkodan.

Model	Jenis	Tingkat	Kemampuan
DeekSeek-R1	penyelesaian obrolan (dengan konten penalaran)	Standar global	- Input: teks (16.384 token) - Output: (163.840 token) - Bahasa:`en` dan `zh` - Panggilan alat: Tidak - Format respons: Teks.

Lihat koleksi model ini di portal Azure AI Foundry.

$meta

Model dan alat Meta Llama adalah kumpulan teks AI dan model penalaran gambar generatif yang telah dilatih dan disempurnakan. Rentang model meta diskalakan untuk menyertakan:

Model bahasa kecil (SLM) seperti Basis 1B dan 3B dan Menginstruksikan model untuk inferensi di perangkat dan tepi
Model bahasa besar ukuran menengah (LLM) seperti model Dasar 7B, 8B, dan 70B dan Instruksi
Model berperforma tinggi seperti Meta Llama 3.1-405B Instruksikan untuk pembuatan data sintetis dan kasus penggunaan penyulingan.

Model	Jenis	Tingkat	Kemampuan
Llama-3.3-70B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (128.000 token) - Output: teks (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks
Llama-3.2-11B-Vision-Instruct	penyelesaian obrolan	Standar global	- Input: teks dan gambar (128.000 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks
Llama-3.2-90B-Vision-Instruct	penyelesaian obrolan	Standar global	- Input: teks dan gambar (128.000 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks
Meta-Llama-3.1-405B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks
Meta-Llama-3-8B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (8.192 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks
Meta-Llama-3.1-70B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks
Meta-Llama-3.1-8B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks
Meta-Llama-3-70B-Instruct	penyelesaian obrolan	Standar global	- Input: teks (8.192 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

Microsoft

Phi adalah keluarga model terbuka yang ringan dan canggih. Model-model ini dilatih dengan himpunan data Phi-3. Himpunan data mencakup data sintetis dan data situs web yang difilter dan tersedia untuk umum, dengan fokus pada properti berkualitas tinggi dan padat penalaran. Model-model ini menjalani proses peningkatan yang ketat, menggabungkan penyempurnaan yang diawasi, pengoptimalan kebijakan proksimal, dan pengoptimalan preferensi langsung untuk memastikan kepatuhan instruksi yang tepat dan langkah-langkah keamanan yang kuat.

Model	Jenis	Tingkat	Kemampuan
Phi-3-mini-128k-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3-mini-4k-instruct	penyelesaian obrolan	Standar global	- Input: teks (4.096 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3-small-8k-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3-medium-128k-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3-medium-4k-instruct	penyelesaian obrolan	Standar global	- Input: teks (4.096 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3.5-vision-instruct	penyelesaian obrolan	Standar global	- Input: teks dan gambar (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3.5-MoE-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk - Panggilan alat: Tidak - Format respons: Teks
Phi-3-small-128k-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks
Phi-3.5-mini-instruct	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk - Panggilan alat: Tidak - Format respons: Teks
Phi-4	penyelesaian obrolan	Standar global	- Input: teks (16.384 token) - Output: (16.384 token) - Bahasa: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, atau, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, Anda, vi, yo, dan zh - Alat memanggil: Tidak - Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

Mistral AI

Mistral AI menawarkan dua kategori model: model premium termasuk Mistral Large dan Mistral Small dan model terbuka termasuk Mistral Nemo.

Model	Jenis	Tingkat	Kemampuan
Ministral-3B	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON
Mistral-large (tidak digunakan lagi)	penyelesaian obrolan	Standar global	- Input: teks (32.768 token) - Output: (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON
Mistral-small	penyelesaian obrolan	Standar global	- Input: teks (32.768 token) - Output: teks (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON
Mistral-Nemo	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON
Mistral-large-2407 (warisan)	penyelesaian obrolan	Standar global	- Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON
Mistral-Large-2411	penyelesaian obrolan	Standar global	- Input: teks (128.000 token) - Output: teks (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON
Codestral-2501	penyelesaian obrolan	Standar global	- Input: teks (262.144 token) - Output: teks (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks

Lihat koleksi model ini di portal Azure AI Foundry.

NTT Data

Tsuzumi adalah transformator yang dioptimalkan bahasa otomatis. Versi yang disetel menggunakan penyempurnaan yang diawasi (SFT). Tsuzumi menangani bahasa Jepang dan Inggris dengan efisiensi tinggi.

Model	Jenis	Tingkat	Kemampuan
Tsuzumi-7b	penyelesaian obrolan	Standar global	- Input: teks (8.192 token) - Output: teks (8.192 token) - Bahasa: en dan jp - Panggilan alat: Tidak - Format respons: Teks

Langkah berikutnya

Mulai hari ini dan sebarkan model tinju Anda di layanan Azure AI

Bagikan melalui

Model yang tersedia dalam inferensi model Azure AI

Lab AI21

Azure OpenAI

Cohere

Core42

DeepSeek

$meta

Microsoft

Mistral AI

NTT Data

Langkah berikutnya

Saran dan Komentar

Sumber Daya Tambahan: