Model yang tersedia dalam inferensi model Azure AI
Inferensi model Azure AI di Azure AI Foundry memberi Anda akses ke model unggulan di Azure AI untuk menggunakannya sebagai API tanpa menghostingnya di infrastruktur Anda.
Ketersediaan model bervariasi menurut penyedia model, SKU penyebaran, dan cloud. Semua model yang tersedia di Azure AI Model Inference mendukung jenis penyebaran standar Global yang menggunakan kapasitas global untuk menjamin throughput. Model Azure OpenAI juga mendukung penyebaran regional dan sovereign cloud—Azure Government, Azure Jerman, dan Azure Tiongkok 21Vianet.
Pelajari selengkapnya tentang kemampuan penyebaran tertentu untuk Azure OpenAI di ketersediaan Azure OpenAI Model.
Tip
Katalog model Azure AI menawarkan pilihan model yang lebih besar, dari berbagai penyedia yang lebih besar. Namun, model tersebut mungkin mengharuskan Anda untuk menghostingnya di infrastruktur Anda, termasuk pembuatan hub dan proyek AI. Layanan model Azure AI menyediakan cara untuk menggunakan model sebagai API tanpa menghostingnya di infrastruktur Anda, dengan penagihan prabayar. Pelajari selengkapnya tentang katalog model Azure AI.
Anda dapat melihat semua model yang tersedia untuk Anda di katalog model untuk portal Azure AI Foundry.
Lab AI21
Model keluarga Jamba adalah model bahasa besar berbasis Mamba (LLM) berbasis produksi AI21 yang menggunakan arsitektur Mamba-Transformer hibrid AI21. Ini adalah versi yang disetel instruksi dari model Jamba transformator model ruang status terstruktur hibrid (SSM) AI21. Model keluarga Jamba dibangun untuk penggunaan komersial yang andal sehubungan dengan kualitas dan performa.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
AI21-Jamba-1.5-Mini | penyelesaian obrolan | Standar global |
-
Input: teks (262.144 token) - Output: (4.096 token) - Bahasa: en , , fr es , pt , de , , ar danhe - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
AI21-Jamba-1.5-Large | penyelesaian obrolan | Standar global |
-
Input: teks (262.144 token) - Output: (4.096 token) - Bahasa: en , , fr es , pt , de , , ar danhe - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
Lihat koleksi model ini di portal Azure AI Foundry.
Azure OpenAI
Layanan Azure OpenAI menawarkan serangkaian model yang beragam dengan kemampuan dan titik harga yang berbeda. Model-model ini meliputi:
- Model canggih yang dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan
- Model yang dapat memahami dan menghasilkan bahasa dan kode alami
- Model yang dapat mentranskripsikan dan menerjemahkan ucapan ke teks
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
o3-mini | penyelesaian obrolan | Standar global |
-
Input: teks dan gambar (200.000 token) - Output: teks (100.000 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
o1 | penyelesaian obrolan | Standar global |
-
Input: teks dan gambar (200.000 token) - Output: teks (100.000 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
pratinjau o1 | penyelesaian obrolan | Standar global Standard |
-
Input: teks (128.000 token) - Output: (32.768 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
o1-mini | penyelesaian obrolan | Standar global Standard |
-
Input: teks (128.000 token) - Output: (65.536 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Tidak - Format respons: Teks |
gpt-4o-realtime-preview | Real-time | Standar global |
-
Input: kontrol, teks, dan audio (131.072 token) - Output: teks dan audio (16.384 token) - Bahasa: en - Panggilan alat: Ya - Format respons: Teks, JSON |
gpt-4o | penyelesaian obrolan | Standar global Standard Batch Tersedia Penyediaan global Zona Data |
-
Input: teks dan gambar (131.072 token) - Output: teks (16.384 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
gpt-4o-mini | penyelesaian obrolan | Standar global Standard Batch Tersedia Penyediaan global Zona Data |
-
Input: teks, gambar, dan audio (131.072 token) - Output: (16.384 token) - Bahasa: , , it , af es , de , fr , id , ru , pl , el uk , , , lv ar ja tr zh , , cy sw , , ko , is , bn ur , , ne , th , pa , , mr dan .te en - Panggilan alat: Ya - Format respons: Teks, JSON, output terstruktur |
text-embedding-3-large | penyematan | Standar global Standard Tersedia Penyediaan global |
-
Input: teks (8.191 token) - Output: Vektor (3.072 dim.) - Bahasa: en |
text-embedding-3-small | penyematan | Standar global Standard Tersedia Penyediaan global |
-
Input: teks (8.191 token) - Output: Vektor (1.536 redup.) - Bahasa: en |
Lihat koleksi model ini di portal Azure AI Foundry.
Cohere
Keluarga model Cohere mencakup berbagai model yang dioptimalkan untuk kasus penggunaan yang berbeda, termasuk penyelesaian obrolan dan penyematan. Model Cohere dioptimalkan untuk berbagai kasus penggunaan yang mencakup penalaran, ringkasan, dan jawaban atas pertanyaan.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
Cohere-embed-v3-english | penyematan penyematan gambar |
Standar global |
-
Input: teks (512 token) - Output: Vektor (1.024 dim.) - Bahasa: en |
Cohere-embed-v3-multilingual | penyematan penyematan gambar |
Standar global |
-
Input: teks (512 token) - Output: Vektor (1.024 dim.) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar |
Cohere-command-r-plus-08-2024 | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON |
Kohere-command-r-08-2024 | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON |
Cohere-command-r-plus | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON |
Cohere-command-r | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, es, it, de, pt-br, ja, ko, zh-cn, dan ar - Panggilan alat: Ya - Format respons: Teks, JSON |
Lihat koleksi model ini di portal Azure AI Foundry.
Core42
Core42 mencakup LLM dua bahasa otomatis untuk bahasa Arab & Inggris dengan kemampuan canggih dalam bahasa Arab.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
jais-30b-chat | penyelesaian obrolan | Standar global |
-
Input: teks (8.192 token) - Output: (4.096 token) - Bahasa: en dan ar - Panggilan alat: Ya - Format respons: Teks, JSON |
Lihat koleksi model ini di portal Azure AI Foundry.
DeepSeek
Keluarga model DeepSeek termasuk DeepSeek-R1, yang unggul dalam tugas penalaran menggunakan proses pelatihan langkah demi langkah, seperti bahasa, penalaran ilmiah, dan tugas pengkodan.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
DeekSeek-R1 | penyelesaian obrolan (dengan konten penalaran) |
Standar global |
-
Input: teks (16.384 token) - Output: (163.840 token) - Bahasa: en dan zh - Panggilan alat: Tidak - Format respons: Teks. |
Lihat koleksi model ini di portal Azure AI Foundry.
$meta
Model dan alat Meta Llama adalah kumpulan teks AI dan model penalaran gambar generatif yang telah dilatih dan disempurnakan. Rentang model meta diskalakan untuk menyertakan:
- Model bahasa kecil (SLM) seperti Basis 1B dan 3B dan Menginstruksikan model untuk inferensi di perangkat dan tepi
- Model bahasa besar ukuran menengah (LLM) seperti model Dasar 7B, 8B, dan 70B dan Instruksi
- Model berperforma tinggi seperti Meta Llama 3.1-405B Instruksikan untuk pembuatan data sintetis dan kasus penggunaan penyulingan.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
Llama-3.3-70B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (128.000 token) - Output: teks (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks |
Llama-3.2-11B-Vision-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks dan gambar (128.000 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks |
Llama-3.2-90B-Vision-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks dan gambar (128.000 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks |
Meta-Llama-3.1-405B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks |
Meta-Llama-3-8B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (8.192 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks |
Meta-Llama-3.1-70B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks |
Meta-Llama-3.1-8B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (8.192 token) - Bahasa: en, de, fr, it, pt, hi, es, dan th - Panggilan alat: Tidak* - Format respons: Teks |
Meta-Llama-3-70B-Instruct | penyelesaian obrolan | Standar global |
-
Input: teks (8.192 token) - Output: (8.192 token) - Bahasa: en - Panggilan alat: Tidak* - Format respons: Teks |
Lihat koleksi model ini di portal Azure AI Foundry.
Microsoft
Phi adalah keluarga model terbuka yang ringan dan canggih. Model-model ini dilatih dengan himpunan data Phi-3. Himpunan data mencakup data sintetis dan data situs web yang difilter dan tersedia untuk umum, dengan fokus pada properti berkualitas tinggi dan padat penalaran. Model-model ini menjalani proses peningkatan yang ketat, menggabungkan penyempurnaan yang diawasi, pengoptimalan kebijakan proksimal, dan pengoptimalan preferensi langsung untuk memastikan kepatuhan instruksi yang tepat dan langkah-langkah keamanan yang kuat.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
Phi-3-mini-128k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3-mini-4k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (4.096 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3-small-8k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3-medium-128k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3-medium-4k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (4.096 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3.5-vision-instruct | penyelesaian obrolan | Standar global |
-
Input: teks dan gambar (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3.5-MoE-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk - Panggilan alat: Tidak - Format respons: Teks |
Phi-3-small-128k-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Phi-3.5-mini-instruct | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr, dan uk - Panggilan alat: Tidak - Format respons: Teks |
Phi-4 | penyelesaian obrolan | Standar global |
-
Input: teks (16.384 token) - Output: (16.384 token) - Bahasa: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, atau, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, Anda, vi, yo, dan zh - Alat memanggil: Tidak - Format respons: Teks |
Lihat koleksi model ini di portal Azure AI Foundry.
Mistral AI
Mistral AI menawarkan dua kategori model: model premium termasuk Mistral Large dan Mistral Small dan model terbuka termasuk Mistral Nemo.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
Ministral-3B | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON |
Mistral-large (tidak digunakan lagi) |
penyelesaian obrolan | Standar global |
-
Input: teks (32.768 token) - Output: (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON |
Mistral-small | penyelesaian obrolan | Standar global |
-
Input: teks (32.768 token) - Output: teks (4.096 token) - Bahasa: fr, de, es, it, dan en - Panggilan alat: Ya - Format respons: Teks, JSON |
Mistral-Nemo | penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: teks (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON |
Mistral-large-2407 (warisan) |
penyelesaian obrolan | Standar global |
-
Input: teks (131.072 token) - Output: (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON |
Mistral-Large-2411 | penyelesaian obrolan | Standar global |
-
Input: teks (128.000 token) - Output: teks (4.096 token) - Bahasa: en, fr, de, es, it, zh, ja, ko, pt, nl, dan pl - Panggilan alat: Ya - Format respons: Teks, JSON |
Codestral-2501 | penyelesaian obrolan | Standar global |
-
Input: teks (262.144 token) - Output: teks (4.096 token) - Bahasa: en - Panggilan alat: Tidak - Format respons: Teks |
Lihat koleksi model ini di portal Azure AI Foundry.
NTT Data
Tsuzumi adalah transformator yang dioptimalkan bahasa otomatis. Versi yang disetel menggunakan penyempurnaan yang diawasi (SFT). Tsuzumi menangani bahasa Jepang dan Inggris dengan efisiensi tinggi.
Model | Jenis | Tingkat | Kemampuan |
---|---|---|---|
Tsuzumi-7b | penyelesaian obrolan | Standar global |
-
Input: teks (8.192 token) - Output: teks (8.192 token) - Bahasa: en dan jp - Panggilan alat: Tidak - Format respons: Teks |
Langkah berikutnya
- Mulai hari ini dan sebarkan model tinju Anda di layanan Azure AI